每个节点都看了,没找到链接节点,请问这该怎么解决

举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2017-7-26 11:15

沙发
Fuller 管理员 发表于 2017-4-12 11:38:30 | 只看该作者
根据你这个截图来看,点击一个企业名称会有一个东西弹出来,要么让你扫码,要么让你登录。所以,你先登录好,再分析这个页面看看,说不定就有网址了
举报 使用道具
板凳
hg946902208 初级会员 发表于 2017-4-12 15:14:06 | 只看该作者
Fuller 发表于 2017-4-12 11:38
根据你这个截图来看,点击一个企业名称会有一个东西弹出来,要么让你扫码,要么让你登录。所以,你先登录好 ...

嗯,谢谢,链接的节点登录后显示了;
不过样例复制映射后为什么只能获取5个信息,全页一共有20个企业信息,
然后 自动翻页翻3页就会变成完成任务,请问这两个问题怎么解决

举报 使用道具
地板
Fuller 管理员 发表于 2017-4-12 16:29:45 | 只看该作者
hg946902208 发表于 2017-4-12 15:14
嗯,谢谢,链接的节点登录后显示了;
不过样例复制映射后为什么只能获取5个信息,全页一共有20个企业信息 ...

我测试了一下,如果企查查没有登录,确实只看到5个企业,所以,运行DS打数机之前,要在GS浏览器中登录企查查。

上面假定你用的是GS网络爬虫独立软件,如果你用的是火狐插件版,那么就应该在火狐中先登录企查查
举报 使用道具
5#
hg946902208 初级会员 发表于 2017-4-12 17:26:29 | 只看该作者
Fuller 发表于 2017-4-12 16:29
我测试了一下,如果企查查没有登录,确实只看到5个企业,所以,运行DS打数机之前,要在GS浏览器中登录企 ...


您好,是登录状态。

<?xml version="1.0" encoding="UTF-8"?>

<列表>
    <item>
        <公司>厦门博偲管理咨询有限公司</公司>
        <链接>/firm_c59bdb501a1eaa547a8613f44706430c.shtml</链接>
        <法人>
企业法人:黎成</法人>
        <电话>
联系方式:18606097377</电话>
    </item>
    <item>
        <公司>斯纳安企业管理咨询(上海)有限公司</公司>
        <链接>/firm_f775a845aeca6ea2231d14ed0d2820f1.shtml</链接>
        <法人>
企业法人:LUIGI BENDI</法人>
        <电话>
联系方式:021-52985060</电话>
    </item>
    <item>
        <公司>河南格恩企业管理咨询有限公司</公司>
        <链接>/firm_a236140d2c2df06181a27d7a6ff10105.shtml</链接>
        <法人>
企业法人:张小莉</法人>
        <电话>
联系方式:13673973256</电话>
    </item>
    <item>
        <公司>善信念(深圳)管理咨询有限公司</公司>
        <链接>/firm_e489b2526b27a7b9c9954c02fe2c2eda.shtml</链接>
        <法人>
企业法人:徐向欣</法人>
        <电话>
联系方式:18576672991</电话>
    </item>
    <item>
        <公司>北京嘉德广益管理咨询有限公司</公司>
        <链接>/firm_5a187c83dc2804c1bb582673a88c4991.shtml</链接>
        <法人>
企业法人:陈兆华</法人>
        <电话>
联系方式:18201089702</电话>
    </item>
</列表>

举报 使用道具
6#
hg946902208 初级会员 发表于 2017-4-12 17:29:39 | 只看该作者
Fuller 发表于 2017-4-12 16:29
我测试了一下,如果企查查没有登录,确实只看到5个企业,所以,运行DS打数机之前,要在GS浏览器中登录企 ...


我翻页是这么设置的,但翻3页就会直接完成任务

举报 使用道具
7#
Fuller 管理员 发表于 2017-4-12 18:39:13 | 只看该作者
hg946902208 发表于 2017-4-12 17:26
您好,是登录状态。


你做样例复制映射的时候,没有选第一个和第二个样例,而是跳着抓的,所以没有抓全
举报 使用道具
8#
Fuller 管理员 发表于 2017-4-12 18:44:56 | 只看该作者
hg946902208 发表于 2017-4-12 17:29
我翻页是这么设置的,但翻3页就会直接完成任务



要像上图那样,用整个翻页区做线索定位映射,否则,生成的规则就会这样
  1. //*[@class='pagination pagination-md']/li[position()=6]/a[.//text()=">"]
复制代码
里面含有position()=6这样的函数,到第三页,就不是6了,所以就失效了。如果像我说的那样做定位映射,那么生成的规则是
  1. //*[@class='pagination pagination-md']//a[.//text()=">"]
复制代码






举报 使用道具
9#
hg946902208 初级会员 发表于 2017-4-13 09:08:02 | 只看该作者
Fuller 发表于 2017-4-12 18:44
要像上图那样,用整个翻页区做线索定位映射,否则,生成的规则就会这样
里面含有position()=6这样的函 ...

感谢,明白了,已经做出来了
举报 使用道具
10#
maplesor 新手上路 发表于 2017-7-26 11:15:02 | 只看该作者
我也是想抓企查查的工商信息,登录后照着教程来设置,还是没成功,好忧伤,现在在重复试验中~
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 03:28