11#
henry2144 中级会员 发表于 2020-1-31 14:35:05 | 只看该作者
Fuller 发表于 2020-1-29 18:00
刚才第二级看漏了一些。你不应该定义那么多步骤。你的目的是为了点击20篇搜索结果,定义一个点击步骤就行了 ...

现在写成一个动作不能翻页了,我以前写的50个动作,经过测试是能翻页的。麻烦再帮我看看。
举报 使用道具
12#
Fuller 管理员 发表于 2020-1-31 15:52:03 | 只看该作者
henry2144 发表于 2020-1-31 14:35
现在写成一个动作不能翻页了,我以前写的50个动作,经过测试是能翻页的。麻烦再帮我看看。
...

我正在测试。

DS打数机菜单:配置-》定时器触发,勾上以后,第三级运行速度会加快,否则一直要等到超时。

集搜客浏览器菜单:配置-》隐藏日志窗口 ,不要勾上,就能看到第三级飞掠窗口上的日志窗口,能观察有没有失败

飞掠模式下,第一次运行有时候会有第一个飞掠窗口自动关闭掉,表示第一个窗口抓取失败了,那是因为第一次运行的时候,抓取规则没有及时传给飞掠窗口,以后运行就好了
举报 使用道具
13#
Fuller 管理员 发表于 2020-1-31 15:56:33 | 只看该作者
我现在已经在采集第二页的了,看来翻页挺好的。重点看看第三级采集规则是否执行成功了,有没有结果文件。另外,每一级的爬虫窗口不要最小化。如果你想看其它窗口,在下面的任务条上找到其他窗口,点击打开,不要把当前的爬虫窗口最小化了去看压在下面的窗口。一旦最小化了,那些动态内容页面就不会显示了
举报 使用道具
14#
henry2144 中级会员 发表于 2020-1-31 21:21:05 | 只看该作者
Fuller 发表于 2020-1-31 15:56
我现在已经在采集第二页的了,看来翻页挺好的。重点看看第三级采集规则是否执行成功了,有没有结果文件。另 ...

我自己又试了试,还是有问题。第一是翻页,有的时候能翻,有的时候不能翻,不知道是啥原因,和网速有关系吗?用了VPN网速是下降了。和电脑速度有关系吗?

第二是第二级规则点击了后,有的时候弹窗显示是“about:blank”有的时候是不明原因的跳过(除了精确点击没点到外,也有别的)
总觉得这些都有可能跟各处的延时设置是不是也有关系?
举报 使用道具
15#
henry2144 中级会员 发表于 2020-2-1 09:16:39 | 只看该作者
Fuller 发表于 2020-1-31 15:56
我现在已经在采集第二页的了,看来翻页挺好的。重点看看第三级采集规则是否执行成功了,有没有结果文件。另 ...

问题1:哪里有打数机各项配置的介绍?
问题2:现在在翻页线索的位置出现了个模拟点击,是什么意思?和连续动作高级里的“模拟点击”是不是一个意思?
举报 使用道具
16#
Fuller 管理员 发表于 2020-2-1 09:36:42 | 只看该作者
henry2144 发表于 2020-2-1 09:16
问题1:哪里有打数机各项配置的介绍?
问题2:现在在翻页线索的位置出现了个模拟点击,是什么意思?和连 ...

翻页的模拟点击跟连续动作的模拟点击是同样的意思。你的规则我没有修改,只是拷贝了一份出来,我测试是正常的。

很多网站会有一些安全监测,使用vpn和proxy会被监测出来,采集这个网站不要用这些
举报 使用道具
17#
henry2144 中级会员 发表于 2020-2-1 09:39:48 | 只看该作者
本帖最后由 henry2144 于 2020-2-1 09:45 编辑

我重做了一个简单的一级规则,知网-法律法规-前置条件test。下图的倒数第3行(行号是8的)鼠标虚点了一下,是点中了,没有打开页面,但是然后马上就又点击下一行了。

D:\test.png

test.png (76.74 KB, 下载次数: 641)

test.png
举报 使用道具
18#
Fuller 管理员 发表于 2020-2-1 09:41:11 | 只看该作者
henry2144 发表于 2020-1-31 21:21
我自己又试了试,还是有问题。第一是翻页,有的时候能翻,有的时候不能翻,不知道是啥原因,和网速有关系 ...

也有一个可能是你访问这个网站太多,被限制了,那么需要清理缓存和cookie。
一种方法是使用右上角的按钮,进入清除历史的窗口,把访问历史都清除了。



还有一种彻底清除的方法,看这个帖子的第一个跟帖:https://www.gooseeker.com/doc/thread-4503-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 23:50