主题:特卖潮女
问题:无法抓取数据出来,可是测试确实的时候是正常显示的。
提示:爬虫后,提醒了这些内容(在图片上)
望那个大咖能指导下呢,谢谢

QQ截图20170303183230.png (83.54 KB, 下载次数: 883)

QQ截图20170303183230.png
举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2017-3-9 10:45

沙发
Fuller 管理员 发表于 2017-3-3 20:02:26 | 只看该作者
这些提示不影响网页展示和抓取,我加载你的规则试试
举报 使用道具
板凳
Fuller 管理员 发表于 2017-3-3 20:04:33 | 只看该作者
只是为了滚屏,连续动作里面的目标主题名保持不变就行了
举报 使用道具
地板
Fuller 管理员 发表于 2017-3-3 20:09:45 | 只看该作者

注意上图红框,你的滚屏次数是-1,无限制的滚屏,采集到的内容越来越大,因为网页越来越长,几个小时或者几十分钟后,内存会耗完而退出。最好限定一下。

因为这是一个无底瀑布流,DS打数机运行之前要把滚屏参数关了,菜单 配置-》滚屏参数,把滚屏次数设置成0
举报 使用道具
5#
asd5590189 新手上路 发表于 2017-3-3 22:43:23 | 只看该作者
Fuller 发表于 2017-3-3 20:09
注意上图红框,你的滚屏次数是-1,无限制的滚屏,采集到的内容越来越大,因为网页越来越长,几个小时或者 ...

我改了下,还是没办法抓到数据。

QQ截图20170303223201.jpg (7.45 KB, 下载次数: 882)

QQ截图20170303223201.jpg
举报 使用道具
6#
Fuller 管理员 发表于 2017-3-3 23:19:18 | 只看该作者
asd5590189 发表于 2017-3-3 22:43
我改了下,还是没办法抓到数据。

在连续动作工作台上,你的目标主题名还是不对,“特卖潮女-11”跟当前主题名“特卖潮女”对不上,要保持一致
举报 使用道具
7#
asd5590189 新手上路 发表于 2017-3-3 23:28:46 | 只看该作者
Fuller 发表于 2017-3-3 23:19
在连续动作工作台上,你的目标主题名还是不对,“特卖潮女-11”跟当前主题名“特卖潮女”对不上,要保持 ...

可以了呢,那个文章标题能设置成带连接吗?

举报 使用道具
8#
Fuller 管理员 发表于 2017-3-4 00:16:40 | 只看该作者
asd5590189 发表于 2017-3-3 23:28
可以了呢,那个文章标题能设置成带连接吗?

再添加一个抓取内容,把a/@href属性映射给他,你的标题是用a/text()做的映射,用@href属性和用text()映射方法一样
举报 使用道具
9#
asd5590189 新手上路 发表于 2017-3-8 15:39:13 | 只看该作者
Fuller 发表于 2017-3-4 00:16
再添加一个抓取内容,把a/@href属性映射给他,你的标题是用a/text()做的映射,用@href属性和用text()映射 ...

发现新问题,在抓取过程,不能中断,无法导出数据。
举报 使用道具
10#
Fuller 管理员 发表于 2017-3-8 16:19:13 | 只看该作者
asd5590189 发表于 2017-3-8 15:39
发现新问题,在抓取过程,不能中断,无法导出数据。

还是你自己做的规则?因为这个网页是一个没有底的瀑布流,DS打数机运行之前要把滚屏功能关闭,选择菜单 配置-》滚屏参数,把滚屏次数设置成0
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 14:18