本帖最后由 旺德饺子 于 2017-4-9 21:08 编辑

求大神帮我看看,我从教程里一步步照搬学的,不过用在汽车之家不知道为何不行了,每次跑数据只爬了一层,而且数据不知道存储到哪了,我点选了"存储路径"到桌面上,也没有显示,先感谢大神帮忙了。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 20 个关于本帖的回复 最后回复于 2017-4-10 15:54

沙发
maomao 论坛元老 发表于 2017-4-9 21:51:30 | 只看该作者
数据不能存到桌面上,没有写权限
举报 使用道具
板凳
maomao 论坛元老 发表于 2017-4-9 21:52:37 | 只看该作者
主题名是什么?
举报 使用道具
地板
旺德饺子 初级会员 发表于 2017-4-9 22:03:20 | 只看该作者
maomao 发表于 2017-4-9 21:51
数据不能存到桌面上,没有写权限

谢谢您的回复,主题名是 绅宝x3511
举报 使用道具
5#
maomao 论坛元老 发表于 2017-4-9 22:10:37 | 只看该作者
旺德饺子 发表于 2017-4-9 22:03
谢谢您的回复,主题名是 绅宝x3511

如果是为了翻页的话,目标主题名不应该变化,根据你的截图看,目标主题名变了
举报 使用道具
6#
旺德饺子 初级会员 发表于 2017-4-10 10:19:10 | 只看该作者
maomao 发表于 2017-4-9 22:10
如果是为了翻页的话,目标主题名不应该变化,根据你的截图看,目标主题名变了
...


我做了两次,都无法翻页。从爬虫路径上说,这里面的问题到底是啥啊,求大神看看
举报 使用道具
7#
旺德饺子 初级会员 发表于 2017-4-10 11:00:51 | 只看该作者
我用相同的方法爬取天猫上的评论是没有问题的,但是到了汽车之家就会显示“匹配失效”,请问这是为啥呢?
举报 使用道具
8#
quyixuan 金牌会员 发表于 2017-4-10 11:04:31 | 只看该作者
旺德饺子 发表于 2017-4-10 11:00
我用相同的方法爬取天猫上的评论是没有问题的,但是到了汽车之家就会显示“匹配失效”,请问这是为啥呢? ...

匹配失败就是网页结构不同,规则不适用

举报 使用道具
9#
旺德饺子 初级会员 发表于 2017-4-10 11:11:09 | 只看该作者
quyixuan 发表于 2017-4-10 11:04
匹配失败就是网页结构不同,规则不适用


那么该如何处理呢?该用什么法子来爬取汽车之家的口碑页面?求帮助,感谢!!
举报 使用道具
10#
旺德饺子 初级会员 发表于 2017-4-10 11:14:21 | 只看该作者

请问这个规则是否不适用爬取汽车之家的?请大神帮忙,小弟感激不尽
——————————————
<?xml version="1.0" encoding="UTF-8"?>
<spider-clue-extraction>
<theme>汽车之家博越口碑</theme>
<scope>
<from>HTML</from>
<path-type>a</path-type>
<path>
//*[@class='page']//a[.//text()="下一页"]

</path>
<clue-type>inthread</clue-type>
<target-theme>
<name>汽车之家博越口碑</name>
<prefix-position>hostname+pathname</prefix-position>
</target-theme>
</scope>
undefined
</spider-clue-extraction>
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-22 12:18