规则名字是测试571和测试572.
可以帮忙看下规则么,谢谢
举报 使用道具
| 回复

共 11 个关于本帖的回复 最后回复于 2020-5-9 10:03

沙发
pingguo1234 新手上路 发表于 2020-5-8 10:34:45 | 只看该作者
有人么
举报 使用道具
板凳
Fuller 管理员 发表于 2020-5-8 11:15:27 | 只看该作者

第一级,连续动作的xpath都用绝对定位,我这里测试定位不上

/html/body/div[position()=5]/div/div[position()=2]/div[position()=2]/div[position()=2]/div[position()=1]/div/div[position()=3]/input
/html/body/div[position()=4]/div/div[position()=2]/div[position()=2]/div[position()=2]/div[position()=1]/div/div[position()=3]/input


上面的是我测试得到的,下面的是你填的。应该用偏好class或者id,比如,输入主题的xpath应该是
(//input[@id='ddd'])[1]
举报 使用道具
地板
Fuller 管理员 发表于 2020-5-8 11:25:19 | 只看该作者
第一级的问题汇总:

1,不要用绝对定位,所以,这些动作的定位表达式应该是:
输入主题搜索词:(//input[@id='ddd'])[1]
输入作者:(//input[@id='ddd'])[2]
选择年份://*[@id='advanced_search_publshdate_start']
点击搜索://*[@id='set_advanced_search_btn']

2,选择年份不要用点击,因为这个网页上的年份是select,需要用“选择”,而且,定位表达式要定位到select元素
3,不需要点击选项的动作,对于select,没法单独点击选项,而是直接设定选项起点。如果只想选一个,就把跨度设置很大

举报 使用道具
5#
pingguo1234 新手上路 发表于 2020-5-8 15:13:45 | 只看该作者
Fuller 发表于 2020-5-8 11:25
第一级的问题汇总:

1,不要用绝对定位,所以,这些动作的定位表达式应该是:

谢谢,按照您说的已经修改好了。可以现在第二个抓取规则的时候一直在抓第一个搜索结果的数据,如果购买旗舰版的话,您可以帮我修改一下这个规则么?
举报 使用道具
6#
Fuller 管理员 发表于 2020-5-8 15:20:37 | 只看该作者
pingguo1234 发表于 2020-5-8 15:13
谢谢,按照您说的已经修改好了。可以现在第二个抓取规则的时候一直在抓第一个搜索结果的数据,如果购买旗 ...

我刚刚测试了第二个规则,看到结果没有问题,你已经改过了?
举报 使用道具
7#
pingguo1234 新手上路 发表于 2020-5-8 15:28:18 | 只看该作者
Fuller 发表于 2020-5-8 15:20
我刚刚测试了第二个规则,看到结果没有问题,你已经改过了?

修改过了,但是采集到的结果有问题,关键词确实还了,但是因为标签页没有关闭,采集到的内容还是“张磊”的哪个采集内容;这个怎么解决呢?
举报 使用道具
8#
Fuller 管理员 发表于 2020-5-8 15:44:56 | 只看该作者
pingguo1234 发表于 2020-5-8 15:28
修改过了,但是采集到的结果有问题,关键词确实还了,但是因为标签页没有关闭,采集到的内容还是“张磊” ...



你是说输入的关键词没有效果吗?这两个输入框,都勾上输入联想,我这里测试看到的搜索结果都是跟输入条件有关的
举报 使用道具
9#
pingguo1234 新手上路 发表于 2020-5-8 16:12:34 | 只看该作者
Fuller 发表于 2020-5-8 15:44
你是说输入的关键词没有效果吗?这两个输入框,都勾上输入联想,我这里测试看到的搜索结果都是跟输入条 ...

已经勾选上了,可是上面搜索结果已经变了,但是抓取下来的数据还是第一个关键词的结果
举报 使用道具
10#
Fuller 管理员 发表于 2020-5-8 19:09:25 | 只看该作者
pingguo1234 发表于 2020-5-8 16:12
已经勾选上了,可是上面搜索结果已经变了,但是抓取下来的数据还是第一个关键词的结果
...

我看到你的规则中只有一个关键词,你还设置了很多关键词吗?如果要在会员中心输入关键词,需要旗舰版权限。免费版只能把关键词放在规则中,最多5个关键词
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 22:44