隐藏列表(就是要点击才会打开的带有链接的数据)的数据怎么抓取呀
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2015-10-8 23:26

沙发
gooseeker_info 金牌会员 发表于 2015-10-7 22:27:51 | 只看该作者
模拟点击应该可以,发给样本页面出来看看
举报 使用道具
板凳
luolam 初级会员 发表于 2015-10-8 16:50:31 | 只看该作者
http://www.okooo.com/livecenter/jingcai/?date=2015-10-06这是样本页面的链接,[img]C:\Users\luolam\Desktop\9S%5B7QK%5D3LA[ZBWFTUUU$A6H.png[/img],我想以日期对应的链接作为下级线索,然后继续抓取下级内容。手工构造可以可以抓取到日期,但是不能作为下级线索。麻烦你帮忙看下,谢谢啦
举报 使用道具
地板
Fuller 管理员 发表于 2015-10-8 23:26:50 | 只看该作者
luolam 发表于 2015-10-8 16:50
http://www.okooo.com/livecenter/jingcai/?date=2015-10-06这是样本页面的链接,,我想以日期对应的链接作 ...

不用管这是第几级线索,只管选一个页面作为样本页面,做好抓取规则,然后在DS打数机中选中这个主题,右键菜单有“添加”线索功能,把构造的网址一条条录入进去。

http://www.okooo.com/livecenter/jingcai/?date=2015-10-05
http://www.okooo.com/livecenter/jingcai/?date=2015-10-04
http://www.okooo.com/livecenter/jingcai/?date=2015-10-03

这个规律太明显了,这样构造下去就行了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-6-7 06:47