有没有办法采集搜狗微信搜索关键词后,采集每条文章的详细内容?采用先采集文章列表,发现采集下来的地址不能用

举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-2-27 16:16

lan_1985 金牌会员 发表于 2020-2-27 16:16:31 | 显示全部楼层
1、采集下来的网址,不稳定,因为有时会出现验证码的页面,输入验证码后,才能到文章详细内容页面。
2、有些网址直接打开,是正常的,但是网址的有效是长2小时,2小时以后就自动失效了。
3、想要采集文章详情,可以手动打开这些详情网址,手动复制下来,在放到文章详情的规则中采集。
4、搜索公众号出来的文章,现在网页上不在有文章列表了,只有搜索出公众号那个网页上,每个公众号下面有一篇文章,也是用手动复制网址I的方法来采集。
具体的采集方法,可以参考这篇帖子:
https://www.gooseeker.com/doc/thread-5661-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 22:43