11#
bowieD 金牌会员 发表于 2017-12-18 17:56:00 | 只看该作者
xinxin_0423 发表于 2017-12-18 17:50
您好,学习了有关GooSeeker的爬虫流程,想请教一下,能不能直接定义所想要抓取的关键内容然后进行各个不 ...

爬虫采集是采集网页上的数据,所以需要先确定网址,每个网站的结构都不一样,所以每个网站都需要制作规则,可以先收集关键词,到不同的搜索网站上采集这些关键词搜索的结果。
举报 使用道具
12#
xinxin_0423 初级会员 发表于 2017-12-18 17:58:14 | 只看该作者
bowieD 发表于 2017-12-18 17:56
爬虫采集是采集网页上的数据,所以需要先确定网址,每个网站的结构都不一样,所以每个网站都需要制作规则 ...

哦哦,懂了~就是每个网站的内容都是需要制定相应的规则进行提取信息~非常感谢您的回复~
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-10 09:51