11#
bowieD 金牌会员 发表于 2017-12-18 17:56:00 | 只看该作者
xinxin_0423 发表于 2017-12-18 17:50
您好,学习了有关GooSeeker的爬虫流程,想请教一下,能不能直接定义所想要抓取的关键内容然后进行各个不 ...

爬虫采集是采集网页上的数据,所以需要先确定网址,每个网站的结构都不一样,所以每个网站都需要制作规则,可以先收集关键词,到不同的搜索网站上采集这些关键词搜索的结果。
举报 使用道具
12#
xinxin_0423 初级会员 发表于 2017-12-18 17:58:14 | 只看该作者
bowieD 发表于 2017-12-18 17:56
爬虫采集是采集网页上的数据,所以需要先确定网址,每个网站的结构都不一样,所以每个网站都需要制作规则 ...

哦哦,懂了~就是每个网站的内容都是需要制定相应的规则进行提取信息~非常感谢您的回复~
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 06:18