网站结构相差不多,有个类似的规则,怎么让他复用起来?
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2017-12-7 09:16

沙发
yangwenge 金牌会员 发表于 2017-12-7 09:16:46 | 只看该作者
本帖最后由 yangwenge 于 2017-12-7 09:18 编辑

1,如果这些网址基本上类似,比如,他们的网站名和目录都一样,就是网页的名字不一样,一般来说,他们的网页结构是基本相同的。这种情况,就可以想办法让采集规则适应这些网页。
2,如果它们的目录不一样,甚至连网站都不一样,即使看起来网页差不多。也不应该用同一个规则。

但是可以参照一个规则,制定另一个规则。方法是:
1,先把原来的规则加载到谋数台上,
2,在地址输入栏输入新的网址,回车
3,等网页加载完后,选择菜单-规则-刷新页面结构,再选择菜单 分析页面
4,这时应该会提示有些抓取内容定位不上,那需要为他们做内容映射
5,所有抓取内容映射完以后,修改主题名,点击存规则。就会为新网页做好了规则。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-10 05:18