我新发布了一个采集规则:
中国食品农产品认证证书


详细信息:
中国食品农产品认证信息系统网站最大特点是用了很多iframe,嵌套在一起展示证书信息。无论iframe有多少层,集搜客GooSeeker网络爬虫都一视同仁,就像没有iframe一样定义抓取规则。有个详细攻略讲解抓取规则定义过程:http://www.gooseeker.com/doc/article-189-1.html

希望大家喜欢!下载地址:
http://www.gooseeker.com/res/detail_102384.html
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2019-2-22 17:42

沙发
search58 新手上路 发表于 2019-2-22 13:04:56 | 只看该作者
这个规则能用吗?
举报 使用道具
板凳
Fuller 管理员 发表于 2019-2-22 13:33:38 | 只看该作者
search58 发表于 2019-2-22 13:04
这个规则能用吗?

这个规则不能用了,我安排人检查一下通知你
举报 使用道具
地板
Fuller 管理员 发表于 2019-2-22 17:42:32 | 只看该作者
这个规则不能用了,因为现在这个系统需要登录才能看。

我发现能够免费下载的只有认证机构信息了,规则在这里:https://www.gooseeker.com/secure ... ew/share421185.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-6-7 06:21