集搜客生成的采集规则,如何才能够在Python中运行?
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2016-9-8 12:04

沙发
ym 版主 发表于 2016-9-8 12:02:18 | 只看该作者
可以,参考python集成方法http://www.gooseeker.com/doc/thread-1824-1-1.html
举报 使用道具
板凳
噬鳴玥 新手上路 发表于 2016-9-8 12:02:36 | 只看该作者
ym 发表于 2016-9-8 12:02
可以,参考python集成方法http://www.gooseeker.com/doc/thread-1824-1-1.html

嗯嗯,那集搜客生成的规则是  不是xpath语句啊?
举报 使用道具
地板
ym 版主 发表于 2016-9-8 12:02:51 | 只看该作者
是的
举报 使用道具
5#
噬鳴玥 新手上路 发表于 2016-9-8 12:03:25 | 只看该作者
我把集搜客生成的规则放到 Python中直接运行,出问题了。应该怎么导入规则变成Python可识别的语言呢  
举报 使用道具
6#
ym 版主 发表于 2016-9-8 12:04:50 | 只看该作者
看刚才发的链接,建议你直接使用api,而不是把规则文件拷贝出来,用api的话,你可以做一个通用爬虫
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 爬网址做层级采集——以当当商品爬虫为例
  • 网络爬虫采集列表数据
  • UMAP的min_dist参数有什么作用?
  • UMAP的n_neighbors参数有什么作用?
  • HDBSCAN的min_samples和min_cluster_size参

热门用户

GMT+8, 2026-6-24 20:04