3 6167

格式化数据抓取问题

forrest62 于 2018-8-24 16:42 发表 [复制链接]
本帖最后由 forrest62 于 2018-8-24 16:49 编辑

网址:知识星球精选站 请问下,如何抓取这个网站里面的星球名字,还有阅读数,点赞数,星球价格。

这些信息是个整体,
举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2018-8-28 09:52

forrest62 新手上路 发表于 2018-8-24 16:49:57 | 显示全部楼层
为什么我输入的网址,不能直接点击呢?奇怪

网址是这个,http://www.zsxq100.com/
举报 使用道具
Fuller 管理员 发表于 2018-8-24 19:34:06 | 显示全部楼层
forrest62 发表于 2018-8-24 16:49
为什么我输入的网址,不能直接点击呢?奇怪

网址是这个,http://www.zsxq100.com/ ...

点赞20180824193304.png

要采集这些内容吗?在DOM上都分别放在一个SPAN中。在浏览器上双击做标注,就能自动生成采集规则
举报 使用道具
forrest62 新手上路 发表于 2018-8-28 09:52:20 | 显示全部楼层
Fuller 发表于 2018-8-24 19:34
要采集这些内容吗?在DOM上都分别放在一个SPAN中。在浏览器上双击做标注,就能自动生成采集规则
...

收到,谢谢啦,我试试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 22:56