关于网页上的表格，怎么爬取

dolphin_1983

老师，您好。我想爬取的网址是：http://yewu.ghzrzyw.beijing.gov.cn/searches/searchForTuDiZhaoPaiGua?typeId=1，里面的土地成交一览表

这个表跟京东页面的那个表，不太一样，这种表格应该怎么爬取呢？

Fuller · 发表于 2020-5-13 18:06:15

这个更像一个表。那么，
1，每个列都创建一个抓取内容，分别存：交易编号，宗地名称，建设用地面积，交易方式，规划用途，交易状态，详细。
也可以不用抓取每个列。

2，用第一行作为样例，用第一行的各个列映射到整理箱中的对应抓取内容。也可以在第一行上直接双击做直观标注

3，用第一行和第二行做样例复制映射，参看：https://www.gooseeker.com/doc/article-330-1.html

这样就能把整个表采集下来了

Fuller · 发表于 2020-5-13 18:33:47

先这样做内容映射

再用第一行和第二行做样例复制映射

dolphin_1983 · 发表于 2020-5-25 08:25:14

好的，谢谢老师。我试试。

wutongjcc · 发表于 2020-7-3 16:42:14

我出现的问题是第一行全部内容映射成功，测试内容也是对的，但做了第一行和第二行映射后，内容采集出错，比如交易方式那一列采集了和交易编号一样的内容，看内容映射的编号也无误，不知道怎么解决

Fuller · 发表于 2020-7-3 17:17:58

wutongjcc 发表于 2020-7-3 16:42
我出现的问题是第一行全部内容映射成功，测试内容也是对的，但做了第一行和第二行映射后，内容采集出错， ...

你的规则名是什么？发出来我们诊断一下

关于网页上的表格，怎么爬取

本帖子中包含更多资源

共 5 个关于本帖的回复最后回复于 2020-7-3 17:17

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

关于网页上的表格，怎么爬取

本帖子中包含更多资源

共 5 个关于本帖的回复 最后回复于 2020-7-3 17:17

本帖子中包含更多资源

推荐板块

精彩推荐

热门话题

热门用户

共 5 个关于本帖的回复最后回复于 2020-7-3 17:17