本人新手,使用爬虫软件时遇到一个问题,在网页中同一个div标签下有两个p标签
使用简单的定位编号映射制作了采集盒子,但是在采集出来的时候发觉数据有个问题,即本来需要抓取的数据分别位于两个p标签之下,但是爬虫始终采集到的是第一个p标签的内容,始终采集不到同一个div标签下另一个p标签中的内容,求大神知道应该如何明确告诉爬虫分别采集两个p标签下制定内容,谢谢。
网页结构
----DIV
--------P(1)
------------text1
------------text2
--------P(2)
------------text1
------------text2
虽然工作台显示定位编号为1986,但实际爬出来的内容是1975的
曾想用xpath定位,但是如果修改了,则抓取的内容是对的,但是仅仅只是抓取第一条记录的,无法因为样例复制而自动变更
求助
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 9 个关于本帖的回复 最后回复于 2017-12-22 15:20