想要抓取一些附件的网址,最初只做了内容定位,只抓到了三个附件的网址。因为这个节点,并没有id和class,所以不能做定位标志映射。去研究了下xpath,但还是一脸懵啊。不过尝试加了一条自定义xpath,这次抓到了58个附件的网址,还是没抓全。
我贴几个不同的相对路径(偏好class),请大神指教下。
1.//*[@class='showbox']/div[position()=4]/p[position()=2]/a/@href
2.//*[@class='showbox']/div[position()=4]/div[position()=9]/a/@href
3.//*[@class='p0']/span[position()=1]/a/@href
4.//*[@class='p0']/span[position()=2]/font/a/@href
|
|
|
|
|
共 6 个关于本帖的回复 最后回复于 2016-11-18 16:21