|
我好像知道怎么做了。我原来想通过选择符合条件样例来抓取自己想要的,但是gooseeker的做法其实是,选择所有的样例,然后通过关键内容的设置,不抓取不符合特定条件的样例,和选择特定的样例其实达到了一样的效果。原来老是失败,是因为自己写的抓取具体内容的xpath写的是完整的xpath,所以抓取结果里所有的样例里都是第一个符合条件的样例的内容,其实应该以样例为起点写xpath,比如内容表达式//*[@class='cal_list']/li[count(.//a)>0]/a/text(),li是样例,要改成./a/text(),去掉样例li及更上级的路径,这样就不会所有样例都抓第一个符合的内容了。 |
|
共 6 个关于本帖的回复 最后回复于 2016-8-13 21:16