当前查看的主题为:珠海预售_2

没有线索了,可添加新线索或者激活已有的线索
xpath  不会写


诊断:网页上没有定位标志,表格有长有短 xpath 也不会对啊
table[@id='DataGrid1']/tbody/tr[2]也是不对啊呀   


http://www.gooseeker.com/doc/article-264-1.html
http://www.gooseeker.com/doc/article-264-1.html

麻烦你叫我写一下,看一下

举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2016-12-4 16:19

沙发
zhuohui1987 金牌会员 发表于 2016-12-4 11:59:07 | 只看该作者
教程我都看过来啊
举报 使用道具
板凳
Fuller 管理员 发表于 2016-12-4 15:37:23 | 只看该作者
最大的问题是没有设置关键内容,那么这个规则的线索就有可能什么都抓不到
举报 使用道具
地板
Fuller 管理员 发表于 2016-12-4 15:58:19 | 只看该作者
这个TD应该是要抓取下级线索的,自动生成的规则是
  1. <TD>
  2. <xsl:for-each select="following-sibling::tr[position()=12]/td/table/tbody/tr[position()>=2]">
  3. <xsl:call-template name="TD"/>
  4. </xsl:for-each>
  5. </TD>
复制代码
网页上万一不是position()=12,比如,上面那个表格变长了,就抓不到了,而且又没有设置关键内容,没有抓到也不会报错。


应该用这个表头的文字作为标志。为了方便自定义标志,把这个子表用另一个整理箱来存储





举报 使用道具
5#
Fuller 管理员 发表于 2016-12-4 16:12:01 | 只看该作者
因为你的这个样本页面下面那个项目名称表没有多条,我没法给你演示多样例采集,难道都是只有一条?
举报 使用道具
6#
Fuller 管理员 发表于 2016-12-4 16:19:12 | 只看该作者
如果只有一条数据的话,也新建一个整理箱

生成规则你会发现,自动使用了一个定位标志,这个定位标志刚好是关于内部子表的,这样也省去写自定义xpath了。你可以看一下,跟你手工写的那个xpath几乎是一样的,其实你写的xpath基本上对了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-9 08:54