一点资讯的列表图片无法采集。
http://www.yidianzixun.com/home?page=channel&keyword=%E5%A4%A7%E6%8F%90%E7%90%B4%E8%A7%86%E9%A2%91
请问如何设置这个图片。

举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2016-12-9 11:33

沙发
zhonglanyy 初级会员 发表于 2016-12-9 10:52:30 | 只看该作者
我的规则是:yidianzx_001
举报 使用道具
板凳
zhonglanyy 初级会员 发表于 2016-12-9 10:59:54 | 只看该作者
我看了图片是写到style里面,设置的background,这个在设置标签的时候,找不到src属性。
举报 使用道具
地板
HJLing 版主 发表于 2016-12-9 11:26:30 | 只看该作者

图片地址存在style属性节点 要用自定义xpath来取到其中的地址部分

concat(substring-before(substring-after(.//*[@class='article-img']/@style,'url='),"'"),'.jpg')



举报 使用道具
5#
HJLing 版主 发表于 2016-12-9 11:32:26 | 只看该作者

还有 资讯有不同的结构 比如标题 class值是不同的 要写自定义xpath才能采全


举报 使用道具
6#
zhonglanyy 初级会员 发表于 2016-12-9 11:33:09 | 只看该作者
好。我试试。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 19:54