一点资讯的列表图片无法采集。
http://www.yidianzixun.com/home?page=channel&keyword=%E5%A4%A7%E6%8F%90%E7%90%B4%E8%A7%86%E9%A2%91
请问如何设置这个图片。

举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2016-12-9 11:33

沙发
zhonglanyy 初级会员 发表于 2016-12-9 10:52:30 | 只看该作者
我的规则是:yidianzx_001
举报 使用道具
板凳
zhonglanyy 初级会员 发表于 2016-12-9 10:59:54 | 只看该作者
我看了图片是写到style里面,设置的background,这个在设置标签的时候,找不到src属性。
举报 使用道具
地板
HJLing 版主 发表于 2016-12-9 11:26:30 | 只看该作者

图片地址存在style属性节点 要用自定义xpath来取到其中的地址部分

concat(substring-before(substring-after(.//*[@class='article-img']/@style,'url='),"'"),'.jpg')



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
HJLing 版主 发表于 2016-12-9 11:32:26 | 只看该作者

还有 资讯有不同的结构 比如标题 class值是不同的 要写自定义xpath才能采全


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
6#
zhonglanyy 初级会员 发表于 2016-12-9 11:33:09 | 只看该作者
好。我试试。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-11-1 08:15