本帖最后由 hyanrong 于 2020-1-15 15:41 编辑

网址:https://www.upwork.com/search/profiles/?nbs=1&q=web%20dev
任务:抓取页面的人物头像,以及人物头像点击后获得的层级链接
结果:匹配失败,抓取不到任何信息
跪求解决方案!



11.png
举报 使用道具
| 回复

共 8 个关于本帖的回复 最后回复于 2020-1-15 17:26

Fuller 管理员 发表于 2020-1-15 16:00:21 | 显示全部楼层
你定义的规则名是什么?匹配失败应该是定义的整理箱不对,跟下载图片无关
举报 使用道具
hyanrong 中级会员 发表于 2020-1-15 16:08:52 | 显示全部楼层
Fuller 发表于 2020-1-15 16:00
你定义的规则名是什么?匹配失败应该是定义的整理箱不对,跟下载图片无关 ...

定义的规则名为upwork头像
能否帮忙看一下问题出现在了哪里啊?谢谢!

举报 使用道具
Fuller 管理员 发表于 2020-1-15 16:14:30 | 显示全部楼层
hyanrong 发表于 2020-1-15 16:08
定义的规则名为upwork头像
能否帮忙看一下问题出现在了哪里啊?谢谢!

我测试了,你的规则运行很好,没有出现匹配失败。

你的DS打数机运行的时候,有没有看到头像显示出来?
举报 使用道具
hyanrong 中级会员 发表于 2020-1-15 16:24:57 | 显示全部楼层
Fuller 发表于 2020-1-15 16:14
我测试了,你的规则运行很好,没有出现匹配失败。

你的DS打数机运行的时候,有没有看到头像显示出来?

真的耶,抓取成功啦,太感谢了!
还有一个问题求助一下,点击头像可以进行层级抓取,但是链接做不出来哦



举报 使用道具
Fuller 管理员 发表于 2020-1-15 16:54:49 | 显示全部楼层
hyanrong 发表于 2020-1-15 16:24
真的耶,抓取成功啦,太感谢了!
还有一个问题求助一下,点击头像可以进行层级抓取,但是链接做不出来哦
...

层级图20200115165111.png

1,头像和姓名那里都是超链接(html A节点),在DOM上选中@href 属性节点,鼠标右键做内容映射,比如,映射给抓取内容 网址
2,点击高级设置,勾上补全网址,因为这个超链接是相对网址,补全就完整了
3,勾上下级线索,输入下级任务名


具体参看教程:《采集网址做层级采集》
举报 使用道具
hyanrong 中级会员 发表于 2020-1-15 17:10:06 | 显示全部楼层
Fuller 发表于 2020-1-15 16:54
1,头像和姓名那里都是超链接(html A节点),在DOM上选中@href 属性节点,鼠标右键做内容映射,比如, ...

太感谢啦!
图片采集后,匹配到excel表格中,显示不了,是一个一个的隐形白框
使用公式="<table><img src=""C:\hyanrong\DataScraperWorks\"&C2&""">"
图片的地址C:\Users\hyanrong\DataScraperWorks\PageImgDir\71680870_1579076219568






QQ截图20200115170436.png
2.png
举报 使用道具
Fuller 管理员 发表于 2020-1-15 17:18:59 | 显示全部楼层
hyanrong 发表于 2020-1-15 17:10
太感谢啦!
图片采集后,匹配到excel表格中,显示不了,是一个一个的隐形白框
使用公式=""

公式那里要写 C:\Users\hyanrong\DataScraperWorks, 而不是 C:\hyanrong\DataScraperWorks
举报 使用道具
hyanrong 中级会员 发表于 2020-1-15 17:26:02 | 显示全部楼层
Fuller 发表于 2020-1-15 17:18
公式那里要写 C:%users\hyanrong\DataScraperWorks, 而不是 C:\hyanrong\DataScraperWorks

成功
太感谢GooSeeker团队了!每次都是这么及时的,完美的解决了问题!
GooSeeker功能太强大了!!!





QQ截图20200115172356.png
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 18:07