这个怎么抓取链接呢?正常是点击我圈红色的这行就能进入到工作详情描述,我想抓取这个链接,点击没有教程视频里说的“DOM A节点”,只有个A节点,但是是公司详情介绍
求助求助

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2024-9-20 08:04

gz51837844 管理员 发表于 2024-9-19 14:39:21 | 显示全部楼层
现在前程无忧搜索结果页面不显示每个招聘的详情网址。
要获得招聘详情网址,可以分2步走:
1. 获取公司网址
2. 在公司页面获取该公司的岗位详情网址

如果使用快捷采集,可以按如下顺序:
1. 使用快捷采集"前程无忧_岗位关键词搜索列表",获取搜索结果信息,包括公司网址
2. 使用快捷采集"前程无忧_公司岗位列表",获取公司的岗位详情网址
3. 使用快捷采集"前程无忧_岗位详情信息",获取岗位详情

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
小火锅 初级会员 发表于 2024-9-19 21:10:12 | 显示全部楼层
gz51837844 发表于 2024-9-19 14:39
现在前程无忧搜索结果页面不显示每个招聘的详情网址。
要获得招聘详情网址,可以分2步走:
1. 获取公司网址 ...

我用了关键词,为什么老是采集失败呢, 我用的关键词是bim,复制的链接是:https://we.51job.com/pc/search?keyword=bim 可以帮我看下吗

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
小火锅 初级会员 发表于 2024-9-19 21:41:27 | 显示全部楼层
gz51837844 发表于 2024-9-19 14:39
现在前程无忧搜索结果页面不显示每个招聘的详情网址。
要获得招聘详情网址,可以分2步走:
1. 获取公司网址 ...

显示这样的错误

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
gz51837844 管理员 发表于 2024-9-19 22:34:24 | 显示全部楼层
小火锅 发表于 2024-9-19 21:10
我用了关键词,为什么老是采集失败呢, 我用的关键词是bim,复制的链接是:https://we.51job.com/pc/sear ...

我添加你发的这个链接,选择采集5页。
这个快捷采集任务正常执行和结束,可以看到5页一共采集了100条数据。
你可以把数据管家升级到最新版本,采集之前在数据管家登录前程无忧。采集的时候观察下采集窗口有没有自动加载出来前程无忧的搜索页面:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
小火锅 初级会员 发表于 2024-9-19 23:09:29 | 显示全部楼层
gz51837844 发表于 2024-9-19 22:34
我添加你发的这个链接,选择采集5页。
这个快捷采集任务正常执行和结束,可以看到5页一共采集了100条数据 ...

感谢你的回复,我试下
举报 使用道具
小火锅 初级会员 发表于 2024-9-20 01:47:27 | 显示全部楼层
gz51837844 发表于 2024-9-19 22:34
我添加你发的这个链接,选择采集5页。
这个快捷采集任务正常执行和结束,可以看到5页一共采集了100条数据 ...

你好,我按照教程快捷采集 以bim为关键词,第一轮采集了820个公司详情页链接,我把这些链接复制到”公司岗位列表“ 爬取了6千多个岗位详情页链接,有很多不相关的工作,这怎么处理呢?自己删除不相关的工作然后再进行爬取吗?因为我的最终目的是获取有关 bim 的职位信息,分析对bim的工作要求。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
gz51837844 管理员 发表于 2024-9-20 08:04:15 | 显示全部楼层
小火锅 发表于 2024-9-20 01:47
你好,我按照教程快捷采集 以bim为关键词,第一轮采集了820个公司详情页链接,我把这些链接复制到”公司 ...

在excel里把关键词不是bim的删除掉
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-10-7 13:00