快捷导航
3 117

偽img裡的文字該如何擷取

rexwang 于 2019-11-23 23:42 发表 [复制链接]
591租房網

https://rent.591.com.tw/rent-detail-8388650.html
我想要爬這藍色圈起來0910-277-157的數字,有高手能幫忙嗎?

591臨時擷取.jpg





举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2019-11-27 15:20

Fuller 管理员 发表于 2019-11-24 09:15:12 | 显示全部楼层
这个数字是一张图片,用集搜客网络爬虫把图片下载下来,然后要用图片识别软件进行识别
举报 使用道具
rexwang 初级会员 发表于 2019-11-27 14:53:02 | 显示全部楼层
非常感謝您的回覆,若要大量採集,仍有解決方案嗎?
有推薦的軟體,以及具體的做法步驟嗎?
举报 使用道具
Fuller 管理员 发表于 2019-11-27 15:20:37 | 显示全部楼层
rexwang 发表于 2019-11-27 14:53
非常感謝您的回覆,若要大量採集,仍有解決方案嗎?
有推薦的軟體,以及具體的做法步驟嗎?
...

因为这些图片里面的内容及其简单,可以自己写个小程序调用ocr开软软件或者在线的AI api进行识别,比如,百度API就有图片识别功能。

如果采集任务委托给我们,我们可以开发这样的识别程序
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 网络爬虫采集html片段时无法生成结果文件怎
  • 网络爬虫占满了c盘怎么清理
  • 为什么采集速卖通用户评论翻页不了
  • 多级规则执行连续动作而输入动作不在第一级
  • 特征工程入门介绍

热门用户

GMT+8, 2019-12-8 12:49