3 8203

偽img裡的文字該如何擷取

rexwang 于 2019-11-23 23:42 发表 [复制链接]
591租房網

https://rent.591.com.tw/rent-detail-8388650.html
我想要爬這藍色圈起來0910-277-157的數字,有高手能幫忙嗎?

591臨時擷取.jpg





举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2019-11-27 15:20

Fuller 管理员 发表于 2019-11-24 09:15:12 | 显示全部楼层
这个数字是一张图片,用集搜客网络爬虫把图片下载下来,然后要用图片识别软件进行识别
举报 使用道具
rexwang 高级会员 发表于 2019-11-27 14:53:02 | 显示全部楼层
非常感謝您的回覆,若要大量採集,仍有解決方案嗎?
有推薦的軟體,以及具體的做法步驟嗎?
举报 使用道具
Fuller 管理员 发表于 2019-11-27 15:20:37 | 显示全部楼层
rexwang 发表于 2019-11-27 14:53
非常感謝您的回覆,若要大量採集,仍有解決方案嗎?
有推薦的軟體,以及具體的做法步驟嗎?
...

因为这些图片里面的内容及其简单,可以自己写个小程序调用ocr开软软件或者在线的AI api进行识别,比如,百度API就有图片识别功能。

如果采集任务委托给我们,我们可以开发这样的识别程序
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-28 16:40