file:///C:\Users\mac\AppData\Roaming\Tencent\Users\309641660\QQ\WinTemp\RichOle\4T@31]NOSP5}FI7X841``2G.png

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报
| 回复

共 3 个关于本帖的回复 最后回复于 2018-9-13 09:12

沙发
zj2233912 初级会员 发表于 2018-9-12 22:17:36 | 只看该作者
求助大佬管理员
举报
板凳
Fuller 管理员 发表于 2018-9-13 08:53:12 | 只看该作者
这不是乱码,这是自定义字体,要进行翻译才行,可以委托给集搜客做翻译
举报
地板
Fuller 管理员 发表于 2018-9-13 09:12:04 | 只看该作者
最新的V8.8.0版本可以采集自定义字体内容,集搜客网络爬虫软件本身不做翻译,而是需要另外的软件,目前我们这个软件还没有开放出来。

集搜客网络爬虫只负责把看起来是乱码的内容显示成字库内码,同时把字库文件也下载下来。供翻译软件使用。

要现在字库文件和翻译内容,需要如下图这样操作


特殊字体只可用于“网页片段”或“纯文本”两类抓取。

抓取结果比普通抓取多两类内容


都放在FontDir中
1,字库描述文件:描述了某个抓取结果文件对应哪个字库文件
2,字库文件:存自定义字体的文件

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 为什么用微软的excel无法打开xls文件?powe
  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 0%

热门用户

GMT+8, 2025-6-18 16:01