11#
mz2358639 中级会员 发表于 2018-2-5 22:09:13 | 只看该作者
Fuller 发表于 2018-2-5 21:58
我不知道有没有独立软件可以做这个转换,可以在百度上搜一搜。我只知道在火狐浏览器中有这么一个技术,需 ...

火狐里面怎么进行?
举报 使用道具
12#
Fuller 管理员 发表于 2018-2-5 22:20:53 | 只看该作者
mz2358639 发表于 2018-2-5 22:09
火狐里面怎么进行?

用火狐打开pdf的时候,会做自动转换。你可以试试火狐的另存为html,看看能否保留住转换出来的html,如果能另存出来,就能用爬虫爬了
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-31 08:53