21#
LPG123 初级会员 发表于 2018-5-15 12:03:25 | 只看该作者
采集之后怎么保留文本格式啊。都成一坨了
举报 使用道具
22#
bowieD 金牌会员 发表于 2018-5-15 14:07:45 | 只看该作者
LPG123 发表于 2018-5-15 12:03
采集之后怎么保留文本格式啊。都成一坨了

看之前的回复,通过Excel函数抠出来

1.png (17.9 KB, 下载次数: 720)

1.png
举报 使用道具
23#
LPG123 初级会员 发表于 2018-5-15 14:55:19 | 只看该作者
抠出来了,就是不能分段换行
举报 使用道具
24#
数据集 高级会员 发表于 2018-5-15 15:55:37 | 只看该作者
LPG123 发表于 2018-5-15 14:55
抠出来了,就是不能分段换行

只抓文字就会不保存格式,如果你要抓格式需要抓取HTML片段

举报 使用道具
25#
ma522214470 高级会员 发表于 2018-5-16 13:46:04 | 只看该作者
用个好用的erp软件采集sku和图片不就行了?
我有个问题,采集速卖通数据总是被怀疑机器人,输验证码,输几次之后就被锁账号,锁ip
举报 使用道具
26#
bowieD 金牌会员 发表于 2018-5-16 14:15:36 | 只看该作者
ma522214470 发表于 2018-5-16 13:46
用个好用的erp软件采集sku和图片不就行了?
我有个问题,采集速卖通数据总是被怀疑机器人,输验证码,输几 ...

操作过于频繁被封锁ip了,清理软件cookies,重启路由器更换ip
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-18 15:23