主题名:流量商品榜_第五步_商品详情_采集Top流量来源和引流关键词


举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2017-5-25 20:47

沙发
数据集 高级会员 发表于 2017-5-17 14:07:06 | 只看该作者
你这个规则是抓取"生意参谋"页面的, 要账号密码登录才行
举报 使用道具
板凳
ym 版主 发表于 2017-5-17 14:16:34 | 只看该作者
一个整理箱是对应一张Excel表的,你要把多个整理箱的数据整合到一张Excel表里的话,可以根据关联字段用vlookup函数进行拼接,参考教程《如何在excel中合并多层级采集结果》
举报 使用道具
地板
xboffice 初级会员 发表于 2017-5-17 14:35:08 | 只看该作者
在XML下内容都对得上,转换excel时就出问题了



举报 使用道具
5#
xboffice 初级会员 发表于 2017-5-17 14:36:44 | 只看该作者
ym 发表于 2017-5-17 14:16
一个整理箱是对应一张Excel表的,你要把多个整理箱的数据整合到一张Excel表里的话,可以根据关联字段用vloo ...

不是,不需要合并到一个表里,我就是想单独一个整理箱就合并这个整理箱里面内容,就生成对应的excel文件,但是这个表生成了,内容对不上号


举报 使用道具
6#
wangyong 版主 发表于 2017-5-17 14:38:36 | 只看该作者
xboffice 发表于 2017-5-17 14:36
不是,不需要合并到一个表里,我就是想单独一个整理箱就合并这个整理箱里面内容,就生成对应的excel文件 ...

对不上号具体是什么对不上号,截图看看,是第一个样例和第二个样例混淆了?

举报 使用道具
7#
xboffice 初级会员 发表于 2017-5-17 15:17:08 | 只看该作者
wangyong 发表于 2017-5-17 14:38
对不上号具体是什么对不上号,截图看看,是第一个样例和第二个样例混淆了?

...

单独一个XML文件转换正常,打包数个XML文件转换有问题,问题如下:
另一个整理箱的文件跑到了另一个整理箱文件去~

018AC2D0-9241-4CE8-9D31-E6050CD3F5C7.png (289.37 KB, 下载次数: 514)

018AC2D0-9241-4CE8-9D31-E6050CD3F5C7.png
举报 使用道具
8#
shenzhenwan10 金牌会员 发表于 2017-5-17 15:38:41 | 只看该作者
我们再进一步分析一下, 可能要明天才能给出反馈
举报 使用道具
9#
xboffice 初级会员 发表于 2017-5-17 22:52:01 | 只看该作者
整理箱不超过6个,xml合并不超过10个文件,转换excel没有问题。
整理箱有8个,xml合并2个文件,转换excel也有问题。
我试了一晚的结果
举报 使用道具
10#
shenzhenwan10 金牌会员 发表于 2017-5-18 10:15:20 | 只看该作者
对于超过5个整理箱的情况, 一般较少使用, 也没有实际大数据量测试过, 可能会有隐藏的bug
按你测试的结果, 建议你最大建5个整理箱, 如果有更多需求, 可以在连续动作里指向下一个主题
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-3 18:12