|
本帖最后由 ym 于 2020-3-2 11:50 编辑
用新版的集搜客采摘浏览器采集京东拍卖的操作步骤如下:
1、下载新版的集搜客采摘浏览器,然后跟旧版集搜客软件登录同一个账号,另外,目前新版采摘浏览器还不能直接定义采集规则,需要跟旧版软件配合使用,所以还不能卸载旧版软件。
2、打开新版的集搜客采摘浏览器,在地址栏访问京东拍卖的网址,然后点左上角的“新建任务”按钮,这时会自动打开旧版软件,等几秒后可以看到访问了京东拍卖的网页快照,页面上的内容和样式与直接访问原网页基本是一样的。
3、然后就可以直接在旧版软件上对京东拍卖定义采集规则,选中要采集的信息做标注,然后“测试”核对数据,规则没问题了就点“保存”按钮即可。
4、做好采集规则后,不能直接用旧版软件采集数据,因为它没法正常加载京东拍卖的页面信息,而是要用新版集搜客采摘浏览器来做采集,点击新版左上角的“任务管理”按钮,就会打开任务管理页面。
5、选中刚创建的任务名称右侧的…按钮,点击“启动采集”,并且输入要采集的网址数量后,就会打开采集页签,跟旧版软件的单搜集搜是一样的作用,同一个任务可以点开多个采集页签做并发采集。
6、在采集页签里,可以看到页面正常加载上来了,点击右下角的状态图标就能看到具体的采集情况。
7、采集完成后,采集结果文件是存在跟旧版软件一样的文件目录里,在新版软件左侧的“设置”按钮里可以查看和修改存储路劲,而“配置”里是跟旧版软件一样的爬虫控制参数,有需要的可以修改。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
共 4 个关于本帖的回复 最后回复于 2020-10-10 17:25