快捷导航

资讯

用Excel合并集搜客网络爬虫采集到的多张表
用Excel合并集搜客网络爬虫采集到的多张表
怎样用Excel的VLOOKUP公式合并两张表。很多情况下我们需要的数据往往在不同页面上,用集搜客GooSeeker网络爬虫把需要的数据采集下来后,会有多个excel表格,而我们需要的是把字段合并到一个excel表格中,这个工作使 ...

2019-4-2 09:00

怎样用excel分列功能清洗电商数据的商品分类
怎样用excel分列功能清洗电商数据的商品分类
Excel的分列功能用于拆分文字内容。本文以京东电商数据商品分类的整理和清洗为例讲解Excel的分列功能。

2019-3-31 18:01

用Excel清洗和整理网络爬虫采集的数据
用Excel清洗和整理网络爬虫采集的数据
Excel具有丰富的函数/公式库,还可以用VBA进行编程,所以,Excel不仅仅用来显示列表和基本数据统计,还可以做很多复杂的数据分析和可视化展现。此前,已经在多篇文章中提到用Excel处理数据和分析数据(比如,《微博 ...

2019-3-31 11:16

怎样采集指定网页区域内的图片
怎样采集指定网页区域内的图片
集搜客9.90版本,可以很方便的把网页上某块区域的图片或者视频都抓取下来,保存在本地。我们以图片抓取为例,来讲解操作过程。视频抓取的操作是一样的。第一步,下载安装集搜客爬虫软件第二步,运行集搜客爬虫浏览器 ...

2019-3-29 16:23

运用爬虫群,快速采集数据——调度设置操作介绍
运用爬虫群,快速采集数据——调度设置操作介绍
做好规则后,可以通过以下三种方式运行规则:1.在定义规则界面,直接点击右上角“采数据”按钮。2.在DS打数机界面,用单搜/集搜启动采集。3.在会员中心调度规则,用爬虫群采集数据。前两种方式在前面的教程讲过了。 ...

2019-2-26 17:59

集搜客网络爬虫使用proxy实现自动换IP防封锁
集搜客网络爬虫使用proxy实现自动换IP防封锁
如果网络爬虫访问某个网站太频繁,很可能被目标网站封锁,虽然网站封锁有很多种,需要不同的应对方案,但是,最常用的缓解封锁的方案是换IP,关于其他封锁应对方案大家可以跟帖讨论。 ... ... ... ...

2019-2-15 10:46

用网络爬虫软件自动下载网页上的文件
用网络爬虫软件自动下载网页上的文件
集搜客网络爬虫软件V9.0.0版本之前,就是模拟人工点击。到了V9.0.0版本,不再定义模拟点击,而是把文件图标对应的url网址作为抓取内容抓取下来,同时设置一个选项“下载文件”,那么爬虫采集到url信息后就启动下载过 ...

2019-2-12 18:40

怎样用爬虫爬取亚马逊商品评论?
怎样用爬虫爬取亚马逊商品评论?
说到商品评论,大家会想到淘宝评论、京东评论,这些我们都很熟悉了,很清楚从页面上哪个位置可以浏览到,而亚马孙商品的评论入口就隐藏得比较深,很多人不知道怎么访问,下面就给大家介绍一下怎么访问到亚马逊评论以 ...

2019-1-11 17:29

新版集搜客网络爬虫图片下载功能
新版集搜客网络爬虫图片下载功能
集搜客GooSeeker网络爬虫从V8.11.1版本开始,对下载图片的存放位置重新进行了规划,原则如下:如果曾经运行过以前的版本,那么存放位置不变。新版本用户对存放位置有选择的自由:可以集中放在DataScraperWorks/PageI ...

2018-12-22 19:15

windows高清屏幕显示模糊的解决方法
windows高清屏幕显示模糊的解决方法
所谓的高清屏幕,也就是高DPI屏幕,如果软件是针对普通分辨率开发的,那么在搞DPI屏幕上显示的时候,Windows操作系统将进行自动缩放,就是因为这个自动放大,导致字体和图表等界面元素都变模糊了。下面我们针对Win10 ...

2018-12-6 19:23

修改和找回密码——微信登录集搜客GooSeeker网络爬虫的场景
修改和找回密码——微信登录集搜客GooSeeker网络爬虫的场景
越来越多的用户喜欢用微信登录集搜客官网,用微信登录的时候,会要求设置账号和密码,以便在网络爬虫客户端设置账号,也便于做数据管理。但是,如果忘记了密码怎么办? ... ...

2018-12-6 18:45

网络爬虫自动打验证码避免重复打码
网络爬虫自动打验证码避免重复打码
集搜客GooSeeker网络爬虫从V8.11.0版本对自动打码做了升级,请注意上图的参数,可以结合在一起防止重复打码:额外延时:最好设置成0的数字,当输入了验证码并点击了提交按钮以后,网页可能要过一段时间才能有响应, ...

2018-11-24 17:17

大型百货商场会员画像描绘
大型百货商场会员画像描绘
值此2018高教社杯全国大学生数学建模竞赛之际,我把2年前做的一份生鲜电商会员画像和价值分析报告分享出来,供大家参考。 这份报告研究目标是某全国性的生鲜电商,当时正是o2o盛行之时,所以数据包含了线下和线上的 ...

2018-9-13 21:11

自动导入导出数据
自动导入导出数据
做好规则后,在会员中调度规则,用爬虫群自动采集数据,采集完成后,直接在会员中心导出EXCEL格式的数据。与手动导入导出数据比较,更方便快捷

2018-7-29 11:10

批量爬取蘑菇街商品价格、评论信息
批量爬取蘑菇街商品价格、评论信息
推荐一个很简单的数据爬取应用,可以快捷采集到很多热门网站的数据,比如微博、知乎、淘宝、安居客、微信等等都可以爬取到,一键式操作,不用写代码也不用学软件操作。下面介绍用它爬取速卖通商品信息的操作步骤。一 ...

2018-6-21 10:26

GMT+8, 2019-10-16 19:32