快捷导航

资讯

如何完整抓取搜狐新闻文章?
如何完整抓取搜狐新闻文章?
一、操作步骤 今天教大家抓取搜狐的新闻文章,重点讲解怎么抓取到完整的正文内容,怎么批量抓取新闻,方法是通用的,可以应用到其他新闻网站的抓取,总体操作步骤下: 二、案例+操作步骤 采集规则:搜狐新闻正文采集 ...

2018-4-18 19:01

用PPT自带的Pro Word Cloud制作中文词云
用PPT自带的Pro Word Cloud制作中文词云
上篇文章《用PPT制作词云》中使用的分词文本是英文,如果针对中文,参照上篇的方法使用PPT中的Pro Word Cloud是不能形成一个正确的词云图的。因为该插件的原理是“识别空格之间的词语,进而对其词语进行词频统计,根 ...

2018-4-12 15:50

如何使用数据DIY采集房源信息
如何使用数据DIY采集房源信息
今天我来给大家分享一个不用技术,不需要编程开发,可以直接使用的一个快捷采集的软件,只用添加需要采集的网页链接就可以将网页上的数据采集到本地,放到EXCEL表格当中给我们做数据分析。链家作为一个全国二手房市 ...

2018-3-21 16:31

采集淘宝评论找出爆款关键词
采集淘宝评论找出爆款关键词
在《淘宝开店运营十大攻略》一文,攻略第一条筹划篇就提到要看评论,看帖子。这个步骤非常重要,如果选择对了,那么你的店铺就成功了一半。主要包括定位和货源。定位非常重要。看你擅长经营哪方面或者喜欢经营哪方面 ...

2018-3-20 20:48

电商开店必备的图片抓取和下载工具
电商开店必备的图片抓取和下载工具
遇到合适的商品图片,你还在一张张图片手工另存到本地吗?想从这个烦琐的工作里解脱出来吗?给大家推荐集搜客吧,它提供的图片抓取工具和爬虫规则,可以同时抓取图片和文字,不用另外安装下图软件,而且操作非常简单 ...

2018-3-20 09:42

抓取招聘网站的用处可以远远超越简历下载
抓取招聘网站的用处可以远远超越简历下载
招聘网站的信息十分丰富,其价值不仅仅局限于简历下载和收集,网站上既有企业的信息,也有人才的信息,还能观察一个城市的行业分布。所以,抓取招聘网站是相当有价值的 ... ...

2018-3-19 17:01

如何抓取小红书瀑布流网页上的商品信息
如何抓取小红书瀑布流网页上的商品信息
小红书是一个网络社区,也是一个跨境电商,还是一个共享平台,更是一个口碑库。最近有好多小伙伴都在讨论这个网站的商品信息抓取,讨论比较多的是瀑布流式网页怎么抓取下面的内容。在这里不想讨论技术方法,直接介绍 ...

2018-3-18 12:16

用PPT自带的Pro Word Cloud制作英文词云
用PPT自带的Pro Word Cloud制作英文词云
今天分享“1分钟用PPT制作词云”,首先普及下词云的作用,词云的可视化主要能够让我们对文本的词频有一个直观的感受,词云文本的大小和词频成正比,常用于文本分析。 ... ...

2018-3-16 18:13

百度推广后台数据DIY
百度推广后台数据DIY
百度推广相信有很多人在使用,但是百度推广后台中的搜索词报告不能下载下来,这样我们没办法做到更加详细的分析,这里我们就可以使用GooSeeker的数据DIY将整个报告都抓取下来,存放在Excel中,这样我们就可以更加直 ...

2017-11-16 15:21

采集表单中的input动态内容
采集表单中的input动态内容
表单中的INPUT,也是一个普通的html节点,但是要想采集INPUT中的动态填入的内容可不容易,如果采用xpath,例如 //input/@value,这只能采集到静态内容,也就是制作html的时候,静态放在value属性中的内容。有些网站 ...

2017-11-5 13:07

采用刷新动作实现手机页面采集
采用刷新动作实现手机页面采集
使用集搜客网络爬虫的连续动作(参看高级教程中的《连续动作设置》),可以循环执行多个步骤后采集内容,采集手机网页内容的时候,可以模拟人的选择等操作动作。但是手机网页往往不会弹出多个屏,而是在同一个浏览器 ...

2017-11-5 12:52

通过划定滚轮范围实现精确点击手机页面
通过划定滚轮范围实现精确点击手机页面
虽然集搜客网络爬虫的早期版本已经引入了精确点击功能(参看高级教程中的《连续动作设置》),但是,对于手机页面,布局规划并没有考虑桌面浏览器,当页面的内容需要滚动才能看到的时候,也许普通的滚屏实现不了,因 ...

2017-11-5 12:37

放大或者缩小页面便于采集手机网页内容
放大或者缩小页面便于采集手机网页内容
如果手机APP的内容是Html5页面,而且有http网址可以访问,那么就像采集普通网页一样采集手机网页。从V8.4.0开始,集搜客浏览器增加了放大和缩小快捷键 ... ...

2017-11-5 12:08

爬wish等瀑布流网站时使用清除老数据功能
爬wish等瀑布流网站时使用清除老数据功能
一、使用原因像wish网站、知乎首页,这类网页都是无限瀑布流网站,鼠标滚轮往下滚动,永远滚不到底,内容越来越多。如果让爬虫不断执行连续动作的滚屏或者滚轮动作(旗舰版才有),那么执行到一定次数以后,就会内存 ...

2017-9-29 18:30

从淘宝的买家评论中,能挖掘出什么有用的信息?
从淘宝的买家评论中,能挖掘出什么有用的信息?
电商运营过程是一个逐步优化的过程,能够“知微见著”是一个重要素质,靠自己的实际运营经验逐步积累是一个途径,还有一个更快的途径是收集和学习别人的好经验。 借助于集搜客网络爬虫和一系列搜索工具,例如,百度 ...

2017-8-28 10:35

GMT+8, 2019-8-20 01:18