快捷导航

资讯

通过划定滚轮范围实现精确点击手机页面
通过划定滚轮范围实现精确点击手机页面
虽然集搜客网络爬虫的早期版本已经引入了精确点击功能(参看高级教程中的《连续动作设置》),但是,对于手机页面,布局规划并没有考虑桌面浏览器,当页面的内容需要滚动才能看到的时候,也许普通的滚屏实现不了,因 ...

2017-11-5 12:37

放大或者缩小页面便于采集手机网页内容
放大或者缩小页面便于采集手机网页内容
如果手机APP的内容是Html5页面,而且有http网址可以访问,那么就像采集普通网页一样采集手机网页。从V8.4.0开始,集搜客浏览器增加了放大和缩小快捷键 ... ...

2017-11-5 12:08

爬wish等瀑布流网站时使用清除老数据功能
爬wish等瀑布流网站时使用清除老数据功能
一、使用原因像wish网站、知乎首页,这类网页都是无限瀑布流网站,鼠标滚轮往下滚动,永远滚不到底,内容越来越多。如果让爬虫不断执行连续动作的滚屏或者滚轮动作(旗舰版才有),那么执行到一定次数以后,就会内存 ...

2017-9-29 18:30

从淘宝的买家评论中,能挖掘出什么有用的信息?
从淘宝的买家评论中,能挖掘出什么有用的信息?
电商运营过程是一个逐步优化的过程,能够“知微见著”是一个重要素质,靠自己的实际运营经验逐步积累是一个途径,还有一个更快的途径是收集和学习别人的好经验。 借助于集搜客网络爬虫和一系列搜索工具,例如,百度 ...

2017-8-28 10:35

淘宝开店运营十大攻略
淘宝开店运营十大攻略
网上开店,今天我要给大家讲一个网店有无到有,从规划到成交第一单所需要做的和所需要注意的环节,我大致分为10个步骤: 第一步、筹划篇 这个步骤非常重要,如果选择对了,那么你的店铺就成功了一半。主要包括定位和 ...

2017-8-9 15:27

深圳市咨询投诉分析
深圳市咨询投诉分析
自2008年5月1日《中华人民共和国政府信息公开条例》开始施行以来,人民群众对于政府相关工作的知情权、参与权、表达权、监督权都有了更好的保障。同时随着新媒体时代的到来,从中央到地方各区域政府也纷纷开始加强网 ...

2017-7-12 16:02

爬虫能做什么?
爬虫能做什么?
很多人问过爬虫能做什么,还有不少人对爬虫的作用有误解,关于爬虫,我们不做深入的技术探讨,而是给大家科普一下在实际应用中关于爬虫的基本知识。 一、爬虫是什么 爬虫,全称网络爬虫,又称网页蜘蛛,即web spi ...

2017-5-19 16:13

如何做好数据埋点?
如何做好数据埋点?
一、什么是数据埋点 数据埋点实际上就是pm或运营分析人员,基于统计分析需要,对用户行为的每一个事件进行埋点布置,并通过SDK上报埋点的数据结果,进行分析,并进一步优化产品或指导运营。 二、数据埋点技术 2 ...

2017-5-18 11:28

连续动作:设置自动返回上级页面
连续动作:设置自动返回上级页面
一、操作步骤 如果网页上的超链接没有独立网址,而是一段JavaScript代码,比如:onclick=”javascript:void(0)”,这种情况,想要采集超链接网页里的信息,只能用连续动作的点击动作,如果点进去超链接网页并采集到 ...

2017-1-16 10:17

连续动作:采集悬浮窗信息—以微博为例
连续动作:采集悬浮窗信息—以微博为例
一、操作步骤 如何采集鼠标悬浮后的浮窗里显示的信息?这个需要用到连续动作中的悬浮功能。下面以微博搜索为例,演示如何采集浮窗里显示的博主信息。 二、案例规则+操作步骤 第一级采集规则:教程悬浮1第二级采集规 ...

2017-1-13 14:14

数据采集、爬虫路线、连续动作三者的执行顺序
数据采集、爬虫路线、连续动作三者的执行顺序
一、基本概念 1.1 数据采集 数据采集指的是我们在“创建规则”工作台定义的抓取内容。 1.2 爬虫路线 爬虫路线指的是在“爬虫路线”工作台定义的线索,包括下级线索、翻页线索和模拟点击等。 1.3 连续动作 连续动作指 ...

2017-1-10 11:29

连续动作的界面介绍
连续动作的界面介绍
各个动作类型的界面基本上是大同小异的,下面以点击动作为例介绍一下界面上的功能按钮。主要是: 目标主题名新建、删除、排序等操作按钮定位表达式、动作名称、高级设置等与某个动作相关的设置 目标主题名 连续动作 ...

2017-1-9 15:39

如何找到合适的连续动作组合
如何找到合适的连续动作组合
设置连续动作就是为了模拟人在浏览网页时的各种操作,从而加载出想要的网页信息,最后再进行采集,所以,总体上可以分为两大操做步骤,第一步是模拟人浏览网页的操作,通过在规则里设置连续动作来实现;第二步是采集 ...

2017-1-6 10:01

连续动作:滚屏采集瀑布流网页—以头条新闻为例
连续动作:滚屏采集瀑布流网页—以头条新闻为例
常见的网页大多数在页面下方会有翻页的按钮,比如“下一页”、“加载更多”,这类网页设置翻页就可以搞定,但是瀑布流网页没有这些按钮,而是随着鼠标滚动会不停的加载更多内容,这种很长很长的没有翻页按钮的网页就 ...

2017-1-4 11:44

连续动作:自动选择下拉菜单采集数据—以知网为例
连续动作:自动选择下拉菜单采集数据—以知网为例
一、操作步骤 用中国知网的期刊为例,展示连续动作中选择动作和爬虫路线中翻页的组合。本次教程要实现的是先检索2016年发表的期刊,再对检索结果进行采集,流程如下图所示: 为了实现这个,需要建立两级规则,第一级 ...

2017-1-3 18:13

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2019-3-22 02:49