快捷导航

资讯

怎样使用GooSeeker数据管家启动采集任务?
怎样使用GooSeeker数据管家启动采集任务?
1,界面布局集搜客 数据管家软件 是一个数据采集和管理的综合入口,功能直达按钮位于左栏,分别是:1, 定义爬虫规则2, 任务管理3, 数据管理4, 分词和文本分析5, 网页和pdf摘录左边栏再往右就是工作台面板,工作 ...

2020-6-15 18:13

GooSeeker数据管家软件使用指导
GooSeeker数据管家软件使用指导
集搜客的 数据管家 软件是科研机构、高校师生、商业运营人员的辅助工具,减轻获取数据和处理数据的负担。集搜客 数据管家 是一个综合入口,数据采集和内容分析等工具通过这个入口直达: 1. 微博采集和其他快捷采集工 ...

2020-6-15 10:49

如何使用集搜客分词平台做社会网络图分析?
如何使用集搜客分词平台做社会网络图分析?
社会网络关系图在文本挖掘分析中,可以探索发现两两词语之间的关系、哪些词语处于核心地位,下面我们利用集搜客的文本分词和分类检索平台的“社会网络”菜单,就能得到网络图和矩阵表。 1、新建任务并导入符合格式要 ...

2020-4-13 19:23

关于食品安全的美国联邦法规文件的网络爬虫采集规则
关于食品安全的美国联邦法规文件的网络爬虫采集规则
1,采集目标 要从美国联邦法规网站上采集每一个章节信息以及下载part小节的pdf、xml附件。网站本身是一个目录树结构的javascript动态网站,目录的第一层是年份,点开第二层是title,第三层包含有subtitle、chapter、 ...

2020-3-14 11:02

怎样更有效率地搜索互联网和整理知识—使用集搜客采摘浏览器 ... ... ... ...
怎样更有效率地搜索互联网和整理知识—使用集搜客采摘浏览器 ... ... ... ...
本文展示了集搜客GooSeeker采摘浏览器在查资料、学知识方面的用处,用到的主要功能:高亮标注加书签回溯1,应用案例描述案例:举个例子,如果在编程中遇到一个异常,比如,class not found,然后想去互联网上找找别 ...

2020-3-11 10:26

阿里巴巴外包询价网站用集搜客网络爬虫能采集吗?
阿里巴巴外包询价网站用集搜客网络爬虫能采集吗?
有用户问了下面这个问题:Alibaba sourcing这个网站,在集搜客网络爬虫V9.0.5上显示不出来,以前做的规则就无法加载分析了,用DS打数机也无法爬数据,我曾经尝试修改UserAgent,改成Firefox 45也不行,我还清除过缓 ...

2020-2-29 15:32

在限定论域的时候,为什么“任何一个”表示成蕴含式∀x(S(x) -> C(x)) ... ...
在限定论域的时候,为什么“任何一个”表示成蕴含式∀x(S(x) -> C(x)) ... ...
最近在研读离散数学,关于限定域( Restricted Domain)的谓词表示方式,查到知乎上有一个问答在讨论这个问题,我觉得有必要再解答一下,因为我也思考了很久才得出的理解,所以形成了这篇回答:《离散数学中,为什么在 ...

2020-2-10 17:44

数理逻辑是讲什么的?
数理逻辑是讲什么的?
数理逻辑在人工智能、编程语言、计算理论等领域具有重要的地位,再次不想给数理逻辑下个准确的定义,而是把学习《离散数学》过程中掌握的要点罗列一下。左孝凌撰写的《离散数学》第一篇讲的就是数理逻辑,第一篇的导 ...

2020-2-7 13:12

内容分析法中的抽样
内容分析法中的抽样
学习内容分析法就会遇到“抽样”,那么怎么抽样?我估计每本书和每个指导材料都会有不同的说法,当然这里面一定含有大家所公认的好的实践指导。网络上一篇文章先把内容分析分成两类,而每一类又有不同的抽样方法:量 ...

2020-1-3 09:51

豆瓣电影的情感分析
豆瓣电影的情感分析
文本分析和文本挖掘方法和技术往往看起来复杂难懂,可以试试集搜客GooSeeke的工具,力求把使用门槛降到最低。在一个情感分析场景中,集搜客提供两个工具配合完成分析任务: 1,用集搜客爬虫做数据采集:解决数据来源 ...

2019-12-20 16:27

一本在线图书——社交网络分析介绍
一本在线图书——社交网络分析介绍
介绍一本在线阅读的图书《社交网络分析介绍》:This on-line textbook introduces many of the basics of formal approaches to the analysis of social networks. The text relies heavily on the work of Freeman, ...

2019-12-16 07:52

网络爬虫采集html片段时无法生成结果文件怎么办?
网络爬虫采集html片段时无法生成结果文件怎么办?
集搜客GooSeeker网络爬虫除了能把网页上的内容转换成结构化的表格以外,还能将整个html文档或者html中某个标签下的片段采集下来,放在XML格式的结果文件中。定义这样的规则相当简单。但是,在V9.0.5版本之前,有一个 ...

2019-12-5 17:51

网络爬虫占满了c盘怎么清理
网络爬虫占满了c盘怎么清理
用gooseeker网络爬虫软件采集数据,运行时间长了,硬盘会占用很多,数据量最大的主要是两类数据:下载到缓存区中的网页;将网页内容提取出来的XML结果文件。如果占用的空间是在c盘上,就对操作系统影响很大,所以, ...

2019-11-14 09:22

为什么采集速卖通用户评论翻页不了
为什么采集速卖通用户评论翻页不了
最近出现的速卖通用户评论翻页不了的问题就要求网络爬虫软件进行升级。为了解决这个问题,集搜客GooSeeker网络爬虫升级到了9.0.4版本。除了解决这个问题,界面上也做了优化:用模拟点击翻页 ... ... ... ...

2019-11-7 18:14

多级规则执行连续动作而输入动作不在第一级应该怎样设置? ...
多级规则执行连续动作而输入动作不在第一级应该怎样设置? ...
GooSeeker集搜客网络爬虫的连续动作类型中有一种连续输入动作,参看教程《自动搜索关键词采集信息》,可以像人一样自动输入搜索关键词采集搜索结果。对于旗舰版用户,还具有“连发弹仓”权限 ...

2019-11-4 18:51

GMT+8, 2020-7-6 20:59