资讯

怎样更有效率地搜索互联网和整理知识—使用集搜客采摘浏览器 ... ... ... ...
怎样更有效率地搜索互联网和整理知识—使用集搜客采摘浏览器 ... ... ... ...
本文展示了集搜客GooSeeker采摘浏览器在查资料、学知识方面的用处,用到的主要功能:高亮标注加书签回溯1,应用案例描述案例:举个例子,如果在编程中遇到一个异常,比如,class not found,然后想去互联网上找找别 ...

2020-3-11 10:26

阿里巴巴外包询价网站用集搜客网络爬虫能采集吗?
阿里巴巴外包询价网站用集搜客网络爬虫能采集吗?
有用户问了下面这个问题:Alibaba sourcing这个网站,在集搜客网络爬虫V9.0.5上显示不出来,以前做的规则就无法加载分析了,用DS打数机也无法爬数据,我曾经尝试修改UserAgent,改成Firefox 45也不行,我还清除过缓 ...

2020-2-29 15:32

在限定论域的时候,为什么“任何一个”表示成蕴含式∀x(S(x) -> C(x)) ... ...
在限定论域的时候,为什么“任何一个”表示成蕴含式∀x(S(x) -> C(x)) ... ...
最近在研读离散数学,关于限定域( Restricted Domain)的谓词表示方式,查到知乎上有一个问答在讨论这个问题,我觉得有必要再解答一下,因为我也思考了很久才得出的理解,所以形成了这篇回答:《离散数学中,为什么在 ...

2020-2-10 17:44

数理逻辑是讲什么的?
数理逻辑是讲什么的?
数理逻辑在人工智能、编程语言、计算理论等领域具有重要的地位,再次不想给数理逻辑下个准确的定义,而是把学习《离散数学》过程中掌握的要点罗列一下。左孝凌撰写的《离散数学》第一篇讲的就是数理逻辑,第一篇的导 ...

2020-2-7 13:12

内容分析法中的抽样
内容分析法中的抽样
学习内容分析法就会遇到“抽样”,那么怎么抽样?我估计每本书和每个指导材料都会有不同的说法,当然这里面一定含有大家所公认的好的实践指导。网络上一篇文章先把内容分析分成两类,而每一类又有不同的抽样方法:量 ...

2020-1-3 09:51

豆瓣电影的情感分析
豆瓣电影的情感分析
文本分析和文本挖掘方法和技术往往看起来复杂难懂,可以试试集搜客GooSeeke的工具,力求把使用门槛降到最低。在一个情感分析场景中,集搜客提供两个工具配合完成分析任务: 1,用集搜客爬虫做数据采集:解决数据来源 ...

2019-12-20 16:27

一本在线图书——社交网络分析介绍
一本在线图书——社交网络分析介绍
介绍一本在线阅读的图书《社交网络分析介绍》:This on-line textbook introduces many of the basics of formal approaches to the analysis of social networks. The text relies heavily on the work of Freeman, ...

2019-12-16 07:52

网络爬虫采集html片段时无法生成结果文件怎么办?
网络爬虫采集html片段时无法生成结果文件怎么办?
集搜客GooSeeker网络爬虫除了能把网页上的内容转换成结构化的表格以外,还能将整个html文档或者html中某个标签下的片段采集下来,放在XML格式的结果文件中。定义这样的规则相当简单。但是,在V9.0.5版本之前,有一个 ...

2019-12-5 17:51

网络爬虫占满了c盘怎么清理
网络爬虫占满了c盘怎么清理
用gooseeker网络爬虫软件采集数据,运行时间长了,硬盘会占用很多,数据量最大的主要是两类数据:下载到缓存区中的网页;将网页内容提取出来的XML结果文件。如果占用的空间是在c盘上,就对操作系统影响很大,所以, ...

2019-11-14 09:22

为什么采集速卖通用户评论翻页不了
为什么采集速卖通用户评论翻页不了
最近出现的速卖通用户评论翻页不了的问题就要求网络爬虫软件进行升级。为了解决这个问题,集搜客GooSeeker网络爬虫升级到了9.0.4版本。除了解决这个问题,界面上也做了优化:用模拟点击翻页 ... ... ... ...

2019-11-7 18:14

多级规则执行连续动作而输入动作不在第一级应该怎样设置? ...
多级规则执行连续动作而输入动作不在第一级应该怎样设置? ...
GooSeeker集搜客网络爬虫的连续动作类型中有一种连续输入动作,参看教程《自动搜索关键词采集信息》,可以像人一样自动输入搜索关键词采集搜索结果。对于旗舰版用户,还具有“连发弹仓”权限 ...

2019-11-4 18:51

特征工程入门介绍
特征工程入门介绍
特征工程是机器学习,甚至是深度学习中最为重要的一部分,数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数 ...

2019-10-18 09:43

NLP文本情感分析入门
NLP文本情感分析入门
自然语言处理NLP的一个应用就是情感分析Sentiment Analysis,它在社交内容的分析以及电商评论反馈分析中,都占有很高的分析价值,下面给大家整理了情感分析的入门框架。 1.分析目的 对文本的观点、喜好、情感倾向进 ...

2019-10-15 10:48

机器学习算法入门介绍
机器学习算法入门介绍
之前研究自然语言处理的知识脉络,发现随着数据爆炸和大数据挖掘处理的发展,现在不少自然语言处理项目面对的都是TB级的数据量,机器学习和深度学习就常被用到自然语言处理中,所以,要入门自然语言处理,就少不得要 ...

2019-10-14 10:22

中文分词入门和分词工具汇总攻略
中文分词入门和分词工具汇总攻略
最近在整理自然语言处理的相关知识图谱,关于中文分词这块,我们梳理了一些入门的知识点,并且整理汇总了分词工具、词云图工具,觉得有用的可以收藏一下。1.分词难点 1.1.有多种分词标准,不同的分词标准会对下游结 ...

2019-10-12 16:40

GMT+8, 2024-5-1 00:07