资讯

自然语言处理NLP的一般处理流程
自然语言处理NLP的一般处理流程
1.研究和应用领域 自动分词词性标注句法分析文本分类信息抽取文本生成语音识别和生成信息检索问答系统机器翻译情感分析自动摘要文字蕴含 2.研究难点 单词的边界难界定;词义的消歧;句法的模糊性;有瑕疵的或不规范 ...

2019-10-9 11:46

关于鸿蒙操作系统的知乎讨论热点分析
关于鸿蒙操作系统的知乎讨论热点分析
从华为的鸿蒙操作系统上线以来,就引发了不少热议,有赞美的,也有质疑的。为了全面地和量化地评估鸿蒙的舆论态势,我们就从知乎上采集了关于鸿蒙问题的回答,看看大家说了哪些东西,围绕鸿蒙这个概念形成了一种什么 ...

2019-9-23 10:06

采集知乎上关于华为鸿蒙的问题和回答
采集知乎上关于华为鸿蒙的问题和回答
知乎作为一个知识问答和分享的平台,每当有热点事件发生,上面都会有一些精辟言论,有助于我们快速了解事件的一些情况。我们想要研究华为鸿蒙发布以来的讨论热点,就选取从知乎上收集数据。 采集数据就用到了集搜客 ...

2019-9-16 18:40

分词和分类检索平台使用手册
分词和分类检索平台使用手册
在2019年8月,我们发布了第3版分词打标软件,增加了可以像搜索引擎那样检索和查看数据的分类检索功能模块,分词选词模块则做了一些优化,下面介绍了基本操作,希望大家能借助这个工具,发掘出数据的价值。1.新建任务 ...

2019-9-16 15:06

用爬虫采集机场出租车进场出场数据的公告
用爬虫采集机场出租车进场出场数据的公告
2019年全国大学生数学建模竞赛C题是关于机场中出租车司机决策模型的,要求用网络爬虫采集相关的数据。请大家使用GooSeeker集搜客网络爬虫的时候以学术研究为目的,适量适当合规使用 ... ... ...

2019-9-13 11:56

摘取泉港区政府工作报告中的数字遇到的问题
摘取泉港区政府工作报告中的数字遇到的问题
集搜客摘录软件的用途之一:从各级政府发布的工作报告中摘取数字,用于建立经济分析模型。集搜客数据采集团队已经摘录加工了全国所有县市的政府工作报告、预决算报告、统计公报,将其中的数字摘录下来存成结构化的ex ...

2019-7-2 10:02

调度设置参数说明
调度设置参数说明
很多用户会用爬虫群来实现自动采集入库,可能有些参数用得不对,就会造成采集效果不太好的情况。如果一开始不太清楚每个参数怎么设置的情况下,可以先不做修改直接点击确认,因为每一个参数都会有默认值,这些默认值 ...

2019-5-23 19:04

集搜客网络爬虫软件实现自动网页截屏
集搜客网络爬虫软件实现自动网页截屏
集搜客网络爬虫软件即将发布V9.0.2,请注意收看《集搜客网络爬虫软件版本升级公告》。这个版本发布了自动截屏功能,将这个网页屏幕截图存到文件中。下面讲解一下具体操作方法。1,打开截屏功能在“命名任务”工作台 ...

2019-5-15 19:30

怎样使用搜狐新闻搜索列表快捷工具抓取关键词搜索结果
怎样使用搜狐新闻搜索列表快捷工具抓取关键词搜索结果
针对常用的网站采集需求,集搜客网络爬虫用一系列快捷采集工具满足这些需求,这样,用户就不用花时间学习网络爬虫的使用方法,只需按照快捷工具的要求,输入要采集的网址并设置要采集的网页数量,把爬虫群窗口启动起 ...

2019-4-27 11:45

用于清洗文本内容的Excel函数公式
用于清洗文本内容的Excel函数公式
Excel是办公室自动化中非常重要的一款软件,Excel函数则是Excel中的内置函数,Excel之所以具备如此强大的数据分析与处理功能,公式(包括函数)起了非常重要作用。 今天我们对于一些基础的处理文字内容的函数公式进行 ...

2019-4-12 08:45

集搜客网络爬虫怎么用?
集搜客网络爬虫怎么用?
安装了集搜客爬虫软件后,怎样使用集搜客采集网页呢。目前有四种方式:1. 看初级教程,按教程做采集规则,运行规则采集数据。2. 去规则市场看看,有没有正好适合你的采集,有的话,恭喜你,不用自己做规则了,直接下 ...

2019-4-10 17:02

用Excel合并集搜客网络爬虫采集到的多张表
用Excel合并集搜客网络爬虫采集到的多张表
怎样用Excel的VLOOKUP公式合并两张表。很多情况下我们需要的数据往往在不同页面上,用集搜客GooSeeker网络爬虫把需要的数据采集下来后,会有多个excel表格,而我们需要的是把字段合并到一个excel表格中,这个工作使 ...

2019-4-2 09:00

怎样用excel分列功能清洗电商数据的商品分类
怎样用excel分列功能清洗电商数据的商品分类
Excel的分列功能用于拆分文字内容。本文以京东电商数据商品分类的整理和清洗为例讲解Excel的分列功能。

2019-3-31 18:01

用Excel清洗和整理网络爬虫采集的数据
用Excel清洗和整理网络爬虫采集的数据
Excel具有丰富的函数/公式库,还可以用VBA进行编程,所以,Excel不仅仅用来显示列表和基本数据统计,还可以做很多复杂的数据分析和可视化展现。此前,已经在多篇文章中提到用Excel处理数据和分析数据(比如,《微博 ...

2019-3-31 11:16

怎样采集指定网页区域内的图片
怎样采集指定网页区域内的图片
集搜客9.90版本,可以很方便的把网页上某块区域的图片或者视频都抓取下来,保存在本地。我们以图片抓取为例,来讲解操作过程。视频抓取的操作是一样的。第一步,下载安装集搜客爬虫软件第二步,运行集搜客爬虫浏览器 ...

2019-3-29 16:23

GMT+8, 2024-4-30 19:28