资讯

NLP文本情感分析入门
NLP文本情感分析入门
自然语言处理NLP的一个应用就是情感分析Sentiment Analysis,它在社交内容的分析以及电商评论反馈分析中,都占有很高的分析价值,下面给大家整理了情感分析的入门框架。 1.分析目的 对文本的观点、喜好、情感倾向进 ...

2019-10-15 10:48

机器学习算法入门介绍
机器学习算法入门介绍
之前研究自然语言处理的知识脉络,发现随着数据爆炸和大数据挖掘处理的发展,现在不少自然语言处理项目面对的都是TB级的数据量,机器学习和深度学习就常被用到自然语言处理中,所以,要入门自然语言处理,就少不得要 ...

2019-10-14 10:22

中文分词入门和分词工具汇总攻略
中文分词入门和分词工具汇总攻略
最近在整理自然语言处理的相关知识图谱,关于中文分词这块,我们梳理了一些入门的知识点,并且整理汇总了分词工具、词云图工具,觉得有用的可以收藏一下。1.分词难点 1.1.有多种分词标准,不同的分词标准会对下游结 ...

2019-10-12 16:40

自然语言处理NLP的一般处理流程
自然语言处理NLP的一般处理流程
1.研究和应用领域 自动分词词性标注句法分析文本分类信息抽取文本生成语音识别和生成信息检索问答系统机器翻译情感分析自动摘要文字蕴含 2.研究难点 单词的边界难界定;词义的消歧;句法的模糊性;有瑕疵的或不规范 ...

2019-10-9 11:46

关于鸿蒙操作系统的知乎讨论热点分析
关于鸿蒙操作系统的知乎讨论热点分析
从华为的鸿蒙操作系统上线以来,就引发了不少热议,有赞美的,也有质疑的。为了全面地和量化地评估鸿蒙的舆论态势,我们就从知乎上采集了关于鸿蒙问题的回答,看看大家说了哪些东西,围绕鸿蒙这个概念形成了一种什么 ...

2019-9-23 10:06

采集知乎上关于华为鸿蒙的问题和回答
采集知乎上关于华为鸿蒙的问题和回答
知乎作为一个知识问答和分享的平台,每当有热点事件发生,上面都会有一些精辟言论,有助于我们快速了解事件的一些情况。我们想要研究华为鸿蒙发布以来的讨论热点,就选取从知乎上收集数据。 采集数据就用到了集搜客 ...

2019-9-16 18:40

分词和分类检索平台使用手册
分词和分类检索平台使用手册
在2019年8月,我们发布了第3版分词打标软件,增加了可以像搜索引擎那样检索和查看数据的分类检索功能模块,分词选词模块则做了一些优化,下面介绍了基本操作,希望大家能借助这个工具,发掘出数据的价值。1.新建任务 ...

2019-9-16 15:06

用爬虫采集机场出租车进场出场数据的公告
用爬虫采集机场出租车进场出场数据的公告
2019年全国大学生数学建模竞赛C题是关于机场中出租车司机决策模型的,要求用网络爬虫采集相关的数据。请大家使用GooSeeker集搜客网络爬虫的时候以学术研究为目的,适量适当合规使用 ... ... ...

2019-9-13 11:56

摘取泉港区政府工作报告中的数字遇到的问题
摘取泉港区政府工作报告中的数字遇到的问题
集搜客摘录软件的用途之一:从各级政府发布的工作报告中摘取数字,用于建立经济分析模型。集搜客数据采集团队已经摘录加工了全国所有县市的政府工作报告、预决算报告、统计公报,将其中的数字摘录下来存成结构化的ex ...

2019-7-2 10:02

调度设置参数说明
调度设置参数说明
很多用户会用爬虫群来实现自动采集入库,可能有些参数用得不对,就会造成采集效果不太好的情况。如果一开始不太清楚每个参数怎么设置的情况下,可以先不做修改直接点击确认,因为每一个参数都会有默认值,这些默认值 ...

2019-5-23 19:04

集搜客网络爬虫软件实现自动网页截屏
集搜客网络爬虫软件实现自动网页截屏
集搜客网络爬虫软件即将发布V9.0.2,请注意收看《集搜客网络爬虫软件版本升级公告》。这个版本发布了自动截屏功能,将这个网页屏幕截图存到文件中。下面讲解一下具体操作方法。1,打开截屏功能在“命名任务”工作台 ...

2019-5-15 19:30

怎样使用搜狐新闻搜索列表快捷工具抓取关键词搜索结果
怎样使用搜狐新闻搜索列表快捷工具抓取关键词搜索结果
针对常用的网站采集需求,集搜客网络爬虫用一系列快捷采集工具满足这些需求,这样,用户就不用花时间学习网络爬虫的使用方法,只需按照快捷工具的要求,输入要采集的网址并设置要采集的网页数量,把爬虫群窗口启动起 ...

2019-4-27 11:45

用于清洗文本内容的Excel函数公式
用于清洗文本内容的Excel函数公式
Excel是办公室自动化中非常重要的一款软件,Excel函数则是Excel中的内置函数,Excel之所以具备如此强大的数据分析与处理功能,公式(包括函数)起了非常重要作用。 今天我们对于一些基础的处理文字内容的函数公式进行 ...

2019-4-12 08:45

集搜客网络爬虫怎么用?
集搜客网络爬虫怎么用?
安装了集搜客爬虫软件后,怎样使用集搜客采集网页呢。目前有四种方式:1. 看初级教程,按教程做采集规则,运行规则采集数据。2. 去规则市场看看,有没有正好适合你的采集,有的话,恭喜你,不用自己做规则了,直接下 ...

2019-4-10 17:02

用Excel合并集搜客网络爬虫采集到的多张表
用Excel合并集搜客网络爬虫采集到的多张表
怎样用Excel的VLOOKUP公式合并两张表。很多情况下我们需要的数据往往在不同页面上,用集搜客GooSeeker网络爬虫把需要的数据采集下来后,会有多个excel表格,而我们需要的是把字段合并到一个excel表格中,这个工作使 ...

2019-4-2 09:00

GMT+8, 2024-7-27 17:20