网络爬虫软件产品技术动态和资讯 - 集搜客GooSeeker网络爬虫

在Gephi生成社会网络图之前，对马蜂窝游记文本进行自动分词、手工选词；使用“加词调效果”功能对未能正确自动分词进行优化处理；启动共词矩阵匹配和情感分析；使用“同义词合并”功能对一词多表达方式进行优化 ...

2024-3-12 11:28

在Jupyter Notebook中使用python做的网络图，想美化和调整样式比较麻烦和困难，我们今天基于修改后的共词矩阵表在Gephi中画出网络图进行更直观的观察

2024-2-7 11:04

本Notebook使用Gooseeker文本分词和情感分析软件导出的分词效果、选词匹配和选词矩阵excel表格，在python下对共现词的距离进行计算并对选词匹配和选词矩阵excel表格数据进行修改 ... ...

2024-2-6 10:53

在Notebook中使用Gooseeker文本分词和情感分析软件导出的分词效果和共词矩阵excel表格；使用python编程语言对共现词的距离进行计算，使用引入了距离因素的共词矩阵表画图 ... ...

2024-2-1 11:16

2个月前我们分享了一篇论文范例《多词共现分析方法在暴雨-地质灾害应急任务研究中的应用》，该范例作者利用关联规则挖掘——Apriori算法提取案例文本中的频繁项集作为共现词集。围绕着apriori算法和关联关系分析，我 ...

2024-1-26 11:59

本Notebook使用Gooseeker文本分词和情感分析软件导出的分词效果和共词矩阵excel表格，在python下对共现词的距离进行计算并对共词矩阵excel表格进行修改，修改后的表格会以一个新的名称保存在data/processed目录下。 ...

2024-1-22 16:43

在数字反哺理论的观照下，通过参与式观察、深度访谈和叙事分析等研究方法，考察中部地区B村老年群体的短视频实践问题。研究发现：接入、技术和文化是农村老年人短视频实践的三重反哺类型 ...

2024-1-12 10:58

通过构造周抽样方法，对国内五家报纸的2204个样本进行内容分析，旨在探索1980—2020年这四十年来中国机构媒体报道的时间性变化

2024-1-10 10:52

利用集搜客GooSeeker网络爬虫软件，抓取对老年艾滋病患者的微博评论文本，对微博文本评论进行情感倾向分析。进一步面向社会人>**(不当用词)放调查问卷，分析不同文化程度人群对老年艾滋病患者的看法和态度 ... ... ...

2024-1-9 09:26

选取新浪微博平台，搜索关键词为“病毒变异”，通过网络爬虫软件爬取微博博文样本数据。结合博文数量的时序特征和生命周期理论进行周期划分，利用LDA模型、BERT-BiLSTM-Attention模型构建研究框架，探究不同周期的舆 ...

2024-1-8 09:57

我们使用同样的知乎二舅话题的excel，导入到Gooseeker文本分词和情感分析软件，自动分词后，进行人工选词（而不使用sklearn的自动特征选择算法），然后导出“选词匹配表”excel，对其用sklearn进行聚类分析 ... ...

2023-12-5 12:01

在多个在线社区平台上构建了真实的数据集，并探究了6种深度学习方法、7种机器学习方法和本文提出的方法能否用于识别社交媒体中来自于生成式人工智能模型的AIGC ... ...

2023-11-30 10:47

采用解读式内容分析法，以综艺节目《向往的生活第四季》在微博上的实时评论博文为研究样本，对有效评论信息进行数据抓取，分析和归纳所选文本的特征，概括提炼支撑主题的基本观点。 ...

2023-11-29 09:36

本研究采用非概率抽样方法,共收集了 435份问卷调查。受访者根据1至5的李克特量表评估了他们的客户满意度体验以及推荐Shopee和Lazada的意愿。配对样本T检验结果显示,Shopee与Lazada在移动应用程序界面设计、产品、促 ...

2023-11-28 09:35

通过关联规则挖掘对暴雨-地质灾害事故案例中的应急任务进行提取，并进行共现词集网络可视化分析，结果表明该方法能够有效的将应急任务提取出来，为快速制定救援行动方案提供依据 ...

2023-11-27 09:41

资讯