大神们好!!
在B站视频评论抓取的时候,采用自定义Xpath的方式采集不到任何数据,特来请教各路大神。

URL:https://www.bilibili.com/video/BV1X8411w7mJ/?spm_id_from=333.337.search-card.all.click&vd_source=1a4e7ba00564a5bab67ce1a0078e9444

待抓取内容:评论作者、评论内容

操作方式:
1.  创建表头


2. 自定义定位抓取区域的Xpath:

<gs_root>div#commentapp > bili-comments</gs_root><gs_root>div#feed > bili-comment-thread-renderer</gs_root>

3. 自定义定位抓取内容的Xpath:
<gs_root>bili-comment-renderer#comment</gs_root><gs_root>div#header > bili-comment-user-info</gs_root>div#user-name > a


测试时提示我需要做映射,我进行了内容映射

抓取后并没有发现数据,请大神们帮忙看看我这个思路和操作方式是不是有问题,谢谢!!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2024-11-12 15:43

沙发
Fuller 管理员 发表于 2024-11-12 15:43:10 | 只看该作者
B站的评论页面比较特殊,需要特别的处理。建议直接用B站视频采集_评论快捷采集。采集之前,在数据管家先登录B站。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?
  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的

热门用户

GMT+8, 2026-5-2 16:01