本帖最后由 wangyong 于 2020-10-16 10:33 编辑

集搜客爬虫软件和数据管家怎样清理cookie/缓存/网页访问记录
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2021-5-12 14:53

wangyong 版主 发表于 2020-10-16 10:27:22 | 显示全部楼层
一、新版爬虫软件(数据管家)清除cookie的方法
QQ截图20201016101631.png
#1,点击设置按钮
#2,选择隐私和历史
#3,勾选清除所有
#4,点击清除

二、旧版本爬虫软件清除cookie的方法
QQ截图20201016102540.png #1,点击设置按钮
#2,选择清除历史
#3,勾选清除所有
#4,点击清除
#5,保存关闭
清理cookie的方法Mac版软件和Windows版软件相同



举报 使用道具
内容分析应用 金牌会员 发表于 2020-10-16 10:38:31 | 显示全部楼层
是不是按上面的步骤在软件界面上清理就可以了? 以前有帖子说需要去清理appdata下的特定文件夹和数据


举报 使用道具
wangyong 版主 发表于 2020-10-16 11:02:57 | 显示全部楼层
内容分析应用 发表于 2020-10-16 10:38
是不是按上面的步骤在软件界面上清理就可以了? 以前有帖子说需要去清理appdata下的特定文件夹和数据

是的,现在在软件界面上清理就是代替了以前在文件夹清理的方法
举报 使用道具
Fuller 管理员 发表于 2020-10-16 11:18:23 | 显示全部楼层
如果采集需要登录的网站,一定要记得在清除cookie以后重新登录目标网址。

比如,用集搜客微博采集工具箱采集关键词搜索结果、博主主页和信息、评论和转发等等所有版块,采集微博一定要登录

还有用集搜客快捷采集工具采集电商类网站,目前很多电商网站需要登录以后才能采集更多内容,比如,登录天猫。
举报 使用道具
Fuller 管理员 发表于 2020-10-16 11:19:49 | 显示全部楼层
Fuller 发表于 2020-10-16 11:18
如果采集需要登录的网站,一定要记得在清除cookie以后重新登录目标网址。

比如,用集搜客微博采集工具箱采 ...

如果是用集搜客网络爬虫软件采集这些网站,那么就要在网络爬虫的浏览器中登录目标网站;
如果是用集搜客数据管家软件采集这些网站,那么就要在数据管家的浏览器中登录目标网站
举报 使用道具
xinzhe 初级会员 发表于 2021-5-12 12:17:25 | 显示全部楼层
你好 现在是不能指定爬取原创微博吗?
举报 使用道具
内容分析应用 金牌会员 发表于 2021-5-12 14:53:18 | 显示全部楼层
xinzhe 发表于 2021-5-12 12:17
你好 现在是不能指定爬取原创微博吗?

你说得原创微博是指什么?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 00:05