本帖最后由 ippfon 于 2016-9-22 09:25 编辑
Python博主采集工具
此工具为64位windows系统可执行程序,简单易用,无需安装,双击即可执行
1、输入需采集的博主主页链接,初始界面如下:
2、输入微博账号密码,仅第一次需要(缘由:微博翻页需要有账号已登录),操作界面如下:
3、查看微博登录是否成功,程序会自动启动火狐浏览器访问微博登录页进行模拟登录,登录成功后开始加载需采集的博主链接。若当前链接采集完成后,可选择继续添加博主网址进行采集操作,也可输入“exit“ 退出采集工具,操作界面如下:
4、查看采集结果,采集结果存储目录为exe同级目录result文件夹下,如下图:
1、若微博账号或密码填写错误导致模拟登录失败,请根据提示重新填写。
2、由于微博本身的限制,浏览器自动翻页到30页以上时可能无法继续访问下一页,导致采集程序提前结束,此时,可重新输入翻页中断时对应的网页链接继续采集。
3、第一次执行可能会碰到windows提示如下:
下载入口
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 7 个关于本帖的回复 最后回复于 2017-1-4 20:44