想要用 python 做爬虫，是使用 scrapy框架还是用 requests, bs4 等库？

中秋2016

想要用python实现一个爬虫，来完成自己的一些需求。
参考网上的资料，发现对自己而言有两种待选的方案：
1. 使用scrapy框架
都说该框架功能强大，实现简单。但是听说不支持python3
2. 使用requests 和 bs4等库来自己实现
相比方案一，可能要自己多写好多代码，以及性能可能不如开源的框架。

希望熟悉的人回答一下 scrapy对python3的支持到底如何？
如果采用方案二，那么想问，如果我想要利用 requests， bs4等库实现一个简单版的 scrapy，困难有多大，需要学习那些东西？

shenzhenwan10 · 发表于 2016-10-18 10:47:03

本帖最后由 shenzhenwan10 于 2016-10-18 22:11 编辑

scrapy现在已经支持python3了，具体可以参考这篇文章：为编写网络爬虫程序安装Python3.5
假如你是为了完成工作，就用它好了，也可以使用集搜客通用爬虫。
假如你想深刻的了解爬虫，和业务结合的更紧密，掌握出现问题的解决方案，可以尝试一下自己写

想要用 python 做爬虫，是使用 scrapy框架还是用 requests, bs4 等库？

共 1 个关于本帖的回复最后回复于 2016-10-18 10:47

浏览过的版块

推荐板块

精彩推荐

热门话题

热门用户

	B Color Image Link Quote Code Smilies 高级模式您需要登录后才可以回帖登录 \| 立即注册回帖并转播回帖后跳转到最后一页

想要用 python 做爬虫， 是使用 scrapy框架还是用 requests, bs4 等库？

共 1 个关于本帖的回复 最后回复于 2016-10-18 10:47

浏览过的版块

推荐板块

精彩推荐

热门话题

热门用户

想要用 python 做爬虫，是使用 scrapy框架还是用 requests, bs4 等库？

共 1 个关于本帖的回复最后回复于 2016-10-18 10:47