快捷导航
1,引言
Python自带一个轻量级的关系型数据库SQLite。这一数据库使用SQL语言。SQLite作为后端数据库,可以搭配Python建网站,或者为python网络爬虫存储数据。SQLite还在其它领域有广泛的应用,比如HTML5和移动端。

Python标准库中的sqlite3提供该数据库的接口。

2,Python对SQLite进行操作示例

以下的代码将创建一个简单的关系型数据库,为一个书店存储书的分类和价格。数据库中包含两个表:category用于记录分类,book用于记录某本书的信息。一本书归属于某一个分类,因此book有一个外键(foreign key),指向catogory表的主键id。
sqlite.png

2.1 创建数据库

首先,创建数据库,以及数据库中的表。在使用connect()连接数据库后,就可以通过定位指针cursor,来执行SQL命令:
  1. import sqlite3

  2. # test.db is a file in the working directory.
  3. conn = sqlite3.connect("test.db")

  4. c = conn.cursor()

  5. # create tables
  6. c.execute('''CREATE TABLE category
  7.       (id int primary key, sort int, name text)''')
  8. c.execute('''CREATE TABLE book
  9.       (id int primary key,
  10.        sort int,
  11.        name text,
  12.        price real,
  13.        category int,
  14.        FOREIGN KEY (category) REFERENCES category(id))''')

  15. # save the changes
  16. conn.commit()

  17. # close the connection with the database
  18. conn.close()
复制代码
SQLite的数据库是一个磁盘上的文件,如上面的test.db,因此整个数据库可以方便的移动或复制。test.db一开始不存在,所以SQLite将自动创建一个新文件。

利用execute()命令,执行了两个SQL命令,创建数据库中的两个表。创建完成后,保存并断开数据库连接。

2.2 插入数据


上面创建了数据库和表,确立了数据库的抽象结构。下面将在同一数据库中插入数据:
  1. import sqlite3

  2. conn = sqlite3.connect("test.db")
  3. c  = conn.cursor()

  4. books = [(1, 1, 'Cook Recipe', 3.12, 1),
  5.             (2, 3, 'Python Intro', 17.5, 2),
  6.             (3, 2, 'OS Intro', 13.6, 2),
  7.            ]

  8. # execute "INSERT"
  9. c.execute("INSERT INTO category VALUES (1, 1, 'kitchen')")

  10. # using the placeholder
  11. c.execute("INSERT INTO category VALUES (?, ?, ?)", [(2, 2, 'computer')])

  12. # execute multiple commands
  13. c.executemany('INSERT INTO book VALUES (?, ?, ?, ?, ?)', books)

  14. conn.commit()
  15. conn.close()
复制代码
插入数据同样可以使用execute()来执行完整的SQL语句。SQL语句中的参数,使用"?"作为替代符号,并在后面的参数中给出具体值。这里不能用Python的格式化字符串,如"%s",因为这一用法容易受到SQL注入攻击。

也可以用executemany()的方法来执行多次插入,增加多个记录。每个记录是表中的一个元素,如上面的books表中的元素。

2.3 查询

在执行查询语句后,Python将返回一个循环器,包含有查询获得的多个记录。循环读取,也可以使用sqlite3提供的fetchone()和fetchall()方法读取记录:
  1. import sqlite3

  2. conn = sqlite3.connect('test.db')
  3. c = conn.cursor()

  4. # retrieve one record
  5. c.execute('SELECT name FROM category ORDER BY sort')
  6. print(c.fetchone())
  7. print(c.fetchone())

  8. # retrieve all records as a list
  9. c.execute('SELECT * FROM book WHERE book.category=1')
  10. print(c.fetchall())

  11. # iterate through the records
  12. for row in c.execute('SELECT name, price FROM book ORDER BY sort'):
  13.     print(row)
复制代码
2.4 更新与删除

可以更新某个记录,或者删除记录:
  1. conn = sqlite3.connect("test.db")
  2. c = conn.cursor()

  3. c.execute('UPDATE book SET price=? WHERE id=?',(1000, 1))
  4. c.execute('DELETE FROM book WHERE id=2')

  5. conn.commit()
  6. conn.close()
复制代码

也可以直接删除整张表:
  1. c.execute('DROP TABLE book')
复制代码

如果删除test.db,那么整个数据库会被删除。

3,总结

sqlite3是一个SQLite的接口。想要熟练的使用SQLite数据库,需要学习关系型数据库的知识。在一些场景下,Python网络爬虫可以使用SQLite存储采集到的网页信息。GooSeeker爬虫DS打数机将在7.x版本支持SQLite,不妨想想一下Python网络爬虫与DS打数机连接在一起会怎样。

4,文档修改历史
2016-06-28:V1.0,首次发布

举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2016-6-28 18:05

gz51837844 管理员 发表于 2016-6-28 17:35:39 | 显示全部楼层
kankan, thanks
举报 使用道具
Fuller 管理员 发表于 2016-6-28 18:05:33 | 显示全部楼层
即将发布的GooSeeker爬虫也将启用SQLite
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 批量爬取蘑菇街商品价格、评论信息
  • 微博用户数据分析
  • 批量爬取苏宁商品价格、评论信息
  • 批量爬取亚马逊商品价格、评论信息
  • 批量爬取eBay商品价格、销售情况信息

热门用户

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2018-7-19 19:56