情景2:汇聚商品列表信息

阅读完情景1的介绍,您可能会产生下列疑问:

  1. 第一个样本页面是哪来的?
  2. 这张信息网从哪开始爬起?

情景2完整地讲解了一组相关主题下的连续信息提取(网页抓取/抽取)过程,建立情景1的共享书籍搜索系统实际上也是采用了相同的方法和步骤,接下来的篇幅将用一组信息提取主题回答上面两个问题。