Web信息提取服务流程

通常,获得Web信息提取服务需要经过下面的主要步骤:

  1. 通过电子邮件将您的需求告知我们的服务团队,邮件中至少包括以下内容:
    • 如果要提取特定网页上的内容,例如,新闻或者文章,请告知目标网页的URL
    • 如果要提取一类网页上的内容,例如,黄页、电子商务网站的产品列表等,请给出范围的定义、样本页面的URL。
    • 信息提取结果存储格式,缺省提供XML格式,如果需要其它格式请说明,注:部分格式转换服务收取一定的费用
    • 交付截止日期
  2. 我们的服务团队将对目标进行信息提取测试,评估任务的难度,影响信息提取难度的重要方面有:
    • 目标网站的响应速度,主要取决于网站服务器的部署地点;
    • 目标页面加载速度,主要取决于HTML 文档的大小和页面上是否有大量的外部资源,例如,从第三方网站加载的图片、广告等。
    • 目标页面是否采用严格的反提取机制,例如,对连续点击的次数进行限制等
    • 目标页面的浏览是否需要输入验证码等。
    • 目标页面的总数量,不考虑数量特别巨大的情况,随着总量的增加,单价是下降的。
  3. 经过工作量预估并综合考虑难度因子,我们将给出报价、支付和交付过程的说明,附带目标网站的信息提取结果样例。
  4. 双方确认
  5. 依照支付过程的说明,您通过PayPal服务进行支付
  6. 依照交付过程的说明,我们向您交付信息提取结果

为了更清楚地了解这项服务,请阅读: