迁移博客

如果您想给自己的博文搬个家,但是又没有原博客空间系统的编程接口和数据库访问接口,您又不想浪费时间一篇一篇地拷贝,MetaSeeker工具包可以帮您达成愿望。


Figure 1(Enlarge)

上图各组成部分解释如下:

  • 原博客系统:在此假设MetaSeeker用户无法使用原博客系统的API将博文导出来,或者不清楚原博客系统的数据库结构,即数据表之间的关联关系,如果此假设不成立,最好的方法就是使用原博客系统提供的数据导出API。
  • MetaSeeker工具包:这部分用一个云图表示,因为MetaSeeker工具包中的多个工具组成一个数据提取网络。MetaSeeker工具包将原博客系统上的博文一页一页提取下来,跟普通网络爬虫不同,提取下来的内容不是原来的HTML文档,而是含有语义结构的XML文件。
  • 博文注入模块:本模块不是MetaSeeker工具包中的工具,而是第三方合作厂商提供的,如有需要可联系我们,我们将一些成功案例的模块推荐给用户。该模块读取MetaSeeker数据库中的数据提取结果文件,使用某个适配逻辑将数据提取结果注入到新博客系统中,适配方式可能是:
    1. 调用新博客系统的API;
    2. 直接访问新博客系统的数据库;
    3. 模拟用户发表博文的操作。
    对于一些开源或者开放系统,最有效的方法是前两者,例如,使用方法2将博文迁移到Discuz系统上。
  • 新博客系统:迁移到的博客系统