信息处理

Enterprise2.0的问答（Q&A）网站

Thu, 01/20/2011 - 10:25 — Fuller

Enterprise2.0是近期媒体的热点话题，Enterprise2.0到底有哪些特征？我们在《Enterprise2.0平台分析——SocialText》一文用案例进行了说明。

Fuller's blog
Login to post comments
Read more

Enterprise2.0平台分析——SocialText

Wed, 01/19/2011 - 16:07 — Fuller

Enterprise2.0最近甚嚣尘上，在国外IT领域媒体上频频看到新的技术、产品和服务。从零星的网络文章可以看到，Enterprise2.0似乎是一堆社会性媒体技术和产品在企业IT中的集成。在此之前企业IT系统有过长足发展，有理由掀起一波Enterprise2.0的浪潮吗？当前热门的社会性媒体技术都可以说成是Enterprise2.0的组成部分，如果只是简单的堆砌，结果可能什么也不是。

Fuller's blog
Login to post comments
Read more

MetaSeeker积累的元数据能做什么

Wed, 04/22/2009 - 09:37 — Fuller

MetaSeeker不仅仅是一个Web信息提取工具/信息抓取工具，它还是一个驻留在Web上的服务，采用一种协同方式由用户维护网页的信息结构。去年产品第一版发布后，一个用户在10月份问我：作为一个信息提取工具为什么要做成Web驻留的方式。

能为语义网络技术做点什么

Thu, 04/16/2009 - 15:40 — Fuller

对人生的期许过于理想化不是一件好事，几年前为语义网络技术所吸引，深奥的理论研究已经做不了了，只想搞点实用的小东西。

Fuller's blog
Login to post comments
Read more

为什么实现基于FreeFormat技术的Web信息提取

Wed, 04/15/2009 - 21:49 — Fuller

在Web信息提取领域工作多年，经历了垂直搜索、社交网络、mashup、MEME、推荐引擎等多个浪潮，每个浪潮都需要大量的信息提取/页面抓取工具，经过多年的定制开发工作，发现这个领域简直是长青藤，要创办上述网站，需要消耗很大费用用于提取数据。

Fuller's blog
Login to post comments
Read more

MetaSeeker客户端工具下一版本要实现的内容

Wed, 04/08/2009 - 19:13 — Fuller

MetaSeeker V3.1.0已经发布了，相对于V2版本，改动相当大，耗费的资金和时间远远超出预期，随着越来越多用户下载使用，规划下一版本的时候到了。

Fuller's blog
Login to post comments
Read more

MetaSeeker作为谓词编辑和标注工具为搜索引擎提供结构化语义数据

Tue, 02/24/2009 - 21:48 — Fuller

刚读了一篇博文Did Google Just Expose Semantic Data in Search Results?，博文的作者敏锐地发现在Google搜索结果中出现了主-谓-宾格式的搜索结果展现（参见原文的截图），是典型的语义网络技术特征，引起了很多技术领导者的猜想，最焦点的问题是：这种结构化数据是由Google采用某种语义分析技术从非结构化数据中分析出

Fuller's blog
Login to post comments
Read more

分布式社交网互联技术、服务和讨论

Thu, 12/04/2008 - 22:07 — Fuller

随着社交网站像雨后春笋般涌现，分布式社交网互联（distributed social networking）技术和服务浮现出来，我感觉其吸引眼球的效用远远大于实际功用，作为一个网络服务的运营者，成功来自于网络外部性，而分布式的互联互通是一股削弱的力量。就像几年前热炒的即时通信的互联互通一样，行业的垄断者必然会抵制这场运动。然而，整个世界趋于平坦，任何一个行业和团体想逆转这个趋势只能是螳臂挡车。

Fuller's blog
Login to post comments
Read more

Web信息提取（抓取）一般采用screen scraping或者web scraping等方法，通常情况下，这些方法经常遭到信息提供者的抵制，他们往往认为自己的信息被“窃取”了，实际上，几乎所有搜索引擎（包括所有的巨头）都采用了类似的抓取方法，只是搜索引擎对抓取到的信息的进一步处理往往会给信息提供者创造价值。实际上，screen scraping和web scraping等只是技术方法，关键要看使用者是否能够在信息加工过程中带来双赢的效果。

GooSeeker