Blogs

结构化网页抓取工具Solvent

GooSeeker研发中心发布的MetaSeeker本身就是一款抓取网页内容并将其结构化存储的工具,GooSeeker网站有大量文档资料介绍MetaSeeker的原理,GooSeeker虽然也密切关注语义网络(Semantic Web)的发展动向,但是公开发布的MetaSeeker在线版更关注实用价值,相反国外的更多类似产品在网页内容结构化方面更进一步,本文介绍Solvent,它是语义网络项目Simile中的

什么是拉斯韦尔传播模型

GooSeeker网站上大量文章是关于舆情监测、营销效果监测、媒体监测等内容的,到底哪些方面最值得监测,实际上是有理论依据的。最重要的理论基础是拉斯韦尔传播模型

Priceline商业模式

MetaSeeker在在线实时价格监测领域已经涉足了多个行业,在线旅游信息监测方面一直没有显著进展,仅为越南和香港两个公司定制过酒店搜索和机票价格采集技术平台。在线实时监测机票价格仍然存在一些疑虑,例如,持续看到发生在欧洲的相关法律纠纷,又如,因为机票价格变化很快,加上目标网站反采集手段用得比较多,采集成本比较高。

为市场营销采集和挖掘客户关系数据

客户数据经过适当挖掘就是宝贵的市场营销信息,例如,客户的电话、email地址等,可以直接用于电话营销和email营销,获得的客户信息越丰富则越适合作精准营销。总之,客户信息的采集和挖掘对任何商业组织来说都很重要。当前,越来越多的商业活动利用互联网媒介,同时越来越多的客户信息公布在web上,采用类似MetaSeeker这类网页信息抓取技术采集email、电话、地址信息十分重要。

主题搜索案例分析—Blekko

近半年一直为几个项目忙得团团转,其中商品和服务价格实时比价、企业竞争情报挖掘项目居多。从中可以看到商品比价应用领域和场合正在迁移,很多普通的比价网站虽然仍然在艰苦度日,比价技术的应用却方兴未艾;同时,作为MetaSeeker的开发团队,为MetaSeeker在这些领域的显著的竞争优势而自豪。

企业竞争情报分析工具--Mozenda研究

企业竞争情报分析和报告系统是一个复杂的企业IT系统,而且根据不同企业的部署和使用目标,企业竞争情报系统需要数量可观的定制开发功能部件。但是,离不开两大基石:数据采集和数据挖掘

社会化BI(Social BI)和Tibbr观察

观察基于社会化媒体技术Enterprise2.0也有时日了,看到Tibco进入这个领域,感觉是个大事件,毕竟Tibco在企业市场有很坚实的根基,这将对Enterprise2.0创业企业造成一定影响。



什么是社会化BI

Tibco的定义

正式使用Metastudio

这是我第一次做数据挖掘类也好,或者爬虫也好,迄今为止,我已经将Amazon上面简单的数据提取工作做完了,目前遇到的难题是,Amazon上面的comments很难提取。

我很喜欢目前做的这个工作,将来教课的时候可以用在business intelligence那里,还可以用在系统分析与设计那里。

Enterprise2.0的问答(Q&A)网站

Enterprise2.0是近期媒体的热点话题,Enterprise2.0到底有哪些特征?我们在《Enterprise2.0平台分析——SocialText》一文用案例进行了说明。

Enterprise2.0平台分析——SocialText

Enterprise2.0最近甚嚣尘上,在国外IT领域媒体上频频看到新的技术、产品和服务。从零星的网络文章可以看到,Enterprise2.0似乎是一堆社会性媒体技术和产品在企业IT中的集成。在此之前企业IT系统有过长足发展,有理由掀起一波Enterprise2.0的浪潮吗?当前热门的社会性媒体技术都可以说成是Enterprise2.0的组成部分,如果只是简单的堆砌,结果可能什么也不是。

Syndicate content