基于Facebook电子邮件email挖掘的市场调研分析

根据CNN科技新闻,Facebook最近进行了隐私策略调整,市场调研分析又增添了新手段:使用email(电子邮件)地址挖掘Facebook上的用户信息,获得极具价值的市场概况(marketing profiles)等商业情报信息,可以抓取的信息包括(受用户的隐私设置影响):名字、头像和其他图片、年龄、地区、兴趣、相片、消息板上的留言(wall posts)、朋友列表和名字,通过数据挖掘算法,可以扫描营销环境分析营销机会,例如,用户的种族、收入、性趋向和兴趣等等。

Facebook在12月份修改了隐私策略,部分信息不能设置为隐私信息,例如,用户名、现居住地、头像、性别、交友网络和朋友列表。

 While that information isn't available for all users, Facebook changed its privacy settings
 in early December so that certain information can't be made private, including one's name,
 current city, profile picture, gender, networks and friend list (the latter can be somewhat
 hidden from public view).

这给市场调研者提供了机会,大概做法是这样的:如果有一个电子邮件地址列表,例如1000个地址,调研者利用自己的某个帐号(可能是dummy account,这是做网络营销的常用手法),上载这个地址列表,如果有人用这个列表中的地址在Facebook上开通了服务,那么,调研者就可以访问这个用户的概要信息(profile)了,也就是上述用于市场调研分析的信息。

这个过程离不开网页信息提取工具(web data extractor, web scraper),例如,MetaSeeker软件工具包,AJAX动态网页内容提取是区别于其它竞争产品的诸多特性之一,每个版本都在强化AJAX内容提取能力,发展到V4.3.0,网页内容提取模式增强到5种模式,覆盖了绝大多数网站。Facebook以AJAX技术著称,对Facebook的挖掘离不开MetaSeeker这类强大的信息提取工具。

在隐私保护方面,Facebook采取了很多措施,例如,上载电子邮件地址的数量和速度进行限制,并采取一些算法监控用户的行为,及早封锁恶意用户,另外,必须公开的信息,用户自己可以尽量不设置,根据报道,Facebook采取新策略的原因:

 Facebook is pushing its users to share information in an attempt to keep Twitter from
 eclipsing the site as the center of the net's online conversations. The site hopes
 getting users to publish more publicly will make it the place people turn when they
 need to find recommendations, a function currently dominated (with great profit)
 by Google.

然而对于这个新策略,各方反应不一,已经有一些团体向FTC递交了正式的投诉。