什么是档案注入攻击(profile injection attack)

社会性书签(社会性标签,folksonomies, social tags, social tagging)是Web2.0时代的创举,它发动社会力量对网络内容进行分类,标签是自由赋予的,但是,由于目标内容的语义的确定性,如果众多人参与,被打的标签中与原文语义最贴切的标签必然是出现频率最高的。实践证明,社会性书签是一种有效的内容分类方法。然而当前出现一种攻击方式,恣意践踏社会性书签服务的社会价值,这种攻击就是profile injection attack,本人将其翻译成档案注入攻击。下面,对此类攻击进行简单介绍,详细内容可以参考Maryam Ramezani, J.J. Sandvig, Runa Bhaumik, Robin Burke, Bamshad Mobasher联合发表的学术论文[2]

这种攻击的方法是:恶意用户在社会性书签服务器上注册大量的帐号,也就是建立大量的用户档案(profile),然后向受害服务恶意增加大量的垃圾标签(tag spam)。据称[1]Spurl.net就是因为恶意标签泛滥而被迫关停的。
在社会性书签服务系统中,书签之间是有语义关联的,有个术语表示这种关联:navigation context,其含义就是用户可以使用语义关联浏览内容,同内容分类一样,语义关联是社会性书签服务的第二大价值,它将内容和知识以多种视图呈现给用户,这类语义关联举例如下(不完全):

  • 相关内容、相关文章、相关新闻等等相关资源(related resources)
  • 同现标签(co-occurring tags),从语义网络技术角度理解这些同现标签可以看作对一个概念的规定。
  • 最新标签(recent tags)
  • 流行标签(popular tags)

档案注入攻击的目的基本上是恶意使用标签,为恶意内容进行推广(self promoting),有以下形式:

  • 攻击流行标签(popular tags),恶意使用流行度所提现的价值,例如将垃圾标签搞热。
  • 驼载攻击(piggyback attack,驼载一词出自译言的文章),恶意将恶意内容与另一个资源关联起来,欺骗用户,让用户觉得这是相关资源。
  • 重载攻击(overload attack),将恶意内容打上流行标签,恶意利用标签的流行价值。
  • 聚焦重载攻击(focused overload attack),聚焦于某个特定领域或者标签的重载攻击。

[1]的结论,只要3-5%的恶意用户使用驼载攻击就可造成巨大麻烦。

很遗憾,本人还没有发现有效方法抵御档案注入攻击,有待进一步研究。