从Tagging诞生的第一天起,Tag间的不一致性就不断被讨论,在这里和这里你都可以看到。而现在,似乎所有人都觉得这些不一致让Tagging变得面目可憎,于是尝试用各种各样的方法来拯救它。MIT的Haystack小组(草堆组,- -b)也是这些前仆后继的救世主之一,它的方法看上去有点意思。
按照一定的标准,任何Tag都可以被归为某一个类别。比如Golder et al, 2006提出的分类方法:它关于什么,它是什么,谁拥有它,它的品质,自我引用,任务组织,以及”说明其他Tag的Tag”。除此之外,Csaba Veres, 2006也有另一套完全不同的方案。
MIT草堆组的Facette正是基于这个设想。当用户Tagging某物时,系统给出十几个类别,引导用户在每个类别下分别对该物进行标记。这些类别包括:
- Language
- About
- For
- Used for
- Type of Object
- Keywords
- Name
- Author
- Contains
- Source
- Action
- Date
- Location
- Platform
- Update Frequency
- Written In
亲爱的读者,请问当你看完上述分类后的感受,是“累”,还是“很累”?
Tagging之所以被越来越多的人接受,一方面是因为面对着越来越杂乱的信息我们需要更优的组织方式,另一方面,也是很重要的一方面,源自Tagging本身的自由、无拘束——而这正是MIT草堆组童鞋们企图用Facette去扼杀的。
Facette的理想主义值得推崇,遗憾的是它的理想主义似乎不可能由人来实现。
我有时候在想,如果Semantic Web进一步发展下去,下一代的信息组织方式是不是就不会再有人工介入了呢?
参考文献:
Golder, S. and Huberman, B.A. (2006). Usage Patterns of Collaborative Tagging Systems. Journal of Information Science, 32(2): 198-208.
Csaba Veres, (2006). The Language of Folksonomies: What Tags Reveals About User Classification, NLDB 2006, LNC3999: 58-69.

http://blog.mozilla.com/faaborg/
这是我一好友的博,他在语义网上很有研究。