前面我们讨论了标签一致性带来的一些问题,这里有另外一些有趣的想法。
Thomas Gruber认为可以通过标签内在的标准形式(Canonical Name)来部分解决标签一致性的问题,例如对标签San Francisco, san francisco, sanfrancisco, san_francisco, 可以通过算法将它们在系统内部化归为标准形式Cname=San Francisco。这样当用户查询任一标签时,系统将查询请求转换成标准形式,然后再返回所有的结果。
Csaba在事后分类(ad hoc categories)概念的基础上描述了标签行为分析的框架。他将标签分为分类型和分析型两种。他认为用户为了达到某个特定目的,必须首先创造一个事件(event frame)来描述实现该目的的必须因素,同时必须具备一个世界模型(world model)来描述用户所认知的世界。分类型标签是世界模型的组成元素,而分析型标签提供了事件框架同用户的世界模型之间的映射。如“书”是用户世界模型的一部分,而“明天考试要用的那本参考书”则是作为“书”和“明天考试”之间映射的存在。根据Csaba的如上分析,标签用语的一致性问题可能在分类型标签上得到较好解决,即让用户形成一致的世界模型,而由于分析型标签牵涉到用户的个人经验和知识,因此在不同的用户之间几乎不可能取得一致。
Cameron Marlow等描述了地缘和社会结构的不同能够如何在较大的社会语言学系统中影响语义和构词结构。他们指出了五种主要的“方言”形式,包括地理方言(dialect):由地理位置定义的社区中的方言;社会方言(sociolect):社会性质定义的社区中的方言;文化方言(ethnolect):特定文化群体中的方言;家庭方言(ecolect):特定家族中的方言;以及个人方言(idiolect):特定人的方言。这一点或许有助于解释非频繁标签在长期运行中的稳定化,即非频繁标签可能为某一特定群体中的专有用法,因此虽然出现频率不多,但是始终不会完全消失。
接下来我们将讨论另一个问题:标签和分类,作为管理信息的方式,哪个更加简单?
参考文献:
Gruber, T. (2005). Ontology of folksonomy: A mash-up of apples and oranges. 1st On-Line Conference on Metadata and Semantics Research (MTSR ‘05).
Veres, C. (2006). The language of folksonomies: What tags reveal about user classification. Lecture Notes in Computer Science, 3999, 58-69
Marlow, C., Naaman, M., Boyd, D., & Davis, M. (2006). Ht06, tagging paper, taxonomy, flickr, academic article, to read. In HYPERTEXT ’06: Proceedings of the seventeenth conference on Hypertext and hypermedia, 31–40, New York, NY, USA. ACM Press.

0 Response to “关于标签一致性:更多”