打开

标签是个好的设计吗?(上)

投稿 17465阅读 2016-07-04

《Tagging研究综述》

作者:沈浩翔


上篇:标签是个好的设计吗?(上) 

中篇:标签是个好的设计吗?(中)

下篇:标签是个好的设计吗?(下)



摘要:

标注系统(Tagging System)分为简单标注(Simple Tagging)和协作式标注(Collabrative Tagging)两种。社会化标注(Folksonomic Tagging)指的就是(Collabrative Tagging),它是现代大众分类(Folksonomy)中最重要的组成部分。这种大众分类(Folksonomy)和传统分类(Taxonomy)的互补成为了现代信息架构最重要的形式。本文将从信息架构和分类系统开始,详细的描述标注系统。通过分析标注的历史发展、分类、作用、架构、界面、优缺点,来分析标注(Tagging)未来的发展趋势。

关键词:

协作式标注、大众分类、传统分类、分面、等级系统、多层分面等级系统、无源社会元件、有源社会元件、可寻性、可检索性、PIM

目 录

第1章. 引言… 1

1.1 背景介绍… 1

1.2 相关概念… 2

1.2.1 分类系统… 2

1.2.2 元数据、受控词表… 2

1.2.3 分面… 2

1.3 国内外研究现状… 2

1.4 争论焦点… 3

1.4.1 支持观点… 4

1.4.2 反对观点… 4

第2章. 标注的历史… 5

2.1 标注的产生… 5

2.2 社会化标注和大众分类… 6

第3章. 现状分析… 6

3.1 标注的认知过程… 6

3.2 标注的架构… 8

3.2.1 用户、资源、标签的三元模型结构… 8

3.2.2 分面与社会化标注的融合… 9

3.3 标注的分类… 9

3.3.1 按目的分类… 11

3.3.2 按来源分类… 11

3.3.3 按内容分类… 12

3.3.4 按时间轴分类… 12

3.4 标注的作用… 13

3.4.1 个人信息管理… 13

3.4.2 促进协作和分享… 14

3.4.3 增加参与度… 14

3.4.4 获取描述性元数据… 15

3.4.5 增强可寻性… 15

3.4.6 增强现有分类系统的作用… 15

3.4.7 帮助研究用户特征… 15

3.4.8 促进创新… 15

3.5 标注的流动性与稳定性… 16

3.6 标注的界面… 17

3.6.1 标注的导航界面… 17

3.6.2 标注的输入界面… 22

第4章. 结论… 25

4.1 标注的优点… 25

4.2 标注的不足… 25

第5章. 趋势和展望… 27

5.1 分面层级结构方向… 27

5.2 一致性方向… 27

5.3 可视化方向… 28

插图索引… 29

表格索引… 31

参考文献… 33

致 谢… 37


第1章 引言

1.1 背景介绍

随着Web2.0的兴起,用户创造内容(UGC, User Generated Content)成为了互联网上的主流。内容出现了爆炸性增长,传统分类(Taxonomy)自上而下的分类系统,仅仅让网站管理人员维护分类的做法显得不堪重负。把信息管理权交还给用户,让用户进行个人信息管理(PIM, Personal Information Management),来组织用户创造内容(UGC),社会化标注(Folksonomic Tagging)这种大众分类(Folksonomy)成为了一个辅助信息架构的重要解决方案。

标注(Tagging)不同于传统分类一对多的分类方式,它多对多的分类方式,被广泛应用在个人信息管理(PIM)上,如即时通信软件(IM, Instant Messaging)、聚合内容阅读器(RSS Reader, Really Simple Syndication Reader),甚至操作系统(OS, Operating System)上。这种单源的标注方式被称为简单标注(ST, Simple Tagging)

除了个人信息管理(PIM),协作分享(Collaborating & Sharing)也成为了一个处理海量信息的一个主题。协作式标注(CT, Collaborative Tagging),即不同用户对于同一资源进行不同的标注(Tagging),使得用户互相影响。社会化网络(SNS, Social Networking Services)、企业资源管理系统(ERP, Enterprise Resource Planning)、电子商务(E-Commerse)等产品已经广泛运用了社会化标注(Folksonomic Tagging)来组织信息。我们将这种协作式标注(CT)称之为社会化标注(FT, Folksonomic Tagging)。

由于社会化标注(FT)的广泛性,国内研究者也经常将Tagging直接翻译为社会化标注或协作式标注。而在本文中我们将Tagging这种行为或者Tagging的系统翻译为标注,Tag这样的结果翻译为标签。


1.2 相关概念

1.2.1 分类系统

分类系统(Classification System)是信息架构(IA)的基础。

1.2.1.1 传统分类

在传统的分类方式中,最为有名的是林奈生物分类系统(Linnaean System of Classifying Living Things),这也被视为现代分类学的起源。传统分类(Taxonomy)原本指的就是生物分类学,其界门纲目科属种的层级结构非常清晰,所以传统分类(Taxonomy)也拿来特指层级分类(Hierarchy Classification)。

信息架构是图书馆管理与情报学与计算机科学的交叉学科,被广泛用于图书管理的杜威十进制分类法(Dewey Decimal Classification),是传统分类的另一个代表。

传统分类多由分类学专家维护,在信息架构中,则由信息架构师来维护。传统分类通常比较固定,基本不随时间、地点、知识阅览者的知识结构的变化而变化。这时一种自上而下的分类方式,也可以视为单源分类。

1.2.1.2 大众分类

大众分类(Folksonomy)

[1]

则主要由用户们来贡献和维护。所以大众分类(Folksonomy)是一种多源分类,它根据使用者、时间、环境的不同而不同。所以大众分类(Folksonomy)也是一种情境分类(Contexture Classification)。这是一种自下而上的分类方式,它往往多样、随时间变化不断变化、扁平。

标注系统(TS)就是大众分类(Folksonomy)的代表。

1.2.2 元数据、受控词表1.2.2.1 元数据

根据国际信息标准组织(NISO, National Information Standards Organization)的定义,元数据

[2]

就是“用于描述、解释、定位,或者便于检索、使用和管理信息资源的结构化信息”。简而言之,就是关于数据的文档(Documentation for Your Data),即关于数据的数据(Data about Data)。

它主要有三个作用,帮助寻找数据;帮助管理数据;帮助关联数据。

在世界数字图书馆

[①]

,按这三种功能将元数据分为三类:描述型(Descriptive)、管理型(Administrative)、结构型(Structural)

[3]

标注(Tagging)就可以被理解成一种通过元数据来描述或者管理信息的一种行为。

1.2.2.2 受控词表

受控词表(Controlled Vocabularies)

[4]

是分类系统中定义术语(Terms)关系的工具。这些关系是语义化的,受控词表通过关联概念和捕捉现实世界中事物的关系来消除歧义。

受控词表是一个用来管理词语意义的系统。受控词表有两种最常见也是最重要的形式,一种是同义词圆环(Synonym Rings),即一份等价术语(Equivalent Term)清单,按圆环形式排列;另一种是优选术语表(也称规范文档,Authority Files),即一份优选术语(Preferred Term)清单。另外,受控词表(Controlled Vocabularies)也会用传统分类(Taxonomy)的方式,为词语建立从属关系,构建上位类术语(BT, Broader Term),下位类术语(NT, Narrower Term),相关术语(Related Term)

[1]

原本受控词表也是由信息架构师们进行构建,但随着标注的出现,用户生成的受控词表(User Generated Controlled Vocabularies)也开始出现

[②]

1.2.3 分面

分面(Facets)是根据事物的各种属性来进行分类组织的一种方式。1930年,印度图书馆管理员S.R.Ranganathan发明了分面。他认为纯粹的等级分类系统(Hierarchical Classification System)是不够的。分面引入了多维(Multi-Dimensions)和多路径(Multi-Paths)。

标注系统(TS)由于其不同的标注目的,以及其多元的特性,天然就具有多分面性(Multi-Faceted)。

http://Buzzillions.com

[③]

这样的网站,正在使用分面来提升标注系统的语义价值

[4]

1.3 国内外研究现状

自Web2.0以来,技术往往先于理论出现在实践当中。国内外学者和计算机从业人员,通过对实践进行总结和提取,产出了丰富的研究成果。

社会化书签网站http://Del.icio.us第一次广泛使用了协作式标注系统(CTS, Collabrative Tagging System)。随着http://Del.icio.us的流行,信息架构(IA, Information Architect)师们开始意识到这种标注非常类似于他们创造的受控词表(Controlled Vocabularies)。虽然这种低成本的元数据(Metadata)也因为一些缺点,而饱受争议。但关于社会化标注(FT)的使用和研究还是迅速的发展了起来。

2006年国际WWW会议上举办了关于标注(Tagging)的Workshop

[④]

里面收集了到当时为止的关于标注的大量研究。其中包括了Flickr的Cameron, Marlow等人发表的《Position Paper, Tagging, Taxonomy, Flickr, Article, ToRead.

[5]

。SlideShare的创始人兼CEO,Rashmi, Sinha也发表了《Tagging : From the personal to the social

[6]

,她在其个人网站上发表的博文,是对标注的认知过程最重要的文献。

在2007和2008年的WWW会议上,都有大量关于标注系统的文章。聚类算法(Clustering Algorithm)等算法,在语义一致性(Semantic Consistency)上的贡献是这两年的一个重点。随着语义网概念的兴起,概念模型的明确的规范说明,即本体概念模型(Ontology)

[7]
[8]

也被重新重视,成为研究标注系统和传统分类之间融合的重点。

Gene, Smith在2008年发表的《Tagging: People-Powered Metadata for the Social Web》是现阶段对标注系统(Tagging System)最完备的著作。

09年,Motriz, Stefaner和Giovanni, Maria Sacco、Sébastien, Ferré、Yannis, Tzitzikas、Saverio, Perugini、Jonathan, Koren、Yi, Zhang、Wisam, Dakka、Panagiotis, Ipeirotis一起发表了《Dynamic Taxonomies and Faceted Search》

[21]

,对标注和传统分类的融合进行了更深入的探索。

近年来,随着国内互联网的迅速发展,特别是SNS在国内的高速发展,国内对标注的应用也极其广泛。众多从业人员也在博客和互联网社区中不断的探讨和研究标注。百度、阿里巴巴、腾讯等国内领先的互联网企业,也展开了对标注的研究。

研究机构中,清华大学的皋琴,戴玉森,傅凯发表的《通过标注相关性的可视化增强个人标注一致性(Improving Personal Tagging Consistency through Visualization of Tag Relevancy)》被收录在了Lecture Notes in Computer Science(LNCS)期刊当中

[9]

。其中对标注在脑力负荷(Mental Workload)方面的研究填补了这一领域的空白,其对标注系统的认知模型的修订也处于领先水平。

1.4 争论焦点

《Tagging》的作者Gene, Smith总结了标注系统的四个张力点:个性化和社会化的矛盾(Personal vs Social)、异质化与标准化的矛盾(Idiosyncratic vs Standard)、自由于控制的矛盾(Freedom vs Control)、业余和专业的矛盾(Amateur vs Expert)

[4]
[10]
[11]

。表 1.1就是关于社会化标注的争论焦点。

表 1.1标注系统中的四个张力点

张力点概述个人化vs社会化用户是否首先为自己考虑才添加标签?或者他们是渴望向一群人分享信息,或者渴望自己的标签被认作是一种知识,或者其他的社会化因素?特殊性vs标准性标签是否应该完全的独特?或者标签是否应该标准化,以便于这些标签被用在浏览和搜索上?自由vs控制系统是否给了用户完全的自由去添加标签?或者系统通过一些方式影响或控制它们的标签(比如通过提供建议)?非专业人士vs专家什么样的人有资格标注?那些非专业人士贡献的标签和专家创建的标签,是否应该获得相同的认可?当专家和通过标签表现出来的流行的观点有不同见解的时候,你该如何协调这一切?

1.4.1 支持观点

大量社会化软件(Social Software)开发者意识到社会化标注(FT)是一种来源于一般用户的低成本元数据,这避开了昂贵的专业元数据创建。Google是这方面的积极代表

[4]

同时,社会化标注(FT)似乎也推动了分类的民主化,这削弱了由图书馆管理员和信息架构师们中央集权的分类体系,而将分类权归还给了大众。

信息架构师Lou, Rosenfeld,社会化软件权威Clay, Shirky也都是社会化标注的支持者。作者兼活动家Cory, Doctorow则从元数据的角度提出了看法,他认为让所有人都用同样的受控词表去认知的是不符合人的本性的

[12]

1.4.2 反对观点

《Tagging》的作者Gene, Smith总结了标注的五个常见的缺陷:冷启动(Cold Start)问题、混乱的元数据(Messy Metadata)问题、少数用户霸占系统(Vocal Minority)问题、垃圾信息(Bad Actors)问题、信息过载(Unlimited Resource & Tags)问题

[4]

。但他在书中也搜集了从业者和研究人员们的相应的解决方案。反对者逐渐在向中立者转变。

Guy和Tokin指出了现代社会化标注的主要不足是精确性和一致性问题。精确性和一致性不足降低了信息的可寻性(Findability)和可检索性(Retrievability)

[13]

。但他们也提出了这些问题的解决思路。

这些社会化标注的缺陷,也是现在社会化标注系统研究的重点。

标注将在信息架构中发挥越来越重要的作用,其发展也是极其迅速。本文将从标注的历史发展、分类、作用、架构、界面等角度做一个全面的分析,并从中总结该领域未来的发展重点。

第2章 标注的历史2.1 标注的产生

著名作家兼信息架构师Alex, Wright

[⑤]

引入了语言学的观点,认为这是口语文化的在线化反映,这是术语的第二次口语化。他认为最早分类系统即不是生物学家发明的,也不是图书馆管理员发明的。而是远古的部落社区的人们在生活中自然形成的,这是最早的“大众分类”,它给原始部落的人们提供了组织他们身边信息的框架。而后来逐渐出层级分类法等现代分类学。而标注系统的流行,则是回归了本质,他认为这是一次进化,同时也是一次革命

[4]

自从施乐(Xerox)公司的帕洛阿尔托研究中心(PARC, Palo Alto Research Center)开发出第一代图形界面(GUI, Graphic User Interface)操作系统Star以来,文件夹就成为了计算机系统中的主要的管理文件的方式。这一切源于Star操作系统的桌面隐喻(Desktop Metaphor)。在Star操作系统中,文件用纸张作为隐喻,而管理文件的集合则使用了文件夹。文件夹起源于19世纪的文件管理解决方案“垂直归档(Vertical Filing)”。著名的图书管理学专家Melvil, Dewey将“垂直归档”和“卡片夹(cardstock folder)”结合并推广了开来

[4]
[14]

标注本质上是一种元数据。而元数据这个名词在1969年被Jack, E. Myers创造出来。1973年最早的在产品宣传册上使用了元数据。1979年,国际新闻电信董事会(IPTC, International Press Telecommunications Council)在图像上加入了元数据。所以,最早将元数据进行开放式管理,引入标注系统这种概念的也是图书馆、社会化书签和在线照片分享网站

[15]

标注是自文件夹隐喻以来的第一次重大变革。文件夹是一件事物对应一个位置(one-thing-in-one-place)的隐喻,而标注是一个文件可以同时出现在多个“位置”的隐喻。Gene, Smith将此称为多分面性(Multifaceted)

[4]

2.2 社会化标注和大众分类

社会化标注指的就是协作式标注。标注系统在互联网上以社会化标注的形式产生。后来又被引入到Vista操作系统中,产生了简单标注。所以标注即包括简单标注,又包括社会化标注。

而大众分类指的是自下而上(Bubble up)的分类方式。常被拿来与传统中央权威(Central Authority)的分类方式相对应。由于大众分类是近些年才兴起,所以传统的中央权威的分类方式又常常被称为传统分类。

综上所述,大众分类从定义上不仅限于社会化标注的一种形式。而标注也不仅限于社会化标注一种形式。社会化标注是大众分类和标注系统的交集(图 2.1)。只是当今,还没有标注系统以外的大众分类产生,在各类学术研究中,标注、社会化标注、大众分类常常被等同起来,并没有明确的区分。

图 2.1 社会化标注是大众分类和标注系统的交集



沈浩翔:芝麻信用无线产品负责人。

本文由原作者授权PMCAFF产品社区(www.pmcaff.com)发布,版权归原作者所有。如需转载,请联系原作者。

Image

栏目传送门:

深度  |  观点  |  数说  |  热榜  |  早报  

写下你的评论

发布评论 取消
500

写下你的评论

发布
500

评论

查看更多评论

删除评论

删除的评论将永久消失,确定要删除吗?

删除 取消
内容不合法,请修改后提交

云队友-为有效工作时间付费

免费招聘 →
1分钟快速发布职位

绑定手机

参与互动需要先绑定手机号哦~

完善信息

参与互动需要完善个人信息哦~

参与互动需要进行审核

为了保证社区的内容质量,需要提一个问题,来证明你是可以的!

在问题审核通过后,即可开启PMCAFF所有功能~

  • 微信好友

  • 朋友圈

取消

打开 APP 阅读

推荐使用 PMCAFF APP,阅读体验更佳。