Tag Archive for '人机交互'

科幻电影中的人机交互

科幻电影可说是最直观,最具有冲击力的科普方式。瑰丽的外星世界、自由变形的液体金属人,让小时候的我对未来和科技充满好奇。
新颖的人机交互方式一直是科幻电影夺目的亮点之一。最近在IXDA,一封邮件引起了很多人对科幻电影和HCI关系的讨论,我将邮件组里共享的信息,与自己多年的观影经验结合,与大家一起回顾科幻电影中的人机交互。

早期历史

在最早的一些电影中,尚没有HCI的概念,甚至连电脑都没有。当1902年,第一部科幻电影Le voyage dans la lune (A trip to the moon) 问世之时,距离Konrad Zuse发明Z1还有36年呢。
过了不久,我们可以看到一些简单的人与机械的交互方式。早期最著名的科幻电影,莫过于1927年的 Fritz Lang的 Metropolis(大都会)。在这部电影里,高度工业化的大都会里存在两个阶级:思考者与工人。在下面的图中可以看到,影片中地表工人的命令通过机器上的视觉信号传递给地下工人。在这个阶段,对于工业的理解,仍然是人为机械工作,而没有意识到机器是为人类服务的。
大都会中的人机(械)界面

大都会中的人机(械)界面

再后来,随着电视的出现,一些科幻剧集开始流行,在伟大的StarTrek开始之前,德国的科幻剧集Raumpatrouille Orion 便已经取得了巨大的成功。在这部片子里出现了很多有意思的设计,比如说和工作台整合的转笔刀、以及那个用来驾驶飞船的——大熨斗@_@
Space patrol中的“熨斗型”操作杆
1978年的剧集Battlestar Galactica(太空堡垒-卡拉狄加)中的控制方式更加贴近当时的科技水平,比如其中的控制台十分接近于NASA的控制中心(如图)、显示器、键盘、电话,已经很自然的融入到机舱之中。
太空堡垒-卡拉狄加中的控制台

太空堡垒-卡拉狄加中的控制台

引领人机交互潮流

电影中出现的一些先进交互方式数不胜数。有一些并已经开始在现实生活中普及开来,比如语音界面、指纹识别、虚拟现实等;还有一些距离商业化还很遥远,比如自然交互界面、身份识别、三维显示。
语音界面
在最初,最受科幻片制作者欢迎的恐怕就是语音识别了,原因很简单,语音界面最直观,更重要的是,非常省钱——不需要任何特效,只需演员们装模作样,就能塑造出未来世界的高科技感。例如在Startrek: Next Generation里面,电脑几乎完全由语音控制。
指纹识别:
指纹识别这个在80年代还是比较高级的概念,如今已经高度商业化,不少高端笔记本电脑都配备了指纹识别功能。但在电影里,关于指纹识别的画面仍然很频繁,如Bourne’s Identity(波恩的身份)。
Bourne's Identity里的掌纹识别

Bourne's Identity里的掌纹识别

虚拟现实:
Keanu Reeves拍过两部著名的cyber-punk电影:Matrix和 Johnny Mnemonic。在Matrix里他被特工追的到处乱窜,在Johnny Mnemonic里,却反过来扮演特工,戴着虚拟现实头盔,从虚拟的3D互联网世界获取情报。
增强现实:
与虚拟现实有所不同,增强现实是在现实中引入虚拟的界面,比如在头盔护目镜上投射出一些文字和图表。如今该研究领域已经有长足的进步,前一阵火到爆的six sense以及微软推出的surface,都是很好的代表。
科幻电影中,尤其是在机械盔甲类的电影中,如Iron Man,若没有增强现实的特效,定会让影片逊色不已。另外,像全息投影的博物馆解说员,也可以认为是一种增强现实的技术。
Time Machine里面的博物馆解说员

Time Machine里面的博物馆解说员

自然交互界面:
在现实中,关于自然交互的研究目的主要是帮助残疾人,但是电影里,基本上一已经成为了生活中不可分割的一部分。
请看Keanu Reeves的两部电影中关于脑机接口的两个例子:在Johnny Mnemonic里,主人公用自己的大脑作存储设备,保护着事关人类命运的机密信息;在Matrix里,人类的大脑直接和电脑相连,接入一个完全虚拟的20世纪世界,人类靠幻想生活,机器靠人体供电。
Matrix里Neo背后的联网插口

Matrix里Neo背后的联网插口

如今,脑机接口虽然听起来很遥远,但实际上已经有了巨大的进步,如柏林脑机界面(Berlin Brain Computer Interface)项目,已经可以利用脑电波进行打砖块游戏(youtube),或者打字(youtube)。

另一个火爆的例子是手势控制,Avatar,District9, Minority Report里面都出现了同类界面,详细的分析请看yusen的大作:手势控制:未来?
身份识别
身份识别如果成为了电影里的核心要素,一般是带着集权或者歧视的标签出现。Logan’s Run这部电影讲述了一个未来的河蟹社会,每个公民唯一的目的就是享乐,但是代价是每个人一到30岁,就要在一个盛大的仪式被杀死。为了避免恐慌和反抗,大家被告知,每个人都会立即重生。所有的婴儿在刚出生的时候都会被在掌心植入一个芯片,用于跟踪和监视年龄。电影里的芯片原型,便类似现在为生活提供了极大的便利的RFID芯片。
Gattaca中,主人公为圆太空梦,在“基因控制论”的社会里,伪造身份,奋发图强,通过自身的努力和与基因审查(血液、毛发)的斗智斗勇,最终完成梦想。
全息投影:
早期最著名的全息投影,是Star Wars里面的Leia公主。在特效登峰造极的Avatar里的哈利路亚山,以及Matrix里面,船员们观看电子乌贼的行踪,都应用了三维成像;近几年全息投影技术发展迅猛,不久前,夏普已经宣布要生产可以裸眼观看的3D效果电视面板,摩托罗拉也申请了可以立体化键盘的裸眼3D手机
不过说实话,与投影相比,我觉得X-men里的物理界面更酷。
X-men里面的物理显示界面

X-men里面的物理显示界面

现实生活中,相同的特效已经在北京奥运会有了完美的人肉山寨。

人肉3D物理界面

人肉3D物理界面

同根兄弟

艺术与科技在很多时候互相刺激,共同进步,在科学为艺术提供支撑的同时,艺术家的想象力会促进很多产品的发展。
我们从很多高科技产品的名字上就可以看出其灵感来源:世界上第一个翻盖手机:Motorola的Startac,其命名是为了纪念StarTrek中的便携通讯器概念。Honda的畅销机器人命名为Asimo,则是向发明了Robotics概念的Asimov致敬。
对于一些HCI方式的起源,有些时候,很难分清楚先有鸡先有蛋。但他们却经常保持某种形式上的一致。
在1987年的Star Trek: Next Generation里,可以注意到三种分类明确的显示器:
  • Tricorder,尺寸很小,装有感应器,用于野外的数据分析,非常类似曾经风靡的PDA
  • Tablet,装于机器甲板,像一张纸,活脱脱的一个iPad
  • 显示墙,到处都是,用于展现信息。剧集中还有一幕是医生通过光笔,从tablet向光幕传送数据
    从tablet向显示墙传送文件

    从tablet向显示墙传送文件

与之相对的是著名的Xerox PARC实验室几乎在同时进行的ParcTab项目,在其中,设备被分为三种: Tabs, Pads (知道iPad的名字的历史渊源了吧),以及Boards。其大小、功能正好对应着StarTrek里的上述三种哦功能设备。不知是否为巧合。

施瓦辛格在的Total Recall里的家里装有一个超大的电视墙,生活时上面显示着美丽的风光画或者和周围物体融为一体,在需要用的时候则转变成电脑。这个概念,与FraunhoferIIS(弗朗霍夫学会)i-Land项目中的DynaWall,以及Stanford的iRoom项目里的大显示器都很相像。

示例:少数派报告

少数派报告作为第一部邀请HCI科学家参与电影制作来塑造未来生活的电影,值得我们着重的介绍一下。
拍摄前,电影的视觉设计师Alex McDowell特意走访了MIT media lab,观看了各种姿态识别的前沿技术,他的希望是,观众可以看到一个consumer-based, very market-driven, taking today’s technogical trends to their logical conclusion的未来社会。同行的斯皮尔伯格成功说服了John Underkoffler,一位著名的手势识别专家,以及Jaron Lanier(Virtual Reality这个词就是此哥创造)加入Minority Report团队,组成了“think tank”小组,一起脑爆2048年的人机界面。通过他们的努力,我们才得以在电影中见到了各种新奇的人机交互方式。
可触用户界面:
在电影中,罪犯与受害人的姓名被刻在一个小球上,像中奖后的彩票般滚到Tom Cruise旁边。这个方式模仿的是92年RCA London的Gary Bishop发明的“大理石电话答录机 ”,在这个设计里,电话留言会以小球的形式表现,每次将小球移到一个凹槽里,就会播放。
身份识别:
在这里,身份识别被用于定制化的广告及服务。当主角走出地铁站时,他的身份通过地铁站的视网膜识别,各种广告呼唤着他的名字以吸引他的注意力。同时当他步入服装店时,他的身份同样被识别,虚拟销售员向他询问他是否对之前的产品满意,并推荐相关产品。类似的服务我们在Amazon一类的购物网站上已经见怪不怪,但是在实体店中还比较罕见。
picture-16
手势识别与超大屏幕:
同样,手势识别已经由yusen进行了充分的介绍,我就不在这里多说了。
picture-17
另一个亮点是从透明的屏幕向透明存储片进行的非常直观的信息传送。与之相似的实际实践是Jun Rekimoto 的DataTiles
……

尾声

真没想到最后吭哧吭哧的居然写了这么多,直到精疲力尽,太不符合懒人的风格了。
最后,趁着今天iPad在美国开始发售,赶紧给大家几张iPad在Star Trek里的客串照:

PADD,2151年

PADD,2151年

联邦专用PADD 2373年

联邦专用PADD 2373年

PADD,2375年

PADD,2375年

PADD展示植物园攻略(Google map?),2371年

PADD展示植物园攻略(Google map?),2371年

按照在片中的设定,这些电子设备中最早的也是出现在2151年,想到我们在有生之年,就能用到当年只存在人们对遥远未来的幻想中的设备时,真是很幸福的一件事。
参考文献:

The Three Paradigms of HCI

懒人有禅上曾经有过一次对“Three Waves of HCI”的讨论,猛击这里

今天看到一篇07年的论文 The Three Paradigms of HCI,对“HCI的三波”有新的解读,文章娓娓道来,很有说服力。(直接复制粘贴了,懒人有禅嘛,哈利路亚)

1st Paradigm: Man-Machine coupling

The goal of work in this paradigm is to optimize the fit between humans and machines; the questions to be answered focus on identifying problems in coupling and developing pragmatic solutions to them.

2nd Paradigm: Mind-Computer symmetric, coupled info processor

It is oriented around the idea that human information processing is deeply analogous to computational signal processing. It put emphasis on a set of information processing phenomena or issues in computers and users such as ‘how does information get in’, ‘what transformations does it undergo’, ‘how does it go out again,’ ‘how can it be communicated efficiently’ etc.

3rd Paradigm: phenomenologically situated

其实吧,就是context sensitive

这段话说得很好:The 1st  and 2nd  paradigms acknowledge context primarily as “those non-technological factors that affect the use of the technology.” Under the 3rd paradigm, we ask not “how does context give our design meaning?” but instead “how does our design accommodate the context?” This latter question includes what we do not put into our design, our restraint, or “zensign.” It also encompasses the possibility that the technological system is reported not because it is particularly unique or attractive, but because of how it fits into the particulars of a complex situation. A consequence of this is that context is a central component not only to the problem (if any) but also to design and evaluation.

附表一张:

3paradigms

Three waves of Human Computer Interaction

The field - Human Computer Interaction is changing bit by bit from the very beginning to what it is now. Susanne Bødker gave us some hints on how it is shifting from interface/usability to user experience in the paper “When second wave HCI meets third wave challenges”. It can be generally classified as three waves:

1st wave (~1980s), a wave of “User”:
Rigid | Guidelines | Cognitive emphasis
Unity of everything on the desktop | “User” vs “System”
Human factors | Ergonomics
Usability testing | Controlled experiments
As we can see it is too narrow.

2nd wave (~1990s),  a wave of “Human”
Context(boundaries) | Workspace(in the expansive sense)
Distributed cognition | Activity theory
Participatory design | Contextual inquiry
Ethnomethodology | Design-as-science
Human vs User
Sure, it is too “work” and rationality focused.

3rd wave (~2000s), a wave of “Lifeworld”
Experience | Emotion | Context (loosely defined)
Leisure | Arts | Home | Life
Non-rational | Non-goal-oriented
Cultural studies | Design ethnography | Design-as-art
Might be a little bit artsy-fartsy.

A great example for 3rd wave will be Siftables on Ted

The challenge here is how we could “twist” and position those theories and knowledge from 2nd wave to better facilitate the development of 3rd wave. Might be that is what 4th wave should be, maybe not.

Take a minute and think about what 4th wave will be…

Referrence:
Bødker, S. (2006). When second wave hci meets third wave challenges. In NordiCHI ‘06: Proceedings of the 4th Nordic conference on Human-computer interaction, pages 1-8, New York, NY, USA. ACM Press.