6、少就是多老练的英国管家

1980年12月，魏思纳和我在鹿内信隆（《产经新闻》、富士电视台前会长）可爱的乡间别墅作客。别墅位于日本的箱根地区，离富士山不远。我们深信，参与媒体实验室的创建将使鹿内先生的报纸和电视传媒王国获益良多，因此他会乐于资助媒体实验室的创办。我们更进而相信，鹿内先生个人对现代艺术的兴趣，将和我们试图融合科技与艺术表现、把新发明与对新媒体的创造性应用结合在一起的梦想不谋而合。

晚餐前，我们一边散步，一边欣赏鹿内先生着名的户外艺术收藏，这里在白天是箱根露天美术馆。当我们与鹿内夫妇一起共进晚餐时，鹿内先生的私人男秘书也在一旁陪同。鹿内先生对英文一窍不通，他的秘书却能说一口漂亮的英语，在我们的沟通中担任重要的角色。魏思纳先打开话头，说他对卡尔德的作品很有兴趣，然后介绍了麻省理工学院和他自己与这位大艺术家的渊源。秘书听完整个故事后，再从头到尾用日文翻译一遍，鹿内先生仔细聆听。最后，鹿内先生沉吟片刻，然后抬起头来，看着我们，好像幕府将军一样发出“喔——”的声音。

秘书于是翻译道：“鹿内先生说，他也很欣赏卡尔德的作品，他最近买到的作品是在……”且慢，鹿内先生说过这些话吗？

整个晚餐中，这样的情形一再出现。魏思纳先说几句话，秘书把它全部译成日文，鹿内先生的回答差不多都是千篇一律的“喔喔——”，但秘书却有办法译出一大堆解释来。那天晚上，我告诉我自己，假如我要制造一部个人电脑，它一定要跟鹿内先生的秘书一样能干。它必须具有能细致入微地了解我和我身边环境的功能，能够自动引申或压缩信号，因此大多数场合，我反而成为多余的了。

关于人机界面，我所能想到的最好的比喻就是老练的英国管家。这位“代理人”能接电话，识别来话人，在适当的时候才来打扰你，甚至能替你编造善意的谎言。这位代理人在掌握时间上是一把好手，善于把时机拿捏得恰到好处，而且懂得尊重你的癖好。

认识这位管家的人比一位全然的生客多占了许多便宜。这真是不错。爱因斯坦都帮不上忙能够享受到这种人性化代理人服务的人寥寥无几。我们平日更常见到的一种类似角色是办公室的秘书。假如秘书很了解你和你的工作，他就能非常有效地充当你的代表。

假如有一大秘书生病了，临时工介绍所即使把爱因斯坦派来，也会于事无补。因为重要的不在于智商，而在于彼此之间有没有共识，以及当秘书运用这种共识时，能不能为你的最佳利益着想。

一直到最近，使电脑具备这样的功能仍是遥不可及的梦想，因此许多人并没有把这个概念当成一回事。但是，情势瞬息万变。现在，有不少人认为这样的“界面代理人”

是可行的构想。因此，过去问者寥寥的“智能型代理人”构想现在摇身一变，成为电脑界面设计领域最时髦的研究课题。很显然，人们希望委托电脑来执行更多的功能，不想事事都亲自操作。

我们的构想是设计一个知识丰富的界面代理，它不仅了解事物（某件事情的流程、某个感兴趣的领域、某种做事的方式），而且了解你和事物的关系（你的品味、倾向，以及你有哪些熟人）。也就是说，这部电脑应该有双重特长，就像厨师、园丁和司机会运用他们的技能来迎合你在食物、园艺和驾驶方面的品昧和需求一样。当你把这些工作交由别人执行时，并不表明你不喜欢烹饪、园艺或开车，而是表明你可以选择在你想做的时候做这些事情，并且，这是因为你想做，而不是不得不做。

我们和电脑之间的关系亦是如此。我实在没有兴趣在上网之后先进入一个系统，再通过一堆通信协议，才能找到你的互联网络地址（address）。我只想把讯息传递给你。

同样地，我不希望只为了确认没有错过什么重要信息，就被迫阅读几千个电子公告牌。

我希望让我的界面代理为我代劳。

会有许多数字化管家，他们有些住在网上，有些就在你身边，还存在于组织的中央系统和外围设备中（无论组织是大是小）。

我跟别人讲过，我有二台心爱的智能型寻呼机。它能用完美无缺的英语句子适时地给我传递重要的信息，简直聪明极了。我的办法是，只让一个人拥有寻呼机的号码，所有的信息都通过他来传递，只有他才知道我在哪里、哪些事情比较重要，以及我认识哪些人（和他们的代理人）。智慧来自系统的数据转发器（headend）而不是外围，也不在寻呼机身上。

但是，接收端也应该具有智慧。最近，一个大公司的首席执行官和他的助理来访。

这位助理带着老板的寻呼机，他会在最适当的时机，提醒老板一些急事。这位助理这种老练的、懂得把握时机和慎谋善断的本事，将来都会设计到寻呼机的功能中。《我的日报》

想象一下，假若电子报纸能以比特的形式传送到你的家中，假设这些比特都传送到一个神奇的、像纸一样薄的、有弹性的、防水的、无线的、轻巧明亮的显示器上，要想为这份报纸设计界面，可能需要借助人类多年在制作标题、设计版面上的经验、印刷上的突破、图像处理上的经验及其他许多技术，来帮助读者浏览阅读。做得好的话，它可能会成为一种伟大的新闻媒体；做得不好的话，就会惨不忍睹。

我们可以从另外一个角度来看一份报纸，那就是把它看成一个新闻的界面。数字化的生活将改变新闻选择的经济模式，你不必再阅读别人心目中的新闻和别人认为值得占据版面的消息，你的兴趣将扮演更重要的角色。过去因为顾虑大众需求而弃之不用、排不上版面的文章，现在都能够为你所用。

想想看，未来的界面代理人可以阅读地球上每一种报纸、每一家通讯社的消息，掌握所有广播电视的内容，然后把资料组合成个人化的摘要。这种报纸每天只制作一个独一无二的版本。

事实上，我们在周一早上读报的方式和周日下午截然不同。在工作日里，早上7点钟测览报纸只是过滤信息，从传送给成千上万人的共同比特中，撷取符合个人需要的部分。

大多数人对整版整版的报纸，会看也不看一眼就丢进垃圾桶，对剩下的一些版面稍作浏览，真正细看的部分寥寥无几。

假如有家报业公司愿意让所有采编人员都照你的吩咐来编一份报纸，又会是什么情景呢？这份报纸将综合了要闻和一些“不那么重要”的消息，这些消息可能和你认识的人或你明天要见的人有关，或是关于你即将要去和刚刚离开的地方，也可能报道你熟悉的公司。在这种情况下，假如你确信《波士顿环球报》能提供正好符合你需要的信息，你可能愿意出比100页的《波士顿环球报》高得多的价钱，来买一份只有10页、但专门为你编辑的《波士顿环球报》。你会消耗掉其中每一个比特。你可以称它为《我的日报》

（TheDailyMe）。

但是，到了星期天下午，我们希望以比较平和的心情来看报纸，了解一些我们从来不知道自己会感兴趣的事情，玩玩填字的游戏，看看好笑的漫画，顺便找找大减价的广告。这可以称为《我们的日报》（TheDailyus）。在一个阴雨绵绵的星期天午后，你最不希望看到的，就是有个紧张兮兮的界面代理拼命想帮你去掉看似不相干的信息。

这并不是非黑即白的两种截然相反的状态。我们往往在这两极之间游走，我们会根据手头有多少时间、这是一天中的哪个时刻，以及我们的心情，希望获得较少或更多的个人化信息。设想一个报道新闻的电脑显示器上面有个旋钮，你可以像调节音量一样，调整新闻内容个人化的高低程度。你可以有许多不同的控制钮，包括一个可以左右滑动的钮，让你在阅读有关公共事务的报道时，可以调整报道的政治立场（偏左或偏右）。

如此一来，这些控制钮就改变了你观看新闻的视窗，视窗的大小及其表现新闻的风格都将发生变化。在遥远的将来，界面代理将阅读、聆听、观看每则新闻的全貌。而在不久的将来，这种过滤的过程将借助于信息标题（也就是关于比特的比特）来完成。值得信赖的数字化亲戚在美国，《电视导报周刊》（TVGuide）的利润居然超过所有四家电视网利润的总和。

它所代表的意义是，关于信息的信息，其价值可以高于信息本身。当我们考虑新的信息发送方式时，我们的思维总是拘泥于“随意例览信息”和“来回转换频道”这样的观念，这些观念现在行不通了。当我们有1000个频道的时候，假如你从一个台跳到另一个台，每个台只停留3秒钟，你就几乎要花1个钟头的时间，才能把所有频道从头到尾扫一遍。

还没等你判断出哪个节目最有趣，节目早就播完了。

当我想出去看场电影时，我不是靠读影评来选片，而是问我弟媳的意见。我们都有像这样的亲戚朋友，他们对电影很内行，同时也很了解我们。我们现在需要的就是一位数字化的亲戚。

事实上，这种体现为人帮人的“代理人”观念，常把专业知识与对你的了解揉合在一起。好的旅行代理人会将其对饭店、餐厅的了解和对你的了解结合起来（线索通常来自于你对其他饭店和餐厅的观感）。房地产代理人会从一系列或多或少能够满足你口味的房子中，推测出你喜欢的家居模式。现在，来想象一下电话应答代理人、新闻代理人或电子邮件管理人吧！他们的共同点都是能够模仿你做事的方式。

这不只是填一份调查问卷或对你有一个固定把握那么简单。界面代理人也必须像人类的朋友和助理一样，不断学习和成长。这也是说起来容易，做起来难的事情。直到最近，我们才稍稍了解，应该如何让脑模型学习有关人的事情。

当我谈到界面代理人时，经常有人问我：“你指的是人工智能吗？”答案是“没错”。

但是这个问题中夹杂着些微的怀疑，主要是因为过去人工智能给人们许多虚无的希望和过高的承诺。此外，很多人对机器能够拥有智慧这样的观念，仍然深感不安。

大家公认阿伦.图宁（A1anTuring）在他1950年发表的论文《计算机器与智能》中首次认真地提出机器智能这个概念。后来，马文.明斯基等先驱继续在纯粹人工智能的研究上进行深入的探讨。他们向自己提出许多问题，诸如如何识别文本、了解情绪、欣赏幽默，以及从一组隐喻推出另一组隐喻。比如在0，T，T，F，F这一连串英文字母之后，根据内在逻辑，应该接哪些字母？

1975年左右，当计算资源开始有能力解决直觉问题，并且表现出智能行为时，人工智能的研究却滑向低谷。当时的科学家选择研究机器人技术（例如证券交易和民航订位系统）这样的容易做到、而且有市场的应用技术，因此更深奥而根本的人工智能与学习问题，反而无人问津。

明斯基很快指出，即便今天的电脑已经能异常出色地掌握班机订位状况（一件差不多越出逻辑系统以外的事情），它们仍然无法表现出一个三四岁的小孩就具备的常识。

它们讲不出猫和狗有什么分别。像常识这样的课题，如今已经从科学研究的后台走到了舞台中央。这一点非常重要，因为毫无常识的界面代理人会让你感觉有如芒刺在背。

顺便提一下，前面提到的那个接字母的问题，答案应该是S。这个顺序来自于英文数字排列one（一）、two（二）、three（三）、four（四）、five（五）、six（六）、seven（七）……中每个词的第一个字母（0，T，T，F，F，S，S）。从集权到分权许多人往往把未来的界面代理人看成小说家乔治.奥威尔笔下中央集权、无所不知的机器。其实，更可能出现的是许多电脑程序和个人化工具的组合，每一种工具都善于做某一类事情并善于与其他程序沟通。这个形象是明斯基1987年出版的《心智的社会》一书的摹本。他在这本书中指出，智能并非存在于中央处理器中，而是在许多具有专门用途、彼此紧密联结的机器的集体行为中产生的。

这个观点打破了许多过去的成见。米切尔.瑞斯尼克在他1994年出版的着作《乌龟、白蚁和交通阻塞》中把这种成见称为“集权心态”。我们受到的强化训练，使我们常把复杂现象归因于某种作用体的一手操纵。比如我们通常都认为“人”字形的鸟群中最前面的那只是头鸟，其余的鸟只是追随领袖而已。事实并非如此。秩序所以形成，是鸟群彼此高度回应的个别行为而产生的集体结果。鸟群只不过遵循了简单的和谐规则，并没有任何一只鸟在中间指挥大局。为了说明他的观点，瑞斯尼克还创造了一些情境，让许多人惊讶地发现自己也陷入了同样的过程之中。

最近我在麻省理工学院的大礼堂中，亲身体验了瑞斯尼克的示范说明。在场的听众大约有1200人。瑞斯尼克要求大家开始鼓掌，而且掌声尽量协调一致。结果，在瑞斯尼克完全没有指挥的情况下，不到2秒钟，整个礼堂中就充满了节奏一致的鼓掌声。你不妨自己试试看，即使在人数少得多的情况下，结果仍然令人目瞪口呆。观众错愕的反应说明，我们对于从独立个体的行动中所产生的协调性的认识是多么肤浅。

这并不是说，为你安排日程的代理人因此毋需和你的旅行代理人协商，就径自安排会议的日程。而是不是所有的信息往来和决定都需要中央权威的批示，这种方式或许不适合民航订位系统，但却越来越被视为一种可行的管理组织和政府的方法。一个结构内部相互沟通、权力分散的程度越高，它的适应力和存活力也就越强，也必然能更加持续地生存与发展。

长时间以来，分权的观念倍受称道，但是实际去做的时候，却寸步难行。互联网络提供了全球性的交流通道，可以不受任何新闻检查的钳制，因此特别盛行于像新加坡这种新闻自由很少、而网络却无所不在的地方。

界面代理人也会像信息和组织一样，逐步迈向分权式的结构。就像军队指挥官派侦察员出去探路或县治安官派出一队保安一样，你也会派遣代理人为你收集信息。代理人会再指派代理人。如此层层推演。但别忘了这个过程是怎么开始的：你把你的要求委托界面来完成，而不是自己一头扎进环球网（WorldWideWeb）中东找西找。

这种未来的模式和加进人性因素的界面设计截然不同。界面的外观和给人的感觉固然重要，但与智能相比就微不足道了。事实上，未来最通行的界面形式将会是塑料或金属上的一个或两个小孔，里面有一个小麦克风来接收你的声音。

还有很重要的一点，就是要认清界面代理人的构想和目前大众对互联网络的狂热以及用Mosaic浏览互联网络的方式之间存在着很大的不同。网络黑客（hacker）可以在这种新媒体上冲浪、探索知识的海洋、沉溺于各种各样崭新的社交方式。这种环球同此凉热的互联网络发烧现象不会减轻或消退，但它只是行为的一种而已，更像在直接操纵，而不是授权代理。

我们的界面却将会出现形形色色的种类。由于大家各有不同的信息偏好、娱乐习惯和社会行为，你的界面会有别与我的界面。大家在巨大的数字生活调色板上，各取所需。