

字节人生
作者:鲁伊(文 / 鲁伊)
戈登·贝尔(右)的下一步目标,是开发出一种便利有效的工具,从而将这个数据库变成有力的记忆辅助工具
有一天,在某会议上,你遇见一个看上去很面熟的人。他的名字似乎就在嘴边,你隐约记得他和你曾有颇为重要的业务往来,他正在向你走过来……他是谁?上一次和他打交道是什么时候?他叫什么?这时候,如果有一台计算机能帮助你记起你经历过的事情,并迅速在你耳边给出提示:嗨,上月23日他和你一起去香格里拉吃饭,打算卖给你一台万能望远镜,他住在万柳,爱吃虾饺云吞面,他就是BM公司的老王——那该有多好!
现在,这样的情景还只能出现在科幻小说中,然而,在位于旧金山的微软湾区研究中心(Microsoft's Bay Area Research Center)中,戈登·贝尔(Gordon Bell)和他的同事正在努力让这一天提早到来。现在,这位计算机技术的领军人物已经把自己68年生命中所有的笔记、信件、论文、照片、唱片、书籍、看过的电视、打过的电话和电子文件都以数字形式存储在硬盘的数据库中。他下一步的目标,是开发出一种便利有效的工具,从而将这个数据库变成有力的记忆辅助工具。
将一生中所有经历过的事情存入数据库,一个必要条件是足够大的硬盘。布什在他著名的文章中给出过一个足够大的标准:“如果一个人每天(向其中)加入5000页的材料,要花几百年的时间才能将硬盘填满。这样,他就可以无所顾忌地自由向其中添加材料。”而在微软研究院,这个标准以更精确的形式表现出来:一个以TB为计量单位的硬盘。TB是Terabyte 的缩写,相当于1000GB。根据预测,在5年之内,这种超大硬盘将变得十分常见,价格也会降到300美元以下,能够为普通计算机用户所接受。
1TB的硬盘是个什么概念?贝尔给出一个易于理解的例子:要在1年时间中填满1TB的硬盘,一个人每天需要存储9800张300K大小的JPEG图片、2900个1MB大小的文档、26个时长1小时速率为256Kb/秒的音频文件、4个时长1小时速率为1.5Mb/秒的视频文件。实际上,截止到目前为止,贝尔的全部资料只占他1TB硬盘中的30GB——不到1/30。
然而,凌乱存放在一起的资料尽管详尽,实际上却是没有意义的。许多资料,可能一辈子都不会再看一次,而另外许多看似无关的东西,人类的大脑却能够在其间建立起联系。这样就需要一个聪明的程序,它不仅可以同时在音频、视频、图像、文本等不同格式的文件中自如地进行搜索,还要拥有分辨相关资料的彼此关联程度的能力。在MyLifeBits中,数据之间并没有严格的结构体系,它们彼此以引用和注释的形式相关联。应用了SQL服务器和提供全文搜索的目录服务器,MyLifeBits就可以实现迅速关联搜索。
有消息显示,微软很可能将在2004年或2005年初取代Window XP的下一代操作系统Longhorn中加入MyLifeBits的数据库/文件系统。这样,当你在电脑上工作时,后台运行的程序就能自动收集并记录相关信息。然而,单独作为产品的MyLifeBits似乎却并不会那么快问世。对此,贝尔在接受《美国新闻与世界报道》采访时给出的时间是2008年。
微软研究院并不是惟一一家从事“Memex”研究的组织。在五角大楼,国防高级研究计划局(DARPA)正在将传感器、摄像机、窃听设备和便携式计算机结合为一体,用以全面捕捉个体生命中的每个细节,并将其汇总为便于搜索的数据库。这个被称为LifeLog的项目的另一个作用是帮助仿真人型机器人的制造。Haystack也是另一种功能上十分类似MyLifeBits的个人信息储存技术。除此之外,正在研究中的类似项目还包括Lifestreams、Placeless Documents等等。看起来,用不了多久,一个Memex时代即将到来。