

网络时代的福尔摩斯
作者:鲁伊(文 / 鲁伊)
报警信息的自动比较处理为警方的工作带来方便
iRobot公司生产的机器人
在刚刚过去持续21天的华盛顿连环枪击案中,警方对多达10.7万条报警电话信息的处理不力曾经成为媒体、公众,甚至是嫌疑人诟病的焦点。不过,当联邦调查局局长罗伯特·缪勒在案后接受媒体访问时,却暗示这一切将会得到改进——其中,由亚利桑那大学人工智能实验室主任、美籍华人科学家陈炘跃开发出的Coplink系统将扮演重要角色。
其实,早在包括美国军方、联邦执法官员、各州执法官员和当地执法人员全力投入到对连环杀手的追捕过程中,来自各方的数目极为巨大的线索就已经让执法人员甚为头痛。每个人都知道,任何一条信息都可能至为关键,而将这些散乱信息整合起来、彼此关联更是破案的重中之重。然而,如此繁重的工作却远非,一个人或是几个人所能胜任。即使取得局部成果,信息的共享也是一个问题。在这时候,美国司法部的研究和开发部门——美国国家司法协会(NIJ)——向参与连环枪击案调查的相关部门推荐了被称为“犯罪调查领域的Google”的Coplink系统。
在两名嫌疑人被捕之时,Coplink还没有全部完成安装。但这并不意味着它没有用武之地。实际上,在未来调查过程中,Coplink将帮助警方以前所未有的高效率完成对嫌疑人犯罪历程的追踪。
目前,来自包括联邦调查局的Rapidstart在内的各方数据库系统中的信息都已经被下载到Coplink的数据库中。汇集在一起的各种数据将被自动比较,而程序会将存在关联的各个线索联系起来。它能够根据信息关联性将其制成数据列表或是图表,显示出那些容易被人忽略的不同案件中哪怕是极其微小但却关键的相同之处。
事实上,在此前一些案件中,Coplink已经显示出了自己的威力。在接受《纽约时报》记者采访时,正在负责将Coplink商业化的知识计算公司的总裁罗伯特·格利菲尼介绍了这一系统在侦破发生在图森的一起谋杀案中扮演的重要角色。在那起案件中,一个男人被人切断了喉管,并被汽车碾过身体。当被发现时,他依然活着,并在被送往医院前告诉现场围观者——“这是‘矮子’干的”。警方将“矮子”这个名字输入到Coplink数据库中,搜索它与被害人的联系。几分钟之内,Coplink就给出了结果:被害人曾经与这个“矮子”共同在监狱中服刑。
以往需要警方耗费多日的搜寻工作一下子变得如此简单,甚至一个没有经验的新手,在Coplink的辅助下,都可能成为福尔摩斯式的神探。在连环枪击案中大显神威的蒙哥马利郡警官坎宁安在见识了Coplink的威力后,对记者感叹道:“科技在执法中的作用越来越重要了。”
其实,像Coplink这样可以充当“电子执法官”的软件已经日益成为我们日常生活的一部分。麻省理工学院人工智能实验室主任罗德尼·布鲁克斯创办的iRobot公司可能是公众知名度最高的一家。虽然更多为公众所知的是这家公司研制的机器人在“9·11”世贸大楼倒塌后现场救援和前不久埃及金字塔内部探测中的突出表现,但实际上,在阿富汗战场上,它们也发挥了巨大作用。在军队正式进驻阿富汗的众多山洞前,这些机器人便承担起了先遣队的责任。而在许多美国城市里,机器人警探也成为新兴的安全卫士。
目前,在美国,只有图森警察局在全郡范围内安装了Coplink系统。其他六七个城市也已经尝试将Coplink引入其现有的计算机系统。将该系统引入现有计算机系统及培训相关人员的费用根据不同情况,可能在4万美元到20万美元之间。随着华盛顿连环枪击案调查的逐步深入,Coplink的强大功能将会被更多人所了解并进而使用,而这是研究人员非常愿意看到的。一个基本常识是,获得的数据越多,Coplink就越能更好地发挥其威力,而加强不同执法机关间的协作,对于目前越来越趋向复杂化的犯罪来说,是至关重要的。
专访Coplink设计者陈炘钧教授
三联生活周刊:您从什么时候起开始从事Coplink系统的研制开发?
陈炘钧:Coplink的核心技术可追溯到我们实验室从1992年开始从事的美国国家科学基金会(NSF)的数字图书馆项目。1997年,在获得美国国家司法协会(National Institute of Justice,简称为NIJ)的资助后,我们将该技术扩展为Coplink应用程序。
三联生活周刊:CopIink所使用的核心技术是什么?
陈炘钧:目前,Coplink使用的技术可以分为几个层次。第一个层次,我们开发了基于XML语言的数据仓库(Data warehouse),用来访问和共享互联网上的信息。在第二个层次上,我们开发了一整套资料搜寻关联规则,用以确定犯罪之间的联系。在第三个层次,我们采用可视化犯罪网络分析和成像技术,来进行自动犯罪网络识别。最后,我们还开发了一个警报代理程序,以便及时将犯罪信息通过笔记本电脑、电子邮件、手机或是寻呼机传送给警方。
三联生活周刊:Coplink被称为犯罪调查方面的Google,这两者在技术上有何相同及不同之处?
陈炘钧:Google使用的技术只同我们的Coplink的第一层次——也就是基于关键词或是Web界面的信息的访问和共享——上有相似之处。它们不具备另外3个层次。Google不“聪明”,而基于高级人工智能技术的Coplink是“聪明的”。我们是货真价实的“法律实施领域的超级Google”。
三联生活周刊 :有人担心,Coplink的使用可能会构成对个人隐私的侵犯,对此您如何看待?
陈炘钧:这是一个警方需要谨慎对待的问题。因为我们的工具功能非常强大,必须进行适当的人员培训并在政策上制定保护措施,才能够避免可能产生的负面效应。
三联生活周刊:Coplink会不会商业化?
陈炘钧:会。知识计算公司(Knowledge Computing Corporation)目前就在进行Coplink系统的商业化运作。同时,我们对亚洲,尤其是中国市场也有强烈的兴趣。我们已经同上海的某些公司讨论过该项技术获得许可的可能性问题。Coplink的专利技术对于跟踪调查中国近些年来频发的经济犯罪可能会非常有用。
三联生活周刊:能否介绍一下您所在的人工智能实验室的情况?目前,正在研究的主要课题有哪些?
陈炘钧:Coplink只占我们实验室工作的1/3,在此之外,我们在数字图书馆和知识管理(KM)研究领域非常活跃,这占我们工作的另外1/3。另外,在为寻找药物和疗法的基因图谱的生物医学数据搜寻和文本搜寻领域,我们取得的进步也相当显著。目前,亚利桑那大学人工智能实验室共有8位研究生导师、15名博士生和20名硕士生一同工作。我要特别指出的是,我的许多非常优秀的学生都来自清华、北大和上海交大这样的中国名牌大学(在15名博士生中占8个)。我也希望有更多学生到我们的实验室来——我们的薪水很不错,工作也很有趣。
陈炘钧(Hsinchun Chen),美国亚利桑那大学管理信息系统(MIS)迈克莱伦教席教授,人工智能实验室主任,霍夫曼电子商务实验室主任。1989年在纽约大学获得信息系统博士学位,次年创立亚利桑那大学人工智能实验室。在数字图书馆和知识管理研究领域享有国际声誉。