从因特网到ChatGPT的核心是开源
作者: 王炎
关于ChatGPT
最近媒体炒作起ChatGPT来,有人说这个AI平台将改变人类的未来,有的甚至声称将带来毁灭,恰似前一段炒作“元宇宙”。新技术的推出,会一次次给媒体带来新热点。
从数字技术发展的整个历史来看,数据规模固然非常重要,但已与机械技术时代非常不同。数据、材料、高精技术、头脑卓越的科学精英,这些虽然仍是核心硬件,但“开源”与“共享”的互动模式,才是推进数字技术迭代更新的真正力量。向全社会开放数据与技术,让不同阶层、性别、职业和不同教育背景的用户参与使用,让世界上不同民族、文化、价值观和专业的头脑献计献策,每一次用户访问都是开放平台的一次调试和升级,头脑、数据与设备互动起来,人工智能技术才能不断提高。从20世纪中期互联网发明开始,新的科技逻辑便逐渐渗透到人类生活的方方面面,并最终塑造了21世纪的时代精神:只有开放社会,科技才能进步。
发明互联网
近读美国学者阿贝特所著《发明因特网》,感触颇多。从互联网到ChatGPT的技术逻辑,其实一以贯之的都是开源与共享。
因特网起源于20世纪50年代“冷战”寒彻的美国。美国国防部担心苏联先发制人,以第一轮核打击摧毁美国的通讯网,使白宫无法下达核反击的命令,从而输掉一场核战争——情形恰似库布里克的电影《奇爱博士》(1964),于是成立“美国高级研究计划署”,拨巨款研发抵御核打击的通讯技术。
美国科学家保罗·巴兰提出一个“封包交换”的设想,即设计搭建多重中继通讯线路,以替代从信息中心辐射各地的阶梯式通讯网。他的设想是,让每一个地方的通讯交换节点,均能自主判断通过哪条线路传输信号。这样即使中枢或某条线路被摧毁,通讯网分布在不同地方的智能节点仍能自主运行,从而保证命令的上传下达。这个想法太超前了,颠覆了金字塔式的传统通讯逻辑。但是要求中继节点智能运转,则须由电脑控制,并将模拟信号转化成数字信号,以避免多重连接带来的信号衰减。当年计算机体积大、运算慢、成本高,处理数字信号的能力不够强。最终项目招标的结果是,通讯改造被老牌的AT&T电话公司夺下。AT&T仍保留从控制中枢逐级下达的旧方案,把钱花在深挖洞、加固地下核掩体、提高保护级别、优化线路材质上,而巴兰的设想则被束之高阁。
但几年后,英国科学家读到巴兰的论文,意识到这项技术可别用他途。英国人的兴趣不在军事,而在远程用户如何分享实验室里的大型计算机。当时还没有个人终端电脑,用户要租用科学机构的大型电脑。普通用户需用电话线连接计算机服务器,从自己的终端发来运算指令,付费让大型计算机提供运算服务。商用电话线既昂贵又繁忙,用户发指令时经常遇到占线或发出后阻塞、遗失的情况。同时,用户操作时常会出现间隙,使计算机空闲下来,其运算能力发挥得不够充分。巴兰的封包理论这下派上用场了,可将远程用户的指令切割成小块,按数字信号单位“千字节”,把一条命令分成几个小信息包——即“封包”。这样,由联网的计算机终端充当智能节点,根据线路的忙闲,节点自主选择不同线路分拨小信息包到目的地,然后再组装起来,还原为初始信息,这就是所谓“封包交换”。它不仅解决了线路繁忙问题,还可让多个用户端同时操作,利用封包原理“分时”共享计算机服务器。
军事技术服务于商用,巴兰的初衷是想搭建多重连接的通讯网,提高抗核打击能力,结果却给未来的互联网埋下种子。后来,美国国防部大力资助“阿帕网”,科学家们也秉承兼容开放的理念,让所有民间用户根据自己的需要,时时修改、更新界面上的传输程序。结果,各国的学者、工程师、通讯公司、军事机构、民间企业,甚至大学研究生,经过几十年的切磋、互动,群策群力,从各自的需求出发,以迥然不同的智慧与远见,让网络技术步步升级,一点点搭建起因特网。后来,网络百科和各种网络平台也都承继了这种开放态度。
其实,至今也说不清到底是谁发明了因特网,因为其间没有像牛顿、爱迪生、爱因斯坦或居里夫人式的超级英雄,能一人独慧让万世受益,成为关键性的决定人物。我们也很难确定到底是哪一年实现的全球联网,又是谁最先预见到互联网有改变人类历史的前景。许许多多的“小人物”在日常工作中不经意间与千里之外的陌生人合作,一点点勾勒出覆盖全球的计算机网络。这不是传统单向度的供求关系——少数原创者发明技术供给多数使用者的金字塔模式,而是多向度的互动关系——“用户生成”的平等模式。
中国与国外网络的连接,也是国际合作的结果。1987年,德国电脑技术专家向中国提供西门子电脑,德国学者帮助中科院攻破了一个个硬件和软件难关,才向世界成功发出了第一封电子邮件。之后,他们又帮中国申请“CN”域名,与世界上其他普通用户一样,签署TCP/ IP“传输控制协议”,中国的计算机才连上全球网络,因特网的覆盖面也越来越广。1989年,英国科学家蒂姆·伯纳斯·李创建了“万维网”,以超文本链接开拓出一片广阔的虚拟信息空间,全球用户可随意浏览世界各地的网页,地球变成了一个村庄。

20世纪末,人类告别了机械复制时代,电脑将世界连成一体。从事后来看,我们所谓的全球化,不仅意味着经济与文化一体化,其更坚实的物质基础是数字技术。我们能否据此推断,互联网技术衍生出了与之相应的知识与文化形态?或追问:既然在数字技术史上呈现出去中心化、多元性、多样性、流动性、用户主导以及数据共享的民主化趋势,那么这是否也预示着“知识民主化”时代的到来?
重新估价“博学”的含义
“老师,您讲的内容维基百科上都有。”拿手机的学生淡淡的一句,教授顿觉无地自容。失落的教授变颜正色:“论文不许引用网络资源,网上的信息都是垃圾,没有正经学问。”到了期末,学生照样用搜索引擎搜学术论文的电子版,根据上面的出版信息和页码,注释自己的论文,谁也看不出援引的是纸质出版物还是电子资源。的确,网络资源良莠不齐,可是信息量极大,关键看你会不会搜,实际上并无网上、网下之优劣。
这是学校最普遍的现象,不劳笔墨饶舌。但问题并不在于写论文该如何查文献,或者争论线上、线下哪种知识可靠;问题也不在于纸媒与电子媒体孰优孰劣,此乃器物、枝节之争,未触及深层的历史性断裂。我们或许应该问:互联网出现后如何面对硕大无朋的电子记忆?在电子记忆时代,“学习”是否与以前的含义不同?甚至要思考:网络知识时代,什么才算“真有学问”?
我们耳熟能详的是文明的延续有赖于文化传承,传承是知识薪火相传。一代又一代人上学、读书、进图书馆、欣赏艺术、传播资讯、写作或做科学实验,无一不需要记忆力与创造力。所以,考试不允许带电子设备,学生要凭大脑记忆与思辨力回答试题;评估学术机构时也要考察图书馆规模,衡量精神遗产的藏量;考评高等教育与科研机构等级时,要统计学术成果发表数量,量化科学文化的贡献。但如今,电子记忆渗透到生活的各个方面,学术成果和文献都已电子化,维基百科、百度百科上无所不包,大家都在网上搜索学术资源,那么我们是否仍然需要百科全书式的学者?换言之,数字时代一定要固守机械时代的评价标准吗?
网络新知识型
早在1935年,人文气质十足的瓦尔特·本雅明被电影这门充斥技术“铜臭”的艺术所震惊,写下《机械复制时代的艺术品》一文。他追溯一场在19世纪关于绘画与摄影艺术孰高孰低的争论。那时人们认为摄影不算艺术,推及电影也不会有深度。但到1920年代末,电影进入有声时代后,电影叙事日臻成熟,到1930年代便步入了黄金时代。站在历史的转折点上,本雅明发现前一个世纪的争论不得要领,摄影算不算艺术是个伪问题;真命题应该是,摄影出现后,整个艺术史不可逆转地拐入新轨道,世界迎来了机械复制时代。而那场论争不过表征了历史转折的时代焦虑而已。

受本雅明的启发,我们或许也该重新设置一下问题:与其争论线上、线下哪种知识更可靠,不如探讨一下,互联网出现之后,整个人类的知识结构是否随之发生变化?接着还可以问:既然互联网“供给”与“索取”知识的方式不同以往任何一个时代,那么传统的知识论是否还有效?近100年前,本雅明揭示出机械复制时代的新艺术形式与新知识型,那么,经历了数字革命后,他以媒介技术为切入点分析艺术的独到角度,似可启发我们寻觅知识转型的隐幽线索。或许我们可以追问:数字技术也能像机械复制技术那样重塑一个时代的知识论吗?本雅明说,照相技术让艺术的神韵消失了。那么,经历了模拟(复制)转数字的革命之后,文化形态又会发生怎样的转变?
从机械复制时代到数字网络时代
技术与文化本属两种性质不同的领域,彼此如何相互影响?新媒体艺术理论家列夫·曼诺维奇所著《新媒体的语言》一书系统阐述了电脑媒介对文化的塑造过程。我们这个时代所有的文化基础都将被电脑化,因特网成为全球化最实在、最显著的标志。这是一场最深刻的媒介革命,从文化生产、发行到市场流通,一切均由电脑做媒介。无论是获取或操纵文化数据,还是存储文化素材,也不管你采用文本、图片、视频、音频等何种格式,都必须先将资料转成数据,电脑才能够读取,我们也才能够使用。将文化的所有形态转译成二进制数字,是人类文化的未来宿命。
模拟转数字,是这场革命最深刻的断裂。回到本雅明的复制(或模拟)时代,电影是连续拍摄多个静态的照片,储存在长长的化学胶卷上,声音存入磁性声道。放映时,放映机用与拍摄相同的速率,连续读取胶卷上的一个个画面,再用强光投射到大银幕上。肉眼被高速运转的画面所欺骗,误以为银幕上的幻象是连续运动的,这是模拟方式再现的世界。到了数字时代,数字镜头将对象物反射的光线投射到感光器件上,光线被转化成电荷,再由“模数转换器”处理成二进制数字,存储在记忆芯片上。这是“数字化”过程。我们每天接触的各种文本格式、图像、视频、音频、网页、通讯信号,都统统由一堆二进制数码构成。
本雅明虽然不可能预见电影的数字宿命,但他所做的复制时代与前复制时代的艺术形式之间的比较,却发人深省。他说绘画以线条勾勒对象世界,是整体性地把握现实;而电影却把绵延的时间分割成一帧帧彼此独立的画幅,然后剪辑拼接,演员因此失去对情节的整体把握,剪辑师将其表演支离破碎地编织到银幕重构的世界里。而曼诺维奇则认为,复制技术正呼应了工业革命促生的生产模式:福特的第一条生产流水线(1913)便是大工业时代的经典范式——零部件标准化,生产过程被分割成一个个不断重复的简单劳动岗位,每一工位前后串联起来,便形成流水线。工人无需理解全过程,只须天天重复同一工种,便速成熟练工人。流水线上的工人随时可被替代,正像卓别林的电影《摩登时代》一样。
到了数字时代,世界进入后工业社会,数字媒体同样也呼应了后工业的逻辑。曼诺维奇的观点是,后工业生产的逻辑是所谓“按单定制 ”与“按进度配送”。网络经济以信息、传媒为先导,网络电商投巨资收集用户信息和消费行为习惯,有针对性地推送广告,精准投送产品。
从1950年代、1960年代的信息服务经济,向1970代的后工业转型,至1990年代的网络经济,文化便一直随经济形态的变化而一次次转向,这不正符合马克思的“经济基础决定上层建筑”吗?如果所有文化典籍、教育内容和传播信息都被电脑化并上传网络,那么将来谈文明的属地性与语境化还能成立吗?