从因特网到ChatGPT的核心是开源

关于ChatGPT

最近媒体炒作起ChatGPT来，有人说这个AI平台将改变人类的未来，有的甚至声称将带来毁灭，恰似前一段炒作“元宇宙”。新技术的推出，会一次次给媒体带来新热点。

从数字技术发展的整个历史来看，数据规模固然非常重要，但已与机械技术时代非常不同。数据、材料、高精技术、头脑卓越的科学精英，这些虽然仍是核心硬件，但“开源”与“共享”的互动模式，才是推进数字技术迭代更新的真正力量。向全社会开放数据与技术，让不同阶层、性别、职业和不同教育背景的用户参与使用，让世界上不同民族、文化、价值观和专业的头脑献计献策，每一次用户访问都是开放平台的一次调试和升级，头脑、数据与设备互动起来，人工智能技术才能不断提高。从20世纪中期互联网发明开始，新的科技逻辑便逐渐渗透到人类生活的方方面面，并最终塑造了21世纪的时代精神：只有开放社会，科技才能进步。

发明互联网

近读美国学者阿贝特所著《发明因特网》，感触颇多。从互联网到ChatGPT的技术逻辑，其实一以贯之的都是开源与共享。

因特网起源于20世纪50年代“冷战”寒彻的美国。美国国防部担心苏联先发制人，以第一轮核打击摧毁美国的通讯网，使白宫无法下达核反击的命令，从而输掉一场核战争——情形恰似库布里克的电影《奇爱博士》（1964），于是成立“美国高级研究计划署”，拨巨款研发抵御核打击的通讯技术。

美国科学家保罗·巴兰提出一个“封包交换”的设想，即设计搭建多重中继通讯线路，以替代从信息中心辐射各地的阶梯式通讯网。他的设想是，让每一个地方的通讯交换节点，均能自主判断通过哪条线路传输信号。这样即使中枢或某条线路被摧毁，通讯网分布在不同地方的智能节点仍能自主运行，从而保证命令的上传下达。这个想法太超前了，颠覆了金字塔式的传统通讯逻辑。但是要求中继节点智能运转，则须由电脑控制，并将模拟信号转化成数字信号，以避免多重连接带来的信号衰减。当年计算机体积大、运算慢、成本高，处理数字信号的能力不够强。最终项目招标的结果是，通讯改造被老牌的AT&T电话公司夺下。AT&T仍保留从控制中枢逐级下达的旧方案，把钱花在深挖洞、加固地下核掩体、提高保护级别、优化线路材质上，而巴兰的设想则被束之高阁。

但几年后，英国科学家读到巴兰的论文，意识到这项技术可别用他途。英国人的兴趣不在军事，而在远程用户如何分享实验室里的大型计算机。当时还没有个人终端电脑，用户要租用科学机构的大型电脑。普通用户需用电话线连接计算机服务器，从自己的终端发来运算指令，付费让大型计算机提供运算服务。商用电话线既昂贵又繁忙，用户发指令时经常遇到占线或发出后阻塞、遗失的情况。同时，用户操作时常会出现间隙，使计算机空闲下来，其运算能力发挥得不够充分。巴兰的封包理论这下派上用场了，可将远程用户的指令切割成小块，按数字信号单位“千字节”，把一条命令分成几个小信息包——即“封包”。这样，由联网的计算机终端充当智能节点，根据线路的忙闲，节点自主选择不同线路分拨小信息包到目的地，然后再组装起来，还原为初始信息，这就是所谓“封包交换”。它不仅解决了线路繁忙问题，还可让多个用户端同时操作，利用封包原理“分时”共享计算机服务器。

军事技术服务于商用，巴兰的初衷是想搭建多重连接的通讯网，提高抗核打击能力，结果却给未来的互联网埋下种子。后来，美国国防部大力资助“阿帕网”，科学家们也秉承兼容开放的理念，让所有民间用户根据自己的需要，时时修改、更新界面上的传输程序。结果，各国的学者、工程师、通讯公司、军事机构、民间企业，甚至大学研究生，经过几十年的切磋、互动，群策群力，从各自的需求出发，以迥然不同的智慧与远见，让网络技术步步升级，一点点搭建起因特网。后来，网络百科和各种网络平台也都承继了这种开放态度。

其实，至今也说不清到底是谁发明了因特网，因为其间没有像牛顿、爱迪生、爱因斯坦或居里夫人式的超级英雄，能一人独慧让万世受益，成为关键性的决定人物。我们也很难确定到底是哪一年实现的全球联网，又是谁最先预见到互联网有改变人类历史的前景。许许多多的“小人物”在日常工作中不经意间与千里之外的陌生人合作，一点点勾勒出覆盖全球的计算机网络。这不是传统单向度的供求关系——少数原创者发明技术供给多数使用者的金字塔模式，而是多向度的互动关系——“用户生成”的平等模式。

中国与国外网络的连接，也是国际合作的结果。1987年，德国电脑技术专家向中国提供西门子电脑，德国学者帮助中科院攻破了一个个硬件和软件难关，才向世界成功发出了第一封电子邮件。之后，他们又帮中国申请“CN”域名，与世界上其他普通用户一样，签署TCP/ IP“传输控制协议”，中国的计算机才连上全球网络，因特网的覆盖面也越来越广。1989年，英国科学家蒂姆·伯纳斯·李创建了“万维网”，以超文本链接开拓出一片广阔的虚拟信息空间，全球用户可随意浏览世界各地的网页，地球变成了一个村庄。

20世纪末，人类告别了机械复制时代，电脑将世界连成一体。从事后来看，我们所谓的全球化，不仅意味着经济与文化一体化，其更坚实的物质基础是数字技术。我们能否据此推断，互联网技术衍生出了与之相应的知识与文化形态？或追问：既然在数字技术史上呈现出去中心化、多元性、多样性、流动性、用户主导以及数据共享的民主化趋势，那么这是否也预示着“知识民主化”时代的到来？

重新估价“博学”的含义

“老师，您讲的内容维基百科上都有。”拿手机的学生淡淡的一句，教授顿觉无地自容。失落的教授变颜正色：“论文不许引用网络资源，网上的信息都是垃圾，没有正经学问。”到了期末，学生照样用搜索引擎搜学术论文的电子版，根据上面的出版信息和页码，注释自己的论文，谁也看不出援引的是纸质出版物还是电子资源。的确，网络资源良莠不齐，可是信息量极大，关键看你会不会搜，实际上并无网上、网下之优劣。

这是学校最普遍的现象，不劳笔墨饶舌。但问题并不在于写论文该如何查文献，或者争论线上、线下哪种知识可靠；问题也不在于纸媒与电子媒体孰优孰劣，此乃器物、枝节之争，未触及深层的历史性断裂。我们或许应该问：互联网出现后如何面对硕大无朋的电子记忆？在电子记忆时代，“学习”是否与以前的含义不同？甚至要思考：网络知识时代，什么才算“真有学问”？

我们耳熟能详的是文明的延续有赖于文化传承，传承是知识薪火相传。一代又一代人上学、读书、进图书馆、欣赏艺术、传播资讯、写作或做科学实验，无一不需要记忆力与创造力。所以，考试不允许带电子设备，学生要凭大脑记忆与思辨力回答试题；评估学术机构时也要考察图书馆规模，衡量精神遗产的藏量；考评高等教育与科研机构等级时，要统计学术成果发表数量，量化科学文化的贡献。但如今，电子记忆渗透到生活的各个方面，学术成果和文献都已电子化，维基百科、百度百科上无所不包，大家都在网上搜索学术资源，那么我们是否仍然需要百科全书式的学者？换言之，数字时代一定要固守机械时代的评价标准吗？

网络新知识型

早在1935年，人文气质十足的瓦尔特·本雅明被电影这门充斥技术“铜臭”的艺术所震惊，写下《机械复制时代的艺术品》一文。他追溯一场在19世纪关于绘画与摄影艺术孰高孰低的争论。那时人们认为摄影不算艺术，推及电影也不会有深度。但到1920年代末，电影进入有声时代后，电影叙事日臻成熟，到1930年代便步入了黄金时代。站在历史的转折点上，本雅明发现前一个世纪的争论不得要领，摄影算不算艺术是个伪问题；真命题应该是，摄影出现后，整个艺术史不可逆转地拐入新轨道，世界迎来了机械复制时代。而那场论争不过表征了历史转折的时代焦虑而已。

受本雅明的启发，我们或许也该重新设置一下问题：与其争论线上、线下哪种知识更可靠，不如探讨一下，互联网出现之后，整个人类的知识结构是否随之发生变化？接着还可以问：既然互联网“供给”与“索取”知识的方式不同以往任何一个时代，那么传统的知识论是否还有效？近100年前，本雅明揭示出机械复制时代的新艺术形式与新知识型，那么，经历了数字革命后，他以媒介技术为切入点分析艺术的独到角度，似可启发我们寻觅知识转型的隐幽线索。或许我们可以追问：数字技术也能像机械复制技术那样重塑一个时代的知识论吗？本雅明说，照相技术让艺术的神韵消失了。那么，经历了模拟（复制）转数字的革命之后，文化形态又会发生怎样的转变？

从机械复制时代到数字网络时代

技术与文化本属两种性质不同的领域，彼此如何相互影响？新媒体艺术理论家列夫·曼诺维奇所著《新媒体的语言》一书系统阐述了电脑媒介对文化的塑造过程。我们这个时代所有的文化基础都将被电脑化，因特网成为全球化最实在、最显著的标志。这是一场最深刻的媒介革命，从文化生产、发行到市场流通，一切均由电脑做媒介。无论是获取或操纵文化数据，还是存储文化素材，也不管你采用文本、图片、视频、音频等何种格式，都必须先将资料转成数据，电脑才能够读取，我们也才能够使用。将文化的所有形态转译成二进制数字，是人类文化的未来宿命。

模拟转数字，是这场革命最深刻的断裂。回到本雅明的复制（或模拟）时代，电影是连续拍摄多个静态的照片，储存在长长的化学胶卷上，声音存入磁性声道。放映时，放映机用与拍摄相同的速率，连续读取胶卷上的一个个画面，再用强光投射到大银幕上。肉眼被高速运转的画面所欺骗，误以为银幕上的幻象是连续运动的，这是模拟方式再现的世界。到了数字时代，数字镜头将对象物反射的光线投射到感光器件上，光线被转化成电荷，再由“模数转换器”处理成二进制数字，存储在记忆芯片上。这是“数字化”过程。我们每天接触的各种文本格式、图像、视频、音频、网页、通讯信号，都统统由一堆二进制数码构成。

本雅明虽然不可能预见电影的数字宿命，但他所做的复制时代与前复制时代的艺术形式之间的比较，却发人深省。他说绘画以线条勾勒对象世界，是整体性地把握现实；而电影却把绵延的时间分割成一帧帧彼此独立的画幅，然后剪辑拼接，演员因此失去对情节的整体把握，剪辑师将其表演支离破碎地编织到银幕重构的世界里。而曼诺维奇则认为，复制技术正呼应了工业革命促生的生产模式：福特的第一条生产流水线（1913）便是大工业时代的经典范式——零部件标准化，生产过程被分割成一个个不断重复的简单劳动岗位，每一工位前后串联起来，便形成流水线。工人无需理解全过程，只须天天重复同一工种，便速成熟练工人。流水线上的工人随时可被替代，正像卓别林的电影《摩登时代》一样。

到了数字时代，世界进入后工业社会，数字媒体同样也呼应了后工业的逻辑。曼诺维奇的观点是，后工业生产的逻辑是所谓“按单定制 ”与“按进度配送”。网络经济以信息、传媒为先导，网络电商投巨资收集用户信息和消费行为习惯，有针对性地推送广告，精准投送产品。

从1950年代、1960年代的信息服务经济，向1970代的后工业转型，至1990年代的网络经济，文化便一直随经济形态的变化而一次次转向，这不正符合马克思的“经济基础决定上层建筑”吗？如果所有文化典籍、教育内容和传播信息都被电脑化并上传网络，那么将来谈文明的属地性与语境化还能成立吗？