依尘(中)
作者: 李子昊前情回顾:
产业组织理论经济学家君迟罹患一种罕见的干眼症达两年之久,到处寻医寻药未果。与之恩爱十几年的恋人依尘对他悉心照料,但病情并未得到改善。手握“潜意识舒适区拓扑投射疗法”的陈医生的到来似乎是他灰暗病榻上的曙光,但高傲博学、内心执拗的病人对医生充满了不信任,治疗过程异常艰难。陈医生决定大张旗鼓、事无巨细地对君迟阐释疗法,以期突破他的心理防线……
君迟只是默默地点了点头。陈医生的叙述很专业。君迟作为一名科研工作者,知道在给外行科普时该用什么样的辞藻和表达方式。虽然学科不同,但陈医生此时无疑用的就是这样的表达方式,而只有真正的专家才能做到这一点——君迟对此毫不怀疑。
陈医生又清了清嗓子,继续说道:“可是大多数舒适区都存在于意识表层,我们称之为‘表意识舒适区’(Conscious Comfort Zone)。通俗来讲,就是个体本身是知道自己舒适区的存在的。让我们继续沿用上面的例子。一个宅男当然知道天天宅在家不好,一个只在晚上心安的人当然知道白天应该出去工作,一个巨婴同样能意识到独立生活的重要性。他们知道自己的舒适区在哪里,知道自己就在但不该只在舒适区里,他们只是缺乏信心、动机、勇气或毅力走出舒适区。用《闻香识女人》这部电影中的一句经典台词概括就是:‘他们知道哪条路是对的,毫无例外,但他们从来不走。为什么?因为太他妈苦了。’对于这类人,大多数心理医生都会鼓励、诱导、刺激他们走出舒适区。这并不是一项困难的工作,因为医生对患者的舒适区已经有了充分的认识。就像做科研一样,发现问题永远是第一步且最重要的一步。至于之后的实际着手研究,则可以说是顺水推舟、因势利导罢了。
“可是在极少数情况下,‘发现问题’这件事本身就会变得尤为困难,因为个体并不知道他的某个特定的舒适区在哪儿,抑或他根本不知道那个舒适区的存在。每个人都会有极其有限的这样的舒适区,它们隐藏在人的潜意识里,因而被称为‘潜意识舒适区’(Subconscious Comfort Zone)。这就是我的疗法针对的对象。”
“哦?”君迟身体前倾,手肘撑在膝盖上,双手托着下巴。他一脸专注,整个人完全沉迷于这个新颖的理论之中。他那本能般的科研思维——尽管灵敏度早已今非昔比,将陈医生的话反复拆解、重组、推敲、分析,试图从中找出什么不对的地方。“可如果连个体本人都不知道这个舒适区的存在,作为医生的旁人又如何能得知呢?即便个体知道某处存在着一个舒适区,却不知道它在哪儿,那么医生又怎能从他的大脑中将这个信息挖出来呢?”
“很好的问题。”陈医生点了点头表示赞成,仿佛他早料到君迟会这样问,又仿佛君迟能够问出这样的问题使他感到十分欣慰。“针对第一个问题,在正常的情况下,我们的确不知道、也不需要知道某个个体的潜意识舒适区存在与否。只要这个人行为正常,我们完全可以把他当成一个正常人看待。只有当一个人的心理出现问题,或是行为表现异常,而现代医学对于这种异常又给不出合理的解释时,我们才能够反过来推理出这个人有一定概率存在着某个需要调节与纠正的潜意识舒适区,从而予以治疗。打个比方,姑且假设一种遗传病,就用吉特曼综合征来当例子吧,其病因是基因SLC12A3发生功能缺失突变导致NCCT蛋白的结构或功能异常①。这种病会引起低血钾,但并不是低血钾的主要成因。另外,SLC12A3基因的表达是隐性的。因此,如果一个人血钾正常,我们就完全无须在意他这个基因的表达方式。如果一个人患有低血钾,我们也不应首先考虑基因这个因素,只有在临床上给不出别的解释时,我们才会反推这个病人或许存在基因问题,进而给他做基因检测,查查其是否真的有显性表达。
“当然,这个比方并不完全恰当。全基因组检测在现代科技的发展下已经变得可行,即便一个人毫无症状,我们依然可以对他做全基因组检测,找出所有可疑致病基因的表达——只是这么做根本没必要,白白浪费钱和时间。相比之下,人类大脑则要复杂太多,想要做所谓的‘全潜意识舒适区检测’是完全不可能的。事实上,这种可能性已经在数学上被证伪了。因此,我之前才说,根据病症来反推异常的潜意识舒适区的存在只是一个概率事件,至于概率的大小,医生是无法事先预知的。”
“也就是说,根据我的疾病特征,你只是‘猜’我的脑中存在着某个潜意识舒适区需要加以干预,但你自己也不确定,是吗?”君迟皱着眉头,略感失望地问。
“是的。”
“并且我还可以合理地推断,找出这个潜意识舒适区的方法一定有较大的风险或代价。”君迟此时就像一位德高望重的教授面对一个正在答辩的博士生,咄咄逼人地问着各种刁钻的问题,“否则,任何人无论有什么问题,都可以放心地用这个方法试一试,看看有没有你所说的那种病态潜意识舒适区。就像如果做手术不会造成任何损伤的话,X光、超声、CT等就都没有用武之地了。无论什么人犯了胃痛头痛关节痛之类的,只需二话不说开一刀,到底是啥病往身体里瞅一眼就一清二楚了。”
“很遗憾,你说的完全没错。”陈医生缓缓点头。虽然对于这一点他现在已经丝毫不担心,但他还是不禁佩服君迟敏锐的思维和精准的推断,“这个方法,也就是我之前提到过的拓扑投射法,确实伴随着相当大的风险。我稍后会详加解释。可是有一点我必须事先言明:尽管我刚才说无法准确预知你病态潜意识舒适区存在的概率,但凭借一个医生的直觉,我对我的判断相当自信。你能理解吗?‘直觉’二字虽然听起来十分不严谨,甚至没有任何科学依据,却是人类与生俱来的、计算机永远无法跨越的一道鸿沟——至少我是这样认为的。让我举一个科幻小说中的例子吧。阿西莫夫在《永恒的终结》这部作品中,构想出了一个能够计算人类未来演化路径的庞大计算机阵列。然而,要想找出改变人类演化路径所需的最小现实变革(Minimum Necessary Change,简称MNC),却只能仰仗直觉极准的人类时间技师。我并不指望这段说辞能够打消你的疑虑,也知道你希望直接通过拓扑投射法的数学理论来自行判断其可靠性和可行性,但我对你做的事,并非只是单纯的投骰子般地碰运气。我坚信我的疗法能够成功。”
陈医生一口气说完了这一大段话,面容已经因暂时性缺氧而变得有些发红。他很想大口大口地深吸几口气,却只敢以最慢最轻的方式呼吸着,仿佛他和君迟之间有一座无形的天平正处在最微妙的平衡状态,哪怕是对空气最轻微的扰动都会使其彻底颠覆。他心里明白这番话的重要性。如果君迟完全抗拒这样的解释,那他的治疗很可能会因此毁于一旦。不料,君迟却毫无预警地放声大笑起来,在一瞬之间将整座天平震得粉碎。
“哈哈哈哈哈!陈医生,我不但不怀疑你,而且现在还更喜欢你这个人了。直觉,学者的直觉!说得太好了!什么‘条条大路通DS①’,放他妈的狗屁!数据是死的,它再怎么大也还是死的,说白了就是一座夹杂着几颗钻石的垃圾山而已。所谓的数据科学家就是一帮试着从大堆垃圾里淘出钻石的盲目淘金者,这和大海捞针又有什么区别?为什么不像个真正的学者一样,把脑子用在该用的地方,一开始就着眼于真正值得研究的对象呢?不过陈医生,我猜你的拓扑投射法和拓扑数据分析应该有什么联系吧?所以请别介意我开的这个小玩笑。你要是能从我脑子里挖出什么宝藏,咱俩平分就是,岂不妙哉!”
在这之前,陈医生从未见过他身旁的这个男人笑起来的样子,哪怕是最浅的微笑。他就像花岗岩雕刻成的上将关云长,面对刮骨之痛都能够面不改色,在任何场合都绝不会露出半分笑意。陈医生在过去的一周里不时会在脑中构建出他的面部特写,然后试图将这幅特写的嘴角向上提一些。毫无例外,每一次都以失败告终。陈医生想,这大概是他俩第一次见面时,君迟留给他的印象太过痛苦、悲惨、沉重。没有人能从那样的人身上寻找任何一丝有关“快乐”的线索。那样做实在太残忍了,就如同让一个孕妇亲手剖开自己的肚子,将已死的胎儿抱出来,再亲手将肚子一针一针缝上。
可现在,这个男人真的笑了——不是微笑,而是声振屋瓦的大笑。陈医生僵坐在那儿。此刻,他脑海中一直试图想象的东西就清清楚楚地呈现在他面前,但他感到的不是欣慰,而是彻骨的寒意与排山倒海般的悲痛。不是因为这笑声与笑声主人的凄惨处境格格不入,恰恰相反,这笑声主人笑的就是自己——千疮百孔、遍体鳞伤的自己。这笑声就像一座冰山,突出水面的一小块看上去绚丽夺目,下面却隐匿着庞大且无可比拟的酷寒与黑暗。这是拉奥孔被无数海蟒缠身时发出的笑声,是普罗米修斯面对啄食其身体的铺天盖地的秃鹰发出的笑声,是赫拉克勒斯看着自己亲手杀掉的妻子和女儿的尸身发出的笑声,是被阿尔忒弥斯变成鹿的阿克特翁在被同伴和猎狗杀死之前发出的笑声……陈医生动摇了。刹那间,他仿佛化身撒旦,圣洁的白大褂被无辜之人的鲜血染得猩红。他到底该不该救君迟?死亡对他而言会不会真的是种解脱?古谚有云:“有朝生而暮死者,有春夏生而秋冬死者,有十年百年千年而死者。虽有迟速,想去曾几何时?”医生若能治愈一个人当然是好的,可让一个一心求死之人苟活于世又算是什么呢?让人解脱与见死不救明明一善一恶,却在无数活生生的现实医学例子中化为一体。
“陈医生?”君迟的话打断了陈医生的思绪。此时的君迟已经恢复之前严肃而略带疲倦的模样。陈医生想:“现在纠结这些又有什么用呢?反正已经没有回头路了。”他花了好几秒钟回忆刚才和君迟的对话,这才有些勉强地说道:
“宝藏什么的是你开玩笑了,不过拓扑投射法的来源你的确猜得不错。这样吧,我从头给你讲讲。一是让你对我的数学水平稍稍建立点儿信心,二是如果我有啥说错了的地方,你也可以及时纠正。不过一开始你可能会觉得简单得有些无聊,希望你别介意。”直到此时,陈医生才完全摆脱适才的惊愕与困扰。
“当然不介意,陈医生。你就当我是个对数学一窍不通的外行就好。”
“嗯好。因为这个疗法的核心是数据的降维处理,所以我们就从卡尔·皮尔森(Karl Pearson)和哈罗德·霍特林(Harold Hotelling)发明的‘主成分分析’(Principal Component Analysis,简称PCA)①讲起吧。这你肯定……你和依尘肯定都学过,毕竟这是最简单的数据降维法,也是机器学习中最基础的非监督学习法。所谓的数据降维,就是试图将有许多变量的大数据——如基因数据、大气数据——简化,以便发现数据中隐藏的规律和做进一步的数学统计分析。说白了,PCA——就是将数据标准化后,先选取某个对于所有变量的线性组合——也就是一个新的坐标轴,称为第一主成分——使得数据在这个坐标轴上方差最大,再选取第二个对于所有变量的,且与第一个线性组合正交的线性组合——即一个与第一坐标轴正交的坐标轴,称为第二主成分——使得数据在这个坐标轴上的方差是所有与第一坐标轴正交的坐标轴中最大的。以此类推,我们就可以得到一个由原来的各变量的线性组合——即所谓的主成分——所构成的新的正交坐标系,使得数据的第1,…,n大方差在第1,…,n主成分——即第1,…,n坐标轴——的方向上。用通俗的语言讲,第1,…,n主成分依次代表了数据中最大的剩余信息量。因此,通过PCA,我们就可以选取前k(k≤n)个主成分进行分析,从而达到降维的目的。比如,我们可以只选取第一和第二主成分,通过二维的贡献率图或双标图来直观地观测数据特征,这在任何编程语言(如Python和R)中都能够轻易做到。不过PCA本质上只是线性代数而已,这也意味着它的局限性是比较大的。
“而在21世纪初,数学家们则发明了‘拓扑数据分析’(Topological Data Analysis,简称TDA),也就是你之前提到过的。其中又以斯坦福大学数学系教授贡纳尔·卡尔松(Gunnar Carlsson)2009年发表在《美国数学学会公报》上的《拓扑结构和数据》(Topology and Data)尤为有名——他本人自然是这个领域中的佼佼者。与PCA相比,TDA是一种灵活度更高,且保存有用信息更多的数据降维方法。拓扑学经历了两个多世纪纯理论的沉淀后,终于在21世纪得以爆发出惊人的实用价值。想必你一定知道,拓扑学大致可以总结为一门研究图形或空间结构连续变换的性质的数学分支,又可细分为代数拓扑、微分拓扑等。对于业余数学爱好者们来说,拓扑学则无伤大雅地被化简成‘一个咖啡杯和一个甜甜圈的拓扑结构是一样的,但二者却和一个橙子的结构不一样’的概念。”