全球AI颠覆者梁文锋: 为中国科技书写传奇故事

2025年春节期间,全球科技界的目光聚集在梁文锋身上。在他的带领下,杭州深度求索人工智能基础技术研究有限公司的国产人工智能(AI)大模型DeepSeek震惊世界,无论是性能还是受欢迎程度,都跃居全球前列。这让科技界大吃一惊。人们开始好奇,梁文锋是谁?他是如何一举成为业界黑马的?他的人生,又有怎样的经历?

喜欢拆收音机,从小就是数学天才

1985年,梁文峰出生于广东湛江的一个小村庄。父母为人淳朴,都是小学老师。父亲对他的教育方式与众不同,更注重解决问题的能力,而非单纯追求分数。虽然家庭并不富裕,但给了他理性和坚韧的成长环境。

梁文锋从小就展现出对数学和科学的天赋。他喜欢把家里的“飞跃牌”收音机拆了又装,装了又拆,前前后后折腾了30多次。这种对事物的好奇心和探索欲,不仅锻炼了他的动手能力,更培养了他的数理思维。他通过拆解和重新组装收音机,学会了如何从复杂的问题中找到规律,以及如何用逻辑去解决问题。这种能力,正是数学思维的核心,也为他后来的创新之路奠定基础。

读小学六年级时,梁文峰凭借出色的数学成绩考入吴川一中。旁人还在为简单的加减乘除烦恼时,他已经开始自学高中数学,甚至提前“解锁”大学数学的高阶知识。他对数字与逻辑的敏感性远超同龄人。中学时,他为了攻克一道几何难题,自创“坐标系穷举法”,每天花3个小时,把所有可能的辅助线都试了一遍。后来,这种方法竟成了他开发AI模型时的关键算法。

2002年,17岁的梁文锋考入浙江大学,就读其王牌学科——电子信息工程,攻读人工智能方向。其间,他不仅刻苦学习,还积极参加各种数学建模竞赛,逐渐在学术圈小有名气。

本科毕业后,梁文峰继续攻读浙江大学的硕士研究生,研究方向转向更具前沿性的机器视觉。他的导师项志宇教授,是国内这一领域的专家。跟从项志宇教授学习期间,梁文锋的学术能力得到极大提升。大学期间,梁文锋坚信“AI将改变世界”。当时,他对金融市场产生了浓厚的兴趣,尝试用机器学习的方法分析金融市场数据,并开始用编写的人工智能算法选股。在全球金融危机的阴影下,他带领一群志同道合的伙伴,探索量化交易与人工智能的结合,尝试进行全自动量化交易。他们采集海量的市场行情数据、宏观经济信息,并用数学建模的方法研究价格波动规律,积累早期数据和经验。这些“超前”的尝试,为他日后的创业埋下伏笔。

当时,量化投资(是指利用数学模型和计算机算法来进行投资决策的一种投资方式)在国内还是新鲜事物,但梁文锋敏锐地察觉到其中的潜力。为掌握量化投资的核心技术,他开始疯狂学习金融知识。除了读不少专业书籍外,他还利用网络资源,学习国内外顶尖量化投资机构的经验与方法。

与许多追求“高薪体面”工作的同学不同,梁文锋的目标从来不局限于做一名普通工程师。他在学术研究之余,开始关注更大的产业变革方向,尤其是人工智能在实际场景中的应用。他坚信,科技将成为未来社会的核心驱动力,而自己必须抓住这场时代机遇。思来想去,他决定自己创业。

成立公司,进军AI大模型

2015年,梁文锋与浙大同学共同创立了自己的量化私募基金——幻方量化基金。将量化用于投资领域,这是一个融合金融、数学和计算机科学的交叉领域,需要具备深厚的专业知识和强大的技术能力。随着幻方量化基金规模不断膨胀,梁文峰从2019年起累计投资超10亿元建设“萤火一号”和“萤火二号”AI算力集群,这让幻方量化成为国内少数具备超强算力的企业。

到2021年,梁文锋已跻身千亿量化私募“四大天王”之列,但他并没有满足于此。2023年,随着ChatGPT(是美国OpenAI公司开发的大型语言模型)的爆火,AI大模型成为全球科技领域的焦点,一场没有硝烟的大模型竞赛在全球范围内激烈展开。

当许多人还在质疑中国能否在人工智能领域取得突破时,梁文锋看到了人工智能领域的巨大潜力和无限可能。2023年7月,他成立了人工智能研究公司,全力进军AI大模型研究开发领域,专注于通用人工智能的研发。

很多人难以理解,甚至有人觉得他疯了。搞AI大模型不仅烧钱,而且国内普遍认为我国在这方面的能力有限。也许当时连梁文锋都没想到,他的这一疯狂决定,成就了如今国产AI的一段传奇。

在团队组建方面,梁文锋展现出独特的眼光和魄力。他没有像其他公司那样,执着于聘请具有丰富AI技术经验的老将,而是将目光投向充满朝气和潜力的年轻人。在他看来,如果追求短期目标,找现成有经验的人是对的,但如果看长远,经验就没那么重要,基础能力、创造性、热爱才更为重要。

梁文锋认为,年轻人思维活跃,富有创新精神,没有被传统思维模式束缚,更有可能在AI领域取得突破性进展。于是,一群来自清华大学、北京大学、浙江大学等中国顶尖高校的应届毕业生、在读生以及毕业才几年的年轻人,汇聚在一起。

怎么看,当时梁文锋的公司都没法在AI领域闯出一片天。他的团队仅139人,多为本土高校毕业生和实习生,团队成员没有一个有海外留学背景。不过,虽然梁文锋团队很年轻,但他们却都是出类拔萃的。有的在国际大学生程序设计竞赛中屡获金奖,有的在顶尖学术会议上发表过高水平论文……尽管缺乏实际工作经验,但大家对研究充满热情和好奇,拥有扎实的专业知识和强大的学习能力。在团队里,大家没有严格的上下级之分,每个人都能根据自己的兴趣和专长,自由加入不同的研究小组。这种管理模式,极大地激发员工的积极性和创造力,让他们能够充分发挥自己的才能。

过去,梁文锋看到人工智能技术被美国少数公司垄断,并借此收取很高的费用,就非常痛恨。他曾发誓——“一定要让AI变成人人可以用得起的东西!”所以,当他的团队研发出AI大模型后,他做出了一个最重要的决定,那就是将代码开源,让任何人都可以访问,目标是用低成本、高性能的技术。DeepSeek堪称创新思维与实践的完美结合,其核心竞争力在于独特的技术创新。梁文峰的公司成立仅一年,就凭借其团队创新能力,成为AI领域一颗耀眼的新星。

一战成名,

用中国科技书写震撼全球的故事

2024年12月,梁文锋推出了新一代AI大模型DeepSeek-V3。这款模型在数学运算、代码生成和中文问答等方面表现出色。更令人震惊的是,它用低成本的芯片,实现了对GPT-4的全面对标,被美国科技圈称为“来自东方的神秘力量”。从此,梁文锋成为业界的一匹黑马!

梁文锋真正的人生“爆发点”,是在2025年1月27日。这天,他发布了新的开源AI大模型DeepSeek R1,这一大模型不仅在性能上追上了全球最顶尖的GPT-4完整版,而且用550万美元的训练开销,就做到硅谷投入上亿美元的效果。同时,梁文锋通过技术创新,不断优化模型的性能和效率,使其在保持高性能的同时,推理成本大幅降低。这使得中小企业和个人开发者,也能够负担得起AI技术的使用,为AI的普及和应用提供了更广阔的空间。

当世界各地的大量用户突然涌入使用时,梁文锋和公司措手不及,甚至导致局部服务器短暂的系统崩溃。令梁文锋没想到的是,短短几天,这个新的AI大模型就引起世界级的轰动。

在AI领域,DeepSeek宛如一颗重磅炸弹,迅速登上苹果全球免费榜榜首,引发广泛关注。其采用开源战略,实现算法革命,在成本控制上也表现卓越,以颠覆性的姿态冲击着美国AI从软件、硬件到生态的科技金融化逻辑。

更厉害的是,DeepSeek是目前唯一支持联网搜索的推理模型,这一点,就连全球顶尖的美国OpenAI还没做到。毫无疑问,那些AI巨头躺着赚钱的日子,即将变成“过去式”。

一位业内大佬在电视节目中说:“中国的AI能力正在迅速赶超美国,在某些方面甚至可以与美国顶尖模型相媲美,这出乎许多人的意料。”

DeepSeek服务覆盖了工业、农业、教育、医疗等多个领域。它就像一个深不见底的宝库,任何人都能从中找到自己需要的宝贝。有人说,梁文锋让AI技术真正惠及大众,这不仅是在颠覆AI市场的游戏规则,更是他2025年送给全世界的一份春节大礼!

DeepSeek的成功,证明了梁文峰的远见和坚持。在全球AI竞争愈发激烈的今天,他用技术和创新让中国AI力量在国际舞台上占据了一席之地。正如他所说:“我们不只是追赶,更要在核心技术上实现真正的超越。”

目前,梁文锋已经将自己的公司定位在中国人工智能革命的最前沿。今年40岁的他,正利用自己的聪明才智,全力以赴地报效祖国,为中国科技书写更多震撼全球的故事。

编辑|郭绪书