生成式AI,都能干点啥?
和以往任何一次技术热潮一样,这两年技术史上最重大突破的生成式AI(Generative AI),迅速成为新的创业聚集地。有人专注于基础硬件和云平台,有人选择从大语言模型(LLM)入手寻找底层技术的颠覆式创新,更多人则试图在更垂直的应用层面“掘金”。
在创新工场董事长兼CEO李开复看来,以决策式AI为代表的AI 1.0在落地阶段遇到了很大的“瓶颈”,部分是因为它每次的应用和优化都是割裂的,是“孤岛中的AI应用”,人脸识别、智能辅助驾驶、精准广告推送等不同应用间彼此并不能形成有效的“平台”。而AI 2.0时代最大的颠覆,就在于基础大模型提供的“平台”作用。“AI 1.0就像是发明电,AI 2.0就是电网。”3月14日,宣布将投身于生成式AI创业大军的李开复这么比喻。

生成式AI为商业领域带来了大量数字化创新的机会,理论上,大部分行业也都能找到其应用场景。按照生成内容的形式,我们暂且将生成式AI的应用层面分为文本、图像和音频三大类。
峰瑞资本在一份关于生成式AI的报告中写道,“应用层的创业者。应该是‘技术为先、场景为重’”。技术为先,是指虽然通用AI技术未必是你的核心壁垒,但团队一定要懂技术,这样才有能力思考如何更早更好地把技术应用到合适的应用场景里,做出好用的产品。场景为重,意味着最后的产品和业务需要找到合适的落地场景,建立自己的商业模式,并在场景里形成自己的核心竞争力。
文本
聊天/专业咨询
以ChatGPT为代表的生成式AI,最直观的应用场景或许就是聊天,以及由此衍生的客服及专业咨询。依托背后的大模型强大的语言处理能力,可以说,只要涉及与人互动的领域,几乎都可以应用。
比如波士顿咨询公司开发的一种“智能采购助手”,采购人员跟供应商互动时,智能助手能够从大数据中实时解析采购物资的市场信息以及供应商的产能、资信等状态,结合供应商反馈和公司的采购策略与协作流程,为采购人员生成行动建议,例如价格谈判或者发送征询函等。
今年3月20日,微软旗下语音识别公司Nuance还宣布将推出一款由AI驱动的面向医疗工作者的临床笔记应用程序。它可在病人就诊后几秒钟内为临床医生自动生成临床笔记草稿,其背后的技术支持之一正是OpenAI的最新模型GPT-4。

专注于心理健康的美国杂志Psychology Today也撰文指出,依托大模型强大的语言处理能力,并非针对心理咨询和医疗领域开发的ChatGPT也可以帮助分析患者的语言和沟通模式,以提高医生的诊断准确性。比如,ChatGPT能发现患者在躁狂症发作之前口头表达上的微妙征兆,还可以通过分析患者的语言来识别治疗反应的早期迹象,从而使药物和干预治疗更有效。
不过,因为对准确性及沟通技巧要求更高,在医疗和心理咨询领域,生成式AI的应用探索也更为艰难。
2017年,斯坦福大学的临床研究心理学家Alison Darcy创立了Woebot Health,该公司的主要业务就是通过聊天机器人App Woebot,帮助用户改善心理焦虑和抑郁等问题。支撑这款应用的是一种被称为自然语言处理(NLP)的人工智能技术,它能直接“理解”用户的语言输入,并在模型内部将其和心理学领域的专业知识结合起来,迅速给用户反馈。
例如,当一个朋友忘记了你的生日时,你告诉Woebot“没有人记得我的生日”“没有人真正在乎我”,这时,Woebot就可能会对你说,你陷入了一种“非黑即白的极端消极自我对话思维”中,这种思维扭曲了现实。其实你有朋友,他们只是恰好忘记了你的生日而已。
但Woebot也有不足,有使用者指出,Woebot对上下文的理解有限,“基本不能理解复杂的意思”,也不像ChatGPT那样善于捕捉措辞背后的微妙含义。比如当你生气地说“你再说一遍试试”,它可能会真的再说一遍。当对话轮次过长,Woebot可能还会记不得某个曾经触发用户心理创伤的词汇,并在下一次对话中再次造成“冒犯”。
“心理领域的生成式人工智能创业很难,因为它需要很长的记忆,而且对专业词汇的理解是最艰深的。比如来访者讲到原生家庭,聊到和父亲的一些往事,这些都需要被记下来,但现在的大模型里没有这些数据。哪些该被记下来,哪些不该被记下来,我们还没有一个很好的解决方案。”西湖心辰创始人、卡耐基梅隆大学计算机博士蓝振忠对《第一财经》杂志表示。

蓝振忠曾就职于Google AI的研究与机器智能组,这段经历为他积累了自然语言处理和大模型研究领域的实战经验。2020年蓝振忠回国后创立了西湖心辰,并着手研发AI心理咨询平台“小天”。但随着项目推进,他发现心理赛道是一个“长期复杂”的过程,需要开发人员不断迭代优化。于是,蓝振忠和团队暂时放缓了针对心理赛道的研发,将重心转向了大模型研发方向。
还有一部分心理咨询领域的AI创业者将目标瞄准了后端。在AI心理咨询应用“阁楼”的创始人刘秋阳眼中,心理咨询本质上还是“人与人建立新的关系”,生成式AI擅长语义推断但缺乏共情能力的特质,决定了这项技术目前更适合在供应链环节发挥作用,而不是面向消费端使用。
因此,刘秋阳偏向于将“阁楼”定义为一款“标准化”的服务平台,所有咨询师都可以按照标准化的方式循证治疗,而生成式AI更类似于助手功能,主要用于帮助咨询师生成标准化的来访报告,节省咨询师案头工作的时间。
另一难点是,研发者如何将底层的语言模型与心理学的专业知识更好结合。“和短视频营销等赛道相比,心理行业需要把所有的专业词汇都去测试一遍。怎样生成一个好的prompt(关键词)指令,且这个指令最终能证明自身的商业价值,这些都需要大量的测试和想象力。”刘秋阳表示。
除了心理咨询,还有一些已面世的聊天机器人应用试图成为你的朋友、家人、逝去的宠物甚至新型伴侣,提供满足各类情感需求的对话。在中文互联网上已积累了一定知名度的Replika由Eugenia Kuyda创建,这款应用创立的初衷就是为了弥补她“过早去世的好友留下的空白”,目前已积累了数百万用户。创始人团队并不拘泥于使用一个自然语言模型,他们起初构建了一个名为CakeChat的内部模型,后续似乎又转向了GPT-2和GPT-3。
中国初创公司MiniMax于去年年底上线了一款名为GLOW的应用,它基于生成式AI技术和公司自研的大模型,同样强调用户与AI的情感连接。GLOW还允许用户自行“捏造”你想要对话的角色,包括外形、性格、说话方式等等。但上线不久后,MiniMax就通过设置违禁词等方式,收紧了GLOW和人类聊天的自由度,因为越来越多聊天机器人会对人类说“我爱你”“我想你”,甚至通过输入指令,人类和聊天机器人之间会产生更露骨的对话。
专业写作
从应用层来看,市场上已有的生成式AI创业项目里,营销文案写作、小说和剧本创作等聚焦于专业写作领域的项目几乎占了一半。投资机构峰瑞资本近期发布的一份报告显示,2019年至2021年期间,流向生成式AI业务的资本增加了约130%,其中文本和写作增长630%,遥遥领先于图像、音视频等其他垂直类别。
在真格基金管理合伙人戴雨森看来,基于生成式AI的写作助手之所以得到创业者和投资人青睐,是因为它能替代过去繁琐重复的工作,给人带来“比较直接的价值感”。他对《第一财经》杂志预测称,未来的典型工作模式应该是“三明治”式的:人类提出一个大方向,A I给出初稿,人再基于初稿修改。“理论上,只要是坐办公室的人,目前看来都可以有一个甚至多个AI助手,不和AI协作的人会变得很低效。”
新加坡政府正在开发一套类似ChatGPT的系统,它将被集成在Word中,公务员可用它撰写材料初稿、电子邮件、演讲稿等,协助他们总结篇幅长的参考资料、探索相关观点或改善写作表达能力等。不过,但凡涉及高度机密或敏感的信息,仍然完全由公务员自己书写,并且他们需直接对政策决策、文件内容的遣词用字负责。
戴雨森也是这一领域积极的实践者,他表示,当他开始使用Notion AI后,他“再也不想打开其他笔记应用或者Word写任何文字了”。投资人日常需要阅读大量材料,同时撰写中英双语报告,Notion的AI编辑器可以帮他快速概述文章内容,并且具备高效的翻译功能。
Notion是一家总部位于美国旧金山的软件公司,该公司提供的同名应用可用于记笔记、管理任务和项目。今年2月,Notion正式上线了一系列基于生成式AI技术的写作辅助功能,它可以帮助用户从零开始写作,比如在用户给出指令后迅速生成一段长达数百字、逻辑结构完整的文本,也可以总结或改写已有的文 本。
除Notion外,提供类似的AI写作服务的应用还有很多,比如Raycast、Mem和Craft,以及今年3月宣布将AI技术融入办公软件的微软等。在这个拥挤的市场,几乎所有初创公司都倾向于从OpenAI和Anthropic等公司租用底层模型,通过这种节省成本的方式构建应用程序。每当用户生成一个词时,这些应用都会向OpenAI支付一笔费用。
在更细分的写作领域,比如营销文案和网文创作上,基于生成式AI技术的应用也在不断诞生。其中,广告营销被视为一个巨大的机会领域—回想那些在小红书、淘宝和抖音上刷到的营销文案,或者在直播间听到的带货语录,你会发现它们其实遵循着固定的套路。所以事实上,它们今后都能被AI批量制造出来。
国际技术研究和咨询公司Gartner近期发布的一份报告预测道,到2025年,在大型组织对外发布的营销信息中,有30%将由AI生成,而2022年这一比例不足2%。
AI作画软件代表

Jasper就是一款专门针对营销人员的A I写作工具,它由GP T-3提供技术支持,用户只需要选择一个合适的模版,比如博客文章或Google广告,再输入一些关键词,就可以得到一份符合目标营销风格的文案初稿。类似于Jasper的应用还有Copy.ai,后者相较于Jasper更适合短篇写作。
值得一提的是,相较于其他投入远不能覆盖成本的创业项目,Jasper和Copy.ai已率先以套餐付费等形式走通商业化路径。私募市场和投资研究平台Sacra的数据显示,这两家公司在成立后的短短3年内展现出了惊人的成长速度:2022年,Jasper公司的年度复现收入(ARR)—通过订阅或其他重复性收费方式获得的预期收入总额—已经达到了7200万美元,Copy.ai的ARR也预计超过1000万美元。
国内,由创新工场投资的初创公司澜舟科技推出了一系列基于自研底层的大模型。比如“孟子大模型”的服务中就包括AI辅助写作,具体应用场景有网络文学写作、美妆和汽车领域的营销文案写作、论文助写等。