

智能医学工程专业开展计算机辅助药物设计教学的实践和思考
作者: 田佳琪 吕恩辉 康星星 石丹枫[摘 要] 随着人工智能(AI)技术在医药行业的推广和普及,智能医学工程专业人才的培养成为国家发展的重大需求,但作为新兴专业,相关人才的培养模式还处于探索阶段。计算机辅助药物设计(CADD)是在化学和生物理论基础上发展起来的计算机模拟技术,其学科特点与智能医学工程专业具有较高的契合度。重点分析了计算机辅助药物设计教学在智能医学工程专业人才培养方面的科学性和必要性,并结合具体的教学实践对课程设计进行了详细的探讨和总结,以期在一定程度上为智能医学工程专业人才培养提供思路和建议。
[关 键 词] 智能医学工程;计算机辅助药物设计;人才培养
[中图分类号] G642 [文献标志码] A [文章编号] 2096-0603(2023)35-0113-04
医学教育是卫生健康事业发展的重要基石。随着医疗技术的不断发展和医学需求的不断增加,培养具有扎实理论知识和丰富临床经验的医学人才,为卫生健康事业的发展提供坚实的人才支撑,是国家发展战略中不可或缺的部分。随着新一轮科技革命和产业变革的到来,人工智能(Artificial Intelligence,AI)开始冲击医学领域的发展,技术智能化促使医学目标由疾病诊治向健康维护与促进转变,这些变革迫切需要新工科、新医科人才支撑[1]。在这一背景下,教育部于2018年3月批准建立了全国首个智能方向的医学类本科专业——智能医学工程。智能医学工程专业集计算机科学、医学、生物信息学等多学科知识于一体,旨在培养具备医学专业知识和计算机技术背景的高端人才。智能医学工程专业的开设,标志着我国高等教育对于人工智能技术在“新医科”建设方面的重视和推广[2]。未来,随着人工智能技术的不断发展,智能医学工程专业将成为医疗行业的重要支撑力量,为医疗事业的发展注入新的活力和动力。
智能医学工程专业以现代医学为基础,融合了大数据、云计算、人工智能等技术手段,以患者为中心、信息为纽带,旨在挖掘生命和疾病的本质规律,探索人机协同的智能化诊疗方法及应用。智能医学工程的人才培养集成了医学、信息学、工程学等多学科的知识,以医学信息处理与分析、医学图像处理与诊断、医学数据挖掘与分析、智慧医疗系统设计与开发等为主要研究方向,致力于将人工智能技术应用于医疗领域,提高医疗效率、优化医疗资源配置、改善医疗服务质量。人才培养过程中融合了基础医学、临床医学基础、生物医学数据的智能感知及数据挖掘、智慧健康医疗信息系统开发、智能药物研发与医学研究等多方面知识。本科阶段旨在培养学生具备良好的科学文化素质、职业素养和国际视野,以及创新、创业和团队协作意识。通过系统的理论学习和实践,使学生具备科学研究、项目开发、组织管理、团队协作、技术创新及健康医疗市场开拓等方面的能力。学生毕业后既可到综合性医院从事系统开发、维护、医学数据分析、挖掘等工作,又能在相关医疗行业及企事业单位从事软件的设计、开发等工作,也可攻读智能医学工程、计算机科学与技术、生物医学工程、医学信息学及相关学科的研究生。
智能医学工程专业的建立既是我国高等教育领域的一项重大举措,也是我国医疗事业发展的一次重要尝试。截至2020年,全国已有25所高校开设智能医学工程专业,它是我国首个也是目前唯一一个在医学门类中授予工学学位的本科专业。智能医学工程专业的人才培养正处于积极探索的阶段[3],在人工智能时代背景下,如何对传统医学教育模式进行改革,兼顾新医科和新工科的交叉融合,培养高素质、高水平、具有多元核心技能的复合型人才,值得教育者思考[4]。本文作者长期从事计算机辅助药物设计(Computer-Aided Drug Design,CADD)的科研和教学工作,通过对计算机辅助药物设计学科的理论研究和教学实践,对智能医学工程相关专业开展计算机辅助药物设计教学的科学性、必要性和实用性进行了深入探讨。
一、计算机辅助药物设计已成为智能药物研发的必备技术,能够多阶段、多角度指导智能药物研发
计算机辅助药物设计是在化学和生物理论基础上发展起来的一门交叉学科,通过计算机模拟分子结构和化学反应过程,预测药物分子与生物靶标之间的相互作用,主要运用于药物研发的过程。药物研发是一项艰巨而复杂的过程,以传统的小分子化学药物为例,新药研发从无到有要历经药物发现、临床前研究和临床试验“三部曲”,最后才能进入医药市场用于治疗疾病。据统计,一个新药的批准需要约10年时间和10亿美金的花费。传统药物研发需要进行大量的“湿实验”测试,耗费大量的时间和金钱;而计算机辅助药物设计可以在计算机上进行“干实验”模拟,快速筛选出具有潜在活性的化合物,从而缩短了药物研发周期,节省了人力和物力。
随着技术和理论日渐成熟,计算机辅助药物设计已成为药物研发领域的必备技术。从20世纪80年代默沙东公司开始运用计算机辅助药物设计进行药物发现到如今“计算机辅助药物设计+人工智能驱动药物设计(Artificial Intelligence-driven Drug Design,AIDD)”成为药物研发的新范式,AI技术在药物研发上的应用价值逐渐被认识和释放。计算机辅助药物设计技术对化学、生物学理论在药物研发领域的运用进行了丰富的探索,其相关技术手段和分析方法促进了人工智能驱动药物设计的形成。现阶段,计算机辅助药物设计和人工智能驱动药物设计相互补充,在药物开发的各个阶段发挥着重要的作用,主要表现在以下三个方面。(1)计算机辅助药物设计提供了重要的数据预处理和分析评价工具。从数据库中获得的疾病、组学、靶点、药物分子的数据信息,需要经过计算机辅助药物设计预处理成相应的分子特征,才能作为AI模型的数据输入;同时计算机辅助药物设计的相关原理能够增强AI模型的可解释性,确定分子特征的重要性和关联性。例如:在基于AI的分子生成模型中,能够生成大量具有2D或3D结构的分子,但是这些分子的化学合理性需要借助计算机辅助药物设计的技术进行判断;对于AI模型筛选得到的活性化合物分子,需要借助计算机辅助药物设计技术分析药物与靶标的相互作用模式,从而有针对性地进行先导化合物的优化。(2)目前的人工智能驱动药物设计能够实现分子生成和活性预测,但是对小分子热力学和动力学性质仍缺乏准确的评价,计算机辅助药物设计利用物理模型进行的靶点-药物分子亲合力预测仍是主要有效手段。(3)人工智能驱动药物设计模型依靠大量的原始实验数据,但对于原创性的药物靶标这些数据往往是不够的,这种情形下依靠计算机辅助药物设计进行药物的初期探索显得尤为重要。
智能药物研发是智能医学工程专业的关键内容。计算机辅助药物设计技术作为智能药物研发的必备技术,通过与人工智能驱动药物设计组合使用,能够有效促进药物开发的进程。因此,在智能医学工程专业开展计算机辅助药物设计教学具有必要性。
二、计算机辅助药物设计以计算机技术为工具,通过多学科交叉从工程角度解决药物相关的实际问题,与智能医学工程的培养目标高度契合
计算机辅助药物设计的发展过程主要可分为三个阶段。20世纪60年代,Hansch率先采用定量构效分析方法(Quantitative Structure - Activity Relationship,QSAR)研究有机小分子与生物大分子相互作用,有机小分子在生物体内吸收、分布、代谢、排泄等生理相关性质,被认为是计算机辅助药物设计发展的起源。20世纪90年代,随着结构生物学的兴起,药物与靶标间的相互作用被认为是药物分子发挥药效的关键,药物化学家通常依据“锁钥模型”模拟药物与靶标之间的关系并设计药物分子。与此同时,计算机技术的发展和分子图形学的出现,药物靶标的作用模式可通过计算机进行直接展示、模拟和计算,药物设计策略逐渐发展到基于生物大分子三维结构的药物设计方式。该阶段涌现出一系列计算机辅助药物设计技术,包括计算机虚拟组合化学库设计、基于分子对接和虚拟筛选等技术,使得大量数据可以在计算机上进行预筛选,减少实验合成和筛选的化合物数量,显著提高了药物研发的成功率。21世纪开始,随着信息技术和生物技术的快速发展和逐渐融合,基因组学、蛋白质组学等生物学大数据被测定、存储和分析,化学信息学、生物信息学等分析手段的运用,药物化学家获悉了大量潜在的疾病靶标,药物设计进入生物学驱动的后基因组时代。同时,近年来人工智能驱动药物设计的快速发展,药物化学家可以充分研究靶标的生物学功能,并寻找与之匹配的小分子化合物,以便迅速有效地发现新型靶标和新型先导化合物。AIDD是智能药物研发的雏形,将AI技术运用到药物研发的各阶段,包括靶标发现及验证、苗头化合物发现、先导化合物优化、晶型预测、患者招募、优化临床试验设计等等。从技术赋能角度,人工智能驱动药物设计的优势在于可以实现对大数据的高效处理和分析,实现对多维数据的深度挖掘和自动化处理,且精度和场景应用广泛性更高。
计算机技术和人工智能相关的机器学习算法始终贯穿计算机辅助药物设计学科的发展,这与智能医学工程专业特点不谋而合。从早期构建药物的定量构效关系模型,到如今预测蛋白三维结构的人工智能系统AlphaFold,计算机辅助药物设计能有效利用计算机技术和机器学习算法从实验数据中挖掘规律、预测未知,通过大规模的数据分析和建模来预测药物分子的性质和活性。计算机辅助药物设计重点关注智能医学工程中智能药物研发的部分。将已知的化合物结构和活性数据输入计算机中,通过分析这些数据,建立模型来预测未知化合物的性质和活性,可以帮助科学家们更快地找到最优的药物配方,减少试验次数和成本,提高研发效率。多学科交叉属性是计算机辅助药物设计学科与智能医学工程专业的另一共同特点,两者都需要掌握计算机技术和多学科知识,并将其应用于医药领域。计算机辅助药物设计既关注生物学中的蛋白、DNA、RNA等组学数据,又需要利用数学模型、算法、模拟软件等对药学中类药性、亲合性、可合成性等属性数据进行预测,其学科内容基本上被智能医学工程的学科涵盖。计算机辅助药物设计致力于应用各类计算机模拟技术来加速药物发现和设计进程,与化学和生物实验结合,更高效地推进药物开发项目进程。例如,高通量虚拟筛选技术被用于苗头化合物的发现,通过高性能计算平台的算力支持可实现对109~1010级别的化合物数据库进行高通量虚拟筛选。2015年,国防科技大学计算机学院联合中科院上海药物研究所、广州超算中心,成功研发出一种超高通量的药物分子虚拟筛选平台,可以利用“天河二号”超级计算机,在一天内完成对4200多万个化合物的计算评价,相当于把包括现有药物、天然产物和人工合成有机化合物在内的地球上所有可用于药物研发的化合物都计算筛选一遍。高通量虚拟筛选技术作为先导化合物发现的经典方法仍然被国内外制药公司广泛使用,并可通过与其他技术的融合实现算力优化。
综上所述,计算机辅助药物设计通过对大量数据的分析和挖掘,可以发现潜在的药物靶点和药效,提升药物研发的成功率;通过数学模型和计算机模拟来减少药物优化的不确定性和随机性,增强药物设计的精度和准确性;通过对药物分子进行三维结构预测和作用机理研究,优化药物的活性和选择性。计算机辅助药物设计以计算机技术为工具,通过多学科交叉,从工程角度解决药物开发项目的实际问题,与智能医学工程的培养目标高度契合。因此,在智能医学工程专业开展计算机辅助药物设计教学具有一定的科学性。
三、计算机辅助药物设计教学侧重于实践,通过理论教学和实践项目相结合,提高学生运用计算机辅助药物设计技术解决实际问题的能力
计算机辅助药物设计是一门应用性较强的学科,学生在学习过程中不止要求掌握相关技术的理论原理,更重要的是针对实际问题设计有效的解决方案。考虑到计算机辅助药物设计涉及多种基础学科和应用学科与技术,本课程的理论部分总共分为三个部分进行讲解。第一部分是计算机辅助药物设计的知识背景和交叉学科基础,主要围绕药物研发、生命科学及药学基本理论、Linux操作系统展开,内容涉及生物化学、药物化学、计算机科学等领域。生物化学和药物化学是药物研发的核心内容,而Linux操作系统则是计算机辅助药物设计中常用的操作系统,该部分内容旨在阐明计算机辅助药物设计的多学科知识如何相互关联来解决药物研发的关键科学问题。第二部主要讲解在药物设计研究中的常用数据库,详细介绍了药物小分子、靶点、生物学通路、毒理性质等数据库的使用流程,以及数据库中不同属性数据的来源和在实际运用中的意义。这些数据库为药物研发提供了丰富的信息资源和数据支持,为计算机辅助药物设计提供了重要的基础。第三部分是计算机辅助药物设计的方法和软件,详细介绍了计算机辅助药物设计中的基本原理和软件模块,该部分内容是实现药物研发自动化的关键,以帮助研究人员快速、准确地进行药物研发,并提高药物研发的效率和成功率。