努力13年,只为让AI识别速度快些再快些
作者: 依江宁上班刷脸打卡、进小区门禁刷脸,人脸识别的时间只需0.1秒,误判率仅为百万分之一。为了这些极致的便捷,彭菲——
经过无数次尝试,她终于发现,庞大的计算量可以通过重构算法进行合并优化。以此为突破口,她和同事们将人脸识别速度提高近10倍
彭菲幼年时生活在湖南省一个偏远的小山村,上小学时几个年级合在一起上课,平时也不用考试,直到四年级才转到镇里上学。因为聪明好学,她几乎每次考试都是班级第一名,于2003年考入清华大学生物医学工程系。
2010年,正攻读硕士学位的彭菲对生物特征识别研究产生了浓厚兴趣,毕业后坚定地选择了从事生物特征识别方面的工作,入职北京汉王智远科技有限公司(以下简称“汉王科技”),做了一名人工智能算法工程师。她的工作,是通过计算机代码让机器能够看、听、说、想,并最终服务于人。
汉王科技是国内最早进行人脸识别研究的企业之一。当时,人脸识别技术主要来自国外,引进费用昂贵。彭菲入职后接到的第一个任务,是对红外人脸识别产品进行升级。
当时,彭菲对人脸识别的应用了解并不多,加之我国对这项技术的研发刚刚起步,国产芯片的速度无法满足高强度的算力需求,因此彭菲和同事们一展开工作便遭遇难题——相关技术基本被国外垄断。
为了打破技术垄断,实现技术与产品的国产化,彭菲和同事们只能从底层技术入手,重点针对国产芯片的特点,设计更加简洁高效的人脸特征,再一点儿一点儿地做成代码并持续优化。
一次成功的人脸识别,需要计算机先完成81个对齐点的定位对齐,再提取相应特征进行比对。但由于每张人脸都包含大量的数据信息,处理起来并不容易。刚开始,彭菲他们做出的人脸识别产品识别速度很慢,用户体验不佳。彭菲便一次次对产品进行改进,而改进的重点就是在算法上进行突破。
经过无数次尝试,彭菲终于发现,庞大的计算量可以通过重构算法进行合并优化。于是,她以此为突破口,带领几名同事奋战6个月,终于拿出一套低成本、低功耗的全国产解决方案。这套方案创新了人脸识别技术核心算法,将识别速度提高了近10倍。根据这套方案生产出来的红外人脸识别产品,是当时全球同类产品中识别速度最快的。
但彭菲没有就此止步,将工作重心从红外人脸识别转向了可见光人脸识别,因为可见光识别受场地局限更小,应用场景更广。那段时间,她通过模拟增加或去掉不同光照类型的方式,反复调整算法,顺利实现了效果提升。这项研究获得了北京市科学技术进步奖二等奖。其可见光人脸识别算法通过了公安系统的多个权威机构认证,相关产品及解决方案曾服务于新中国成立70周年庆典、G20峰会等多项重大活动。
新冠肺炎疫情期间,她和团队研发的能够在戴口罩状态下对人脸进行识别的产品通过测试,不但速度快,而且准确率超过99.99%,属全国首创
彭菲一直以用户需求为研发导向,非常重视真实的业务场景,不止一次对团队成员强调:“更好地满足用户需求,就是我们工作的价值所在。”
2020年年初,新冠肺炎疫情暴发。正值春节假期,客户反馈在使用门禁时戴着口罩识别不出身份,但口罩又不敢频繁摘戴。彭菲立即联系同事开线上讨论会寻求解决办法。
“那段时间压力真的挺大。一方面,大家都迫切希望解决这个问题;另一方面,团队之前的研发都是基于整个面部进行特征提取,但戴口罩后人脸被遮挡大半,能否通过不完整的人脸来完成识别,我也没把握。”至今回忆起来,彭菲仍对当时的情景印象深刻。缺少可借鉴的经验,彭菲便和团队成员一起尽量多准备几套方案,然后利用白天上班时同事们线上人脸识别打卡的机会对方案进行测试,晚上汇总测试数据并进行比较,再根据效果进一步优化。
整个春节,彭菲基本上都在工作。从红外光到可见光,从单一环境到复杂环境,从生物特征识别到环境视频分析,她向着算法的极限不断发起挑战,在短时间内便攻克了被口罩遮挡后面部无法识别的难题。
2020年2月初,由彭菲团队研发的能够在戴口罩状态下对人脸进行识别的产品通过测试,人脸识别的时间只需0.1秒,误判率仅为百万分之一。
彭菲当年入行时,人工智能还属于冷门。随着计算机算力的大规模增长,人工智能技术的研发如今已进入爆发期。有人说彭菲运气好,赶上了好时机。殊不知,科技带来的每一个风口,都是准确判断与坚持不懈的结晶。彭菲常说,做技术无法一蹴而就,而是要长期积累,不断朝着一个方向深挖,慢慢前进,持续突破,直到有一天时机成熟。
从人脸识别入行,彭菲逐渐向视频分析、语音识别、自然语言理解、生成式AI技术等多个人工智能领域拓展。截至2023年年底,她已获得发明专利授权17项,研发成果不断应用到公司的新产品中,取得经济效益近10亿元。
她的研究成果还应用于监测输油、输气管道断裂、破损等,至今已累计为国家挽回经济损失上百亿元
彭菲希望自己的研究成果不仅仅应用于人脸识别,还能应用于更广泛的领域,比如野外的输油、输气管道监测。输油、输气管道动辄长达数百甚至数千公里,一旦出现断裂、破损,就会造成严重损失。但要确保管道安全,不管是人工巡查还是远程监控,都无法实现24小时不间断。彭菲设想,若通过摄像头24小时无死角监控,并利用智能视频分析系统对视频内容进行自动识别与分析,就能及时发现险情并报警,以便工作人员第一时间赶到现场处置。
听上去挺简单,但做起来却不容易。对于彭菲来说,每一个算法能成功应用到产品中,都需要完成两个步骤:一是建立模型,二是收集大量数据来拟合模型参数。这次,她遇到的难题是现实中管道出险的情况极少,难以获取足够多的数据供模型训练。但彭菲从来不会轻言放弃,越难她越要做。
通过不断探索与尝试,结合样本增强、迁移学习及多任务训练等方式,她终于完成了算法的方案和流程设计,并完美地解决了产品化过程中遇到的问题,实现了初期火灾、工程车辆非法区域工作等险情的自动监测,帮助相关部门规避了众多安全隐患。
目前,该成果已应用于全国多个省市,落地项目包括中石油、中石化、国家管网集团等单位的野外油气管道智能化保障项目,至今已累计为国家挽回经济损失上百亿元。
彭菲和同龄人一样活得率性、真实,但又与同龄人有诸多不同,比如她总是以近乎苛刻的标准审视自己的工作。因为人工智能是个日新月异的领域,需要从业者具备很强的专业技能,还要有刻苦钻研的精神和一丝不苟的作风,以及超强的创新及学习能力。
在彭菲的办公桌上,摆放着一家三口的照片。接受采访时她说:“我爱我的工作,也爱我的家庭。我相信,未来在人工智能的帮助下,我们可以更高效地完成工作,有更多时间陪伴家人、享受生活、追求自己的兴趣和梦想。”
这不仅是彭菲的美好愿景,也是每一位加速奔跑在新赛道的大国工匠希望给我们这个时代的最好礼物。
在成都参加2023年“大国工匠年度人物”入围名单揭晓活动时,彭菲跟各个行业的入围者交流,发现大家都是在某个行业里深耕多年,始终朝着一个方向努力迈进,最终把一项技能磨炼到近乎完美的行业达人。他们当中的每个人,说起自己的工作时都神采飞扬,既自信又自豪。彭菲一次次被感动,也体会到了找到同行者的快乐。
【编辑:冯士军】