基于国产工控机的移动办公与人脸识别机器人
作者: 安城安
摘要:随着智能化办公的兴起。文章提出一种基于国产工控机的桌面办公机器人,集成了定时提醒和人脸识别功能。对工控机、电容式触摸屏、小型4G工业路由器、散热风扇、USB相机和云服务器的选型与配置进行设计。构建边缘侧与云端的通信架构,实现了文本转音频、任务清单管理等功能,并部署了离线状态人脸识别比对算法,具有主人识别和陌生人监视功能。实验结果表明,所选人脸识别算法在国产工控机上运行时总体识别准确率大于90%,在3米的距离范围内,随着距离的增加,其识别准确率呈现出下降趋势。人脸比对功能的识别准确率与召回率的大小因测试人员的不同而展现出一定的差异性,总体识别准确率大于95%、总体召回率大于95%、总体精确率接近100%。
关键词:机器学习;移动办公;人脸识别;边缘计算
中图分类号:U231.4 文献标识码:A
文章编号:1009-3044(2025)08-0013-03
开放科学(资源服务) 标识码(OSID) :
0 引言
国产工控机是智能制造的核心设备之一,在工业互联网时代发挥着重要作用。近年来,移动办公和人脸识别技术逐渐普及,为智能化办公提供了新的思路。在工业互联网时代,国产工控机应用于各类控制系统,通过联邦学习等先进技术手段,实现了业务行为的安全检测与数据隐私保护,有效提升了工业控制系统的安全性和防护能力,为智能制造提供了坚实的技术支撑。
随着移动互联网技术的飞速发展和智能手机的广泛普及,以及办公自动化(Office Automation,OA) 技术的日益成熟与完善,移动办公的概念应运而生,并逐渐成为一种新的工作模式。这种灵活的办公方式在航运企业[1]、政务管理[2]等领域取得了显著的应用效果,极大地提高了工作效率和响应速度。
人脸识别技术作为一种基于生物特征识别的先进技术,也在智能化办公中发挥着重要作用。通过对人脸图像或视频流进行精确的分析和处理,人脸识别技术能够自动提取人脸特征并与数据库中存储的特征进行快速比对,从而实现个体身份的准确识别或验证,在远程线上考勤[3]、中医面诊等领域取得了广泛的应用,为身份认证和信息管理提供了便捷高效的解决方案。
基于国产工控机、移动办公和人脸识别技术的发展情况,本文提出一种基于国产工控机的桌面办公机器人,旨在为用户提供智能化的办公体验。桌面办公机器人集成了定时提醒和人脸识别功能。
1 硬件设计
在构建机器人硬件系统时,选择核心及外围设备以确保系统的高效运行和良好用户体验。作为机器人的大脑,工控机选型综合考虑了处理速度、内存容量、存储能力和扩展性等指标,最终采用了具有低功耗、高性能,能在有限空间内提供强大计算能力的国产嵌入式工控机,以满足机器人复杂任务执行需求。
受文献[4]显示屏启发,选用了高分辨率、具有较快响应速度的电容式触摸屏以实现人机交互的直观便捷,支持复杂图形界面设计,提升用户体验,并确保对细微手势操作的精准识别与响应,如图1所示。
为确保机器人与外部网络的稳定连接,配备了具备良好的信号接收能力、稳定的数据传输速度以及安全防护功能并且支持4G网络的小型工业路由器,保障机器人互联网接入、数据交换和远程控制的需求。
针对工控机及其他电子元件长时间运行产生的热量问题,采用了低功耗、高效能的散热风扇,既确保设备稳定运行,又有效控制了噪声水平。
配备2K高清USB相机用于人脸识别功能,采集人脸信息供后端算法计算分析。同时部署了Centos7操作系统的云服务器,与工控机通信,实现文字转音频API交互等功能。硬件设备选型参数,如表1所示。
2 软件设计
2.1 软件系统架构
边缘侧国产工控机采用 Ubuntu 20.04 操作系统,并基于 Docker 容器技术构建软件运行环境以方便代码和环境的部署移植。边缘侧软件系统架构,如图2所示。
边缘侧国产工控机通过外设网卡实现与小型4G工业路由器的连接,进而建立起与云端服务器之间的通信链路。这一通信架构的设计,旨在充分利用边缘计算与云计算的优势,实现数据的高效传输与处理。具体而言,云端服务器不仅承担着数据存储与管理的角色,还具备调用语音交互API的功能,该功能能够实现将文本信息转换为音频信号,从而为用户提供更为直观、便捷的信息获取方式。
在实际应用场景中,当边缘侧国产工控机需要读取用户设定的行程任务清单时,它会向云端服务器发送请求。云端服务器在接收到这一请求后,会迅速处理并响应,将当前用户所设置的任务以数据形式返回给工控机。这一过程充分利用了云计算的强大处理能力,确保了任务信息的及时获取与更新。
为了提升用户体验,系统设计了智能化的任务提醒机制。当到达预设的任务执行时刻,边缘工控机将会发出音频提示,以声音的形式告知用户当前需要执行的任务内容。同时,为了增强任务的提醒效果并确保信息的准确性,云服务器还会将任务详情以电子邮件的形式发送给用户的电子邮箱,作为任务的备份与第二次提示。云端系统架构,如图3所示。
在图3 中,展示了一个云端系统的架构示意图。该架构主要由四个核心模块构成,分别承担着不同的功能与角色。具体而言,模块(a)作为语音交互API,负责处理上传的文本信息,并将其转化为音频数据,随后将这些音频数据传输至模块(b),即云服务器,进行进一步的存储与处理。模块(c)代表边缘工控机,它通过广域网与模块(b)云服务器进行信息交互,从中获取需要提示的时间点以及相应的音频文件。在获取这些信息后,模块(c)边缘工控机负责外放声音,与用户(模块(d)) 进行语音交互,实现信息的有效传达与反馈。
用户在这一系统中拥有多种交互方式:他们可以直接触摸控制边缘工控机进行操作,也可以通过浏览网站来操作模块(b)云服务器,进行如设置行程内容等更为复杂的操作。为了增强信息的传达效果与用户体验,模块(b)云服务器还会向用户发送电子邮件,作为二次提醒与信息的备份,确保关键信息能够准确无误地到达用户手中。这一设计不仅提升了系统的灵活性与用户友好性,也进一步增强了信息的可靠性和安全性。
2.2 人脸识别比对算法
桌面AI机器人具有人脸识别功能,部署离线状态人脸识别比对算法face_recognition[6]。具有判断当前用户是否为机主,以及监视是否有陌生人经过的功能,如图4所示。
图像采集:通过设备上的摄像头捕捉画面中的人脸图像。
人脸检测:在采集到的图像中,使用face_recognition算法库的人脸识别模型检测和定位人脸的位置。这一步的目的是从复杂的背景中分离出人脸区域,以便进行更精确的分析。
人脸预处理:对检测到的人脸图像进行预处理,包括去噪、增强、分割和姿态校正等操作。这些步骤旨在改善图像质量,减少光照、角度、表情等因素对识别结果的影响,确保人脸图像在后续处理中具有统一的姿态和标准。
特征提取:利用face_recognition算法库的特征提取模型从预处理后的人脸图像中提取关键特征。这些特征包括眼睛、鼻子、嘴巴等部位的关键点等信息,它们能够一定程度上区分不同个体。特征提取是整个人脸识别过程中最核心的一步,其准确性直接影响最终的识别结果。
特征比对与匹配:将提取出的人脸特征与预设的主人人脸特征进行比对。这一步骤涉及计算特征向量之间的相似度,可以使用欧氏距离,也可使用余弦相似度等方法,并根据设定的阈值来判断两者是否一致。如果相似度超过阈值,则判定为同一人,否则判定为陌生人。
结果输出与后续处理:根据比对结果执行相应的操作。如果识别出是主人,设备会向主人问好,否则设备会记录陌生人人脸信息并在下次遇见主人时展示陌生人图片。
2.3 定时提醒模块
定时提醒模块具有网页前端、后端服务、邮件提醒等服务。用户行程任务管理系统如图5所示。
网页前端:允许用户通过网站轻松设置、编辑和查看自己的行程安排。支持输入行程内容、日期、时间。
后端服务:负责处理前端发送的请求,存储用户数据(如行程信息、邮箱地址等) ,并根据设定的时间触发提醒事件。后端可确保提醒的准时发送。
邮件提醒:当到达用户设定的时间点时,系统自动发送电子邮件至用户指定的邮箱,包含行程详情等提醒信息。
3 实验结果
3.1 人脸识别
多次选取5名男性和5名女性在不同距离正视摄像头3次,统计后端算法识别出人脸情况(成代表成功,败代表失败) ,某次选取数据如表2所示。
实验结果表明,所选人脸识别算法在国产工控机上运行时,识别准确率达到 90% 以上,在3米范围内测试距离的增加会导致人脸识别准确率下降。
3.2 人脸比对
在本研究中,为了全面评估人脸识别系统的性能,进行了多次实验,每次实验均选取2名男性和2名女性作为测试对象。这些测试对象分别将自己的当前人脸图像设置为机主(即系统预设的识别对象) 的人脸图像。实验设计考虑了不同距离下的识别情况,要求测试对象在正视摄像头时进行识别尝试,以确保数据的多样性和实用性。
在每次识别尝试后,详细统计了人脸比对的结果,主要关注四种情况:真同(True Positive, TP) ,即系统识别结果与实际情况一致,当前测试人员确实与机主为同一人;真异(True Negative, TN) ,即系统识别结果与实际情况一致,当前测试人员确实与机主不是同一人;假同(False Positive, FP) ,即系统识别结果与实际情况不一致,当前测试人员并不与机主为同一人但被错误识别为同一人;假异(False Negative, FN) ,即系统识别结果与实际情况不一致,当前测试人员与机主为同一人但被错误识别为不同人。
通过对这四种情况的统计分析,可以全面评估人脸识别系统在不同性别、不同距离下的识别准确率和误识率,进而为人脸识别技术的实际应用提供有力的数据支持和改进方向。某次选取数据如表3所示(1-2代表人员1为机主,测试人员2) 。
实验结果表明,所选人脸比对算法在国产工控机上运行时识别准确率大于95%,召回率大于95%,精确率接近100%,测试人员的不同会使识别准确率和召回率产生不同结果。
4 总结与展望
本文提出一种基于国产工控机驱动的桌面办公机器人系统,融合了定时提醒与人脸识别两大核心功能。在硬件设计方面对工控机、电容式触摸屏、小型4G工业路由器、散热风扇、USB相机和云服务器进行选型与配置。在软件设计方面,构建了边缘侧与云端的通信架构,实现了文本转音频、任务清单管理等功能,并部署了离线状态人脸识别比对算法,具有机主识别和陌生人监视功能。
实验结果表明,所选人脸识别算法在国产工控机上运行时识别准确率大于90%,人脸比对功能的识别准确率大于95%、召回率大于95%和精确率接近100%。
未来进一步优化机器人的硬件和软件设计,提高识别准确率和运行效率。并将探索更多的智能化办公应用场景与功能,如智能会议、智能客服等场景以及语音交互,机械臂控制等功能,以推动智能化办公的进一步发展。
参考文献:
[1] 吴晨刚.航运企业移动办公通用平台架构设计[J].青岛远洋船员职业学院学报,2024,45(2):22-25.
[2] 程浩.政务移动办公系统安全技术规范在政务领域的应用实践[J].信息技术与标准化,2024(S1):51-55.
[3] 赵永丽.基于人脸识别的人力资源远程线上考勤系统[J].自动化技术与应用,2024,43(8):167-171.
[4] 王飞,张大伟,王振飞,等.基于嵌入式移动桌面机器人的实践教学模式改革与实践[J].中国现代教育装备,2022(7):87-89.
【通联编辑:朱宝贵】