智能手机平台增强现实技术的应用探究
作者: 薛地
摘要:随着手机软硬件的快速发展,增强现实技术在手机端的应用层出不穷。传统行业通过与增强现实技术结合,碰撞出新的产品形态或带来全新的虚实融合体验。智能手机作为增强现实应用的平台,其便携性、可交互性和良好的视觉体验等方面均提升了用户体验。本文阐述了增强现实技术在手机载体上的不同形态、开发平台、核心技术及应用场景等。业界通过对该技术的深入研究,不断提升手机应用的体验差异和创新性。期待增强现实技术在智能手机平台有更大的发展空间,推动各个行业或领域的进步。
关键词:智能手机;增强现实;AR手机应用;移动端AR;AR交互技术
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2024)19-0131-05
1 概述
1.1 背景
随着手机CPU和其他硬件性能的不断提升,手机已经集成了越来越多的新功能,为用户提供更加丰富和便捷的使用体验。多摄像头系统的普及,特别是深度摄像头(如TOF深度摄像头或3D结构光摄像头)的应用,使手机不再是简单的拍照工具,而是具有多种高级功能的设备。结合增强现实(AR) 技术,这些硬件能够将虚拟元素添加到现实世界中,从而为用户提供全新的娱乐、教育和工作方式。
在智能手机市场规模方面,据Mordor Intelligence机构最新统计数据显示,预计到2024年智能手机市场规模将达到15.1亿部,预计到2029年将增长至18.5亿部,预测期内(2024—2029年)的复合年增长率为4.10%[1]。
智能手机的快速普及以及手机软硬件技术的发展,为AR应用的手机化实现了可能。2017年6月,苹果在WWDC上首次推出了ARKit,这是一款面向iOS 设备的增强现实(AR) 开发平台,允许开发者利用iPhone和iPad的硬件功能来创建富有互动性的AR应用程序;2017年8月,谷歌推出了面向Android设备的ARCore。苹果的ARKit和谷歌的ARCore的面世,极大地降低了AR应用在手机端的技术门槛,为开发者提供了更为便捷、高效和强大的工具。
1.2 研究目的、意义与方法
增强现实技术将虚拟元素准确放置到现实世界中,进一步丰富了人们的视觉体验(见图1) 。基于增强现实技术的AR手机应用,已经逐渐影响了教育、医疗、娱乐等多个领域。通过增强现实技术赋能传统行业,可以为其创新发展提供更多可能性。
本研究旨在通过研究增强现实交互技术在实际应用中的表现,进一步提升用户体验,发现潜在的新场景,为智能手机增强现实领域的未来发展提供有益的参考与启示。
为确保本研究知识理论和数据来源的权威性,文章所依据的理论知识与数据资料均来源于SCI、北大核心等国内外权威学术资源。具体研究方法包括文献查阅、案例分析、用户调查和实验研究等。这些方法用于分析AR技术在智能手机上的应用场景、核心技术以及用户体验,从而为未来的研究和开发提供科学依据。
1.3 相关概念介绍
1)增强现实。增强现实技术是一种基于计算机实时计算和多传感器融合,将现实世界与虚拟信息结合起来,达到“实中有虚”的表现效果[2]。该技术通过对人的视觉、听觉、嗅觉、触觉等感受进行模拟和再输出,并将虚拟信息叠加到真实信息上,为人们提供超越真实世界感受的体验。目前广泛接受的一个定义是R.T.Azuma在1997年提出的,他认为增强现实应该具有三个特征:结合真实与虚拟、实时交互、支持三维注册[3]。
2) 移动增强现实(Mobile AR) 。在1997年,哥伦比亚大学的Steve Feiner等人开创性地研发出了一套名为“移动增强现实系统”(MARS) 的第一套移动增强现实系统[4]。该系统通过头戴式显示器,根据用户的位置和方向实时提供各类信息,由此产生了移动增强现实(Mobile AR) 的概念。随着手机、平板电脑等移动设备的快速发展,移动增强现实(Mobile AR) 的涵义也不断丰富与拓展。从最初单纯的“可移动性”概念逐步演化为特指在移动端设备上实现的增强现实技术。
2 增强现实技术在智能手机平台的发展
2.1 增强现实技术在智能手机上的硬件支持
智能手机从最初的单摄像头设计,发展到现在的多摄像头系统,以及结构光和TOF技术的引入,极大地丰富了手机摄影和交互体验。在后置摄像头方面,通过采集深度信息,手机可以实现更精准的测距和场景感知,从而优化拍摄效果和增强现实(AR) 等应用的体验。
随着计算机视觉等技术的快速发展,各大手机厂商纷纷开始升级手机的硬件技术。2017年9月,苹果推出了全球首款搭载3D 结构光技术的智能手机iPhone X;2019年10月,发布的iPhone12及之后系列均集成了LiDAR(激光雷达)摄像头。这两种不同的深度摄像头均带来了全新的AI+AR体验。其他手机品牌也陆续跟进,比如三星的S10 5G版、华为Mate 30Pro、OPPO R17 Pro的前后摄像头均采用了TOF摄像头方案。在芯片方面,华为的麒麟AI芯片技术和苹果的AI芯片均比原先的芯片提供了更快的处理能力和更优的软件体验。
总的来说,智能手机摄像头技术的不断升级和演变,为用户带来了更丰富、更便捷的交互体验。同时,增强现实技术在智能手机上的应用形式随着硬件的发展也呈现多元化。
2.2 增强现实技术在智能手机的应用呈现形式
1) 手机APP AR。小程序AR和WebAR是增强现实(AR) 技术在不同平台上的应用形式,它们各自具有独特的特点和适用场景。
2) 手机APP AR。这种形式的AR应用通常集成在手机应用程序中,可以充分利用手机的硬件加速功能,提供流畅的AR体验。同时,手机APP AR可以为用户提供丰富的交互功能和定制化体验,因为开发者可以根据具体需求设计和实现各种AR效果和交互逻辑。
3) 小程序AR。这种形式的AR功能在微信小程序、支付宝小程序等平台上实现[5]。它是一种轻量级的应用程序,用户无须下载安装即可使用。然而,由于小程序平台的限制,小程序AR在功能和性能上无法与手机APP AR相媲美。
4) WebAR。通过Web浏览器实现的AR技术,这种形式无须安装任何应用程序,用户只需访问特定的网页即可体验AR效果。WebAR具有跨平台和易传播的优势,可以在不同操作系统和设备上实现一致的AR 体验。然而,受限于Web浏览器的性能和兼容性问题,WebAR在某些方面无法达到手机APP AR的效果。
综上所述,手机APP AR、小程序AR和WebAR各具特色,适用于不同的场景和需求。开发者需要根据具体的应用场景、用户需求和技术实现难度进行综合考虑。
2.3 智能手机的AR 开发平台分类
基于AR的应用开发技术复杂,操作系统和设备种类繁多。为此,不同公司陆续推出了各种AR开发平台,这些平台为开发者提供了一整套工具集,用于创建和部署增强现实(AR) 应用程序,通常包含各种开发工具、API、SDK以及相应的文档。AR开发平台不仅可以降低开发难度,提供更加丰富的功能,更重要的是可以跨平台支持。这意味着开发者可以一次编写代码,然后在多个操作系统和设备上运行。
例如,Unity的AR开发平台为了兼容各类型的底层SDK,搭建了一个开放型的架构体系平台——Sub⁃systems,封装了许多不同类型的AR能力。这使得开发者可以减少在不同架构下的迁移和调试工作,将更多的精力放在AR应用程序的设计上[6]。
以下是市场上不同AR开发平台的汇总整理:
3 增强现实在智能手机平台的核心技术及典型应用
3.1 跟踪与定位技术
随着增强现实技术在智能手机领域的深度探索,能否确切计算手机设备的位置和方向成为将数字内容正确叠加在现实世界的关键要素。传统的GPS定位方法,其精度误差通常在10米左右,难以满足AR 应用的高精度要求。辅助定位技术如Wi-Fi和蓝牙尽管能提供一定程度的精度提升,但往往需要提前布置且成本高昂,同时其定位精度仍局限于米级。
相比之下,基于计算机视觉的定位技术通过预先对环境进行拍摄采集,能够实现分米级甚至厘米级的定位精度。这一突破性技术进展主要归功于同步定位与地图构建(SLAM) 技术的应用[7]。SLAM技术允许运动物体在感知环境信息的同时,实时计算自身位置并构建环境地图,从而实现对现实世界的高精度理解。目前,SLAM的应用领域主要有机器人、虚拟现实和增强现实。
在AR 应用中,即便用户处于持续移动状态,SLAM技术仍能不断更新对周围环境的认知,确保数字内容与现实世界的精确对齐。这种技术使得数字内容与现实世界建立了明确的位置关系,进而提升了AR应用的真实感。例如,长沙IFS打造的全国首个商场混合实境导航系统iGO系统,在其实现的店铺导航、信息展示等功能中就使用了SLAM技术。
基于计算机视觉的定位技术也面临一些挑战,如依赖视觉特征,对于缺乏纹理等特征的场景,整体的定位效果较差[8];或者当用户移动较快、场景变化快时,由于计算量过大,手机无法及时负载和更新。因此,融合视觉SLAM技术、惯性、里程计和GNSS等多传感器以满足不同场景的信息需求,优势互补,可以提高系统的精度与稳定性。
3.2 云锚点技术
2018年,ARCore推出了云锚点(Cloud Anchors) 功能,这一创新技术允许用户在现实空间中绘制虚拟锚点,进而将虚拟对象无缝融入增强现实场景中。通过云锚点的应用,用户不仅能够将虚拟对象放置在特定位置,还能将这些锚点的经纬度信息上传至云端,这一步骤确保了锚点信息的全局可访问性和共享性[9]。在同一物理环境中的其他用户可以通过下载这些云锚点数据,将其添加至自己的设备上,从而能够观看到锚点处创建的AR图像,并与这些虚拟对象进行实时互动。这种跨设备的无缝衔接极大地丰富了AR体验的多样性和社交性。
随着用户希望保存创作内容的需求出现,持久性云锚点(Persistent Cloud Anchors) 概念也被Google 提出。持久性云锚点功能不仅能够保持虚拟对象在空间中的稳定性,还能确保数据在云端的长期存储。以Mark AR应用为例,它使用户能够与公共场所的其他人共同生成和共享AR内容。这种协作性的创作方式不仅提高了内容的丰富度,还增强了用户之间的互动和交流。此外,微软推出的Minecraft Earth游戏也是持久性云锚点技术的应用之一。通过Azure SpatialAnchors技术,玩家能够在现实世界中搭建虚拟建筑,并邀请其他玩家共同参与数字世界的建设。这种跨平台的互动体验不仅拓展了游戏的边界,还为玩家提供了更为沉浸式的虚拟世界探索之旅。
3.3 图片检测
在教育领域常见的AR图书应用使用了图片检测技术。AR图片检测技术主要依赖于计算机视觉和图像处理算法,这些算法能够识别和分析图片中的特定特征或标记,从而触发相应的AR效果。例如,通过识别图片中的二维码、条形码或特定图形,AR系统可以触发虚拟物体的叠加、动画效果或交互功能。具体应用例子包括AR地球仪、AR名片和AR图书[10]。
3.4 平面检测
平面检测是增强现实(AR) 应用中的一项关键技术。通过识别和追踪现实世界中的平面,如地面和墙壁,能够将虚拟对象准确地放置在平面上,从而创造逼真的AR体验[11]。例如,王者荣耀和闪耀暖暖在涉及3D虚拟模型展示时,就使用了这项技术。
在AR平面检测过程中,开发者可以指定检测模式,如水平、垂直或两者兼有。当平面被成功检测到时,AR系统可以创建游戏对象(如平面预制件)来表示这些平面。通过这种方式,这些游戏对象可以用于放置虚拟对象,并确保它们与现实世界中的平面保持正确的对齐和位置关系。