AR技术概述
顾名思义,增强现实是对现实的增强。从广义上讲,增强现实已经涵盖了生活的各个方面,比如树干LED灯,创造艺术效果;例如,在鬼屋里放一些声源,营造一种可怕的氛围;甚至喷香水,都是为了增强现实,增强视觉、听觉、嗅觉等感官感觉,当然,这些都是为了增强现实,似乎没有那么科技的感觉。
一般来说,增强现实是指通过屏幕或投影设备显示虚拟内容的视觉增强。例如,手机相机预览中常见的显示3D动画(如QQ传火炬),微软HoloLens,Google的Tango,还有Magic Leap等等。
总体上看,AR技术的关键在于设备对周围环境的感知和理解:最基本的是确定设备本身的空间位置;更先进的是实时重建环境(SLAM);更先进的是识别、认知和交互。在这方面,定位是最基本的。只有准确确定设备本身的位置(和方向),虚拟内容才能与现实很好地结合起来,以达到足够的现实感,过程需要实时进行。这也是VR关键技术之一。
目前用于移动设备的AR主要有两类:基于图片标记的AR和基于IMU的AR,
QQ基于图片标记的传火炬是典型的AR,用手机拍摄特定图像(另一个用户手机上显示的火炬图片),在预览图片中叠加3D动画效果,移动或旋转手机,3D动画始终与火炬图片保持固定的位置关系,从而增强现实体验。Pokemon Go则是基于IMU AR典型的是通过设备本身的陀螺仪、加速度计等传感器数据进行定位,通过陀螺仪可以测量设备旋转,通过加速度计可以测量位移。基于IMU的AR实现相对简单,但精度低,drift严重(累积误差越来越大),适用场景有限。
本系列文章主要讨论基于平面图记的文章AR技术实现可分为两类:Marker和Markerless,两者的区别主要在于图片标记是否规则:
Marker:通常是黑白方格按一定编码的图片;Markerless:普通图片。与普通图片相比,具体编码Marker识别和跟踪更简单,但应用有限,所以现在主流AR应用都是Markerless是的,识别一张普通的平面图,然后在上面叠加3D内容,如QQ传火炬。
二、原理正如前面所说,AR关键在于设备本身的定位,基于图片标记AR,即通过相机拍摄已知图片,根据图片在相机图片中的位置确定相机的空间位置,即设备的空间位置。下图的主要过程包括拍摄图像、图像处理和更新虚拟内容三个阶段,其中图像处理是核心。图像处理完成后,获得相机外参(Extrinsic,相机坐标系与世界坐标系的变换关系),然后应用于预览图片的叠加层(如OpenGL或3D发动机环境),更新虚拟内容的位置,完成整个帧的处理过程,然后不断重复这个过程,使虚拟内容在设备移动后始终显示在正确的位置。
以图像处理过程为核心,还包括一些子过程,如相机内参标定、预览帧特征提取、匹配、相机外参标定等。
1.相机内参标定
相机的成像过程可以看作是将空间点转换到图像点的过程。如果忽略了相机畸变的影响,整个转换过程是线性的。相机中设定的参数的目标是找到转换参数(包括畸变),以便通过数学计算准确地描述相机的成像过程。
不考虑镜头畸变,相机成像的变换模型可以表示如下:
A是相机的内参矩阵,包括x、y方向焦距fx、fy和图像中心cx、cy。空间点M首先通过相机外参[R|t]将坐标系转换为设备(相机)(DCS),然后通过相机内参A转换到图像坐标系(ICS),成像在(u, v)处。确定相机内参的过程为内参标定,内参与相机的焦距、硬件工艺通常可以离线完成。内部参考标定常采用张正友棋盘格标定法,操作简单,精度高:只需从不同角度拍摄同一棋盘格的图片即可完成标定。详见此。
2.图像特征提取与匹配
图像特征点(Key Point)又称兴趣点,可以认为是图像上具有特定特征的局部位置标记和特征描述(Descriptor)表示该特征的特征量,可用于区分和匹配不同的特征点。良好的特征点应具有以下特征:
重复性:在不同的条件下(如旋转、尺度、光线),两幅图像中对应的特征越多越好。独特性:特征的振幅模式需要多样性,才能区分和匹配。数量:一般来说,必须检测到更多的特征,但在图像检索中,过多的特征会对检索的实时性产生一定的影响。理想情况下,检测到的特征数量在较大范围内,然后可以通过简单的阈值进行调整。准确性:应能够准确定位特征,包括图像空间和尺度空间的准确定位。效率:检测和描述时间越短越好,以便后续实时应用。旋转不变性和尺度不变性是可重复性的关键,SIFT改进算法SURF特征提取算法常用,FAST它以快速而闻名,适用于实时场景。详情请参考本博客。
特征匹配是指在提取两张图的特征点后,根据特征点的描述子进行匹配,并获得匹配点对集,用于后续的单应矩阵计算。特征匹配可以看作是一个分类过程,如简单的汉明距离匹配,或基于k近邻算法通过比率测试减少错误匹配。FLANN匹配开源库的常用特征。
3.相机外参标定
相机外参标定在上述相机成像公式中求取[R|t],在已知相机内参的情况下,根据两个图像之间的特征点,可以找到两个图像之间的空间位置关系(旋转R和平移t),如果其中一个图像是输入的标记图像,则设置在世界坐标原点,则该过程在计算机视觉中PnP(Perspectire-n-Point)问题,也可以看作是相机的外参标定过程。这个问题可以基于直接线性转换DLT(Direct Linear Transfor ** tion)结合最小二乘法求解,也可以通过迭代方法根据初始值求解。这个问题可以基于直接线性转换DLT(Direct Linear Transfor ** tion)结合最小二乘法求解,也可以根据初始值通过迭代求解。外参标定过程的重点是去除误匹配,常用RANSAC本文可参考算法。
三、结语VR让人体验不同的世界,AR它是为了让现实世界更美好,有人把它带走AR作为一个新的计算平台,这并不过分。想象一下,最早的寻呼机和功能机只提供一维通知、电话或短信服务。在智能机器时代,随着大屏幕的出现,二维图像和音频和视频已经成为主流。下一个时代可能是3D技术、AR它将是计算设备的核心能力之一。
开云在线注册 承接各类微信小程序开发制作、小程序定制、APP 网站 开发制作,联系电话 18221533805、15900430334
区块链技术本身不是全新的技术,那是什么技术呢?
海洋技术|声纳技术的发展道路
机械加工技术,微型机械加工技术快速成形技术精密超精密加工技术
CHP 热电联产技术(CHP) 技术
技术方案沟通之技术要素的提取
什么是技术创新?什么又是技术?
揭秘3D打印技术之按需滴落技术(DOD技术)
继刘强东“技术技术技术”后首次打造跨部门项目 京东技术布局迈入变现阶段
什么是技术贸易中的技术商品?
什么是信息技术?信息技术主要包括哪几种技术?
非技术人看技术岗位选择
补牙新技术--树脂渗透技术
DSP系统技术架构参考【技术类】
技术分析4:K线技术
海鲜粥培训 早点技术 包子技术 早餐早点技术培训
射频技术秘籍 - 射频技术升级
技术干货|容器与虚拟化技术
揭秘3D打印技术之融化挤压成型技术(MEM技术)
华转网:技术入股、技术许可和技术转让有什么区别?
本田EDT技术 地球梦想技术浅释
联系我们