中山大学研发无失真视觉系统提升定位精度 可应用于自动驾驶等
全景视觉-惯性里程计(VIO)系统对于在无全球定位系统(GPS)信号的环境中导航至关重要,但其应用潜力常受限于几何投影模型不一致所引起的图像失真问题。现在,有一款名为Geotri-VIO的新系统可解决这一挑战。该系统引入了一种以三角棱镜为中心的多棱镜投影模型,保留了全景图像中的几何一致性。此种创新系统确保了更为精确的特征提取与跟踪,从而大大提升了定位精度。基于多个基准数据集和真实场景数据的实验结果表明,Geotri-VIO一直优于传统方法,在具有挑战性和动态的环境中均表现出色。该项研究标志着,研究人员在各种苛刻环境下实现高精度、宽视野的视觉导航方面迈出了重要一步。
卫星导航(图片来源:中山大学)
从自动驾驶到虚拟现实,现代技术无不依赖于精确的定位和环境感知能力。全景摄像头凭借其超广角的视野,成为此类应用的理想之选,然而其弊端在于会产生几何失真。传统的投影模型,如等距柱面和立方体映射,均无法维持空间一致性,进而导致特征探测和运动估计出现偏差。视觉-惯性里程计(VIO)系统通过集成摄像头和惯性数据来估算运动,此类失真对其产生不利影响。无法在整个视野范围内保持准确的几何关系,将降低跟踪的可靠性,并限制其在复杂场景中的部署。鉴于上述挑战,重新设计以空间完整性为核心的投影模型的需求日益迫切。
据外媒报道,《卫星导航》期刊上发表的一项研究表明,中国中山大学(Sun Yat-sen University)的研究团队推出了一种名为Geotri-VIO的下一代全景视觉惯性里程计(VIO)框架。该团队创新性地开发了多棱镜投影法,有效恢复了全景图像间的几何一致性。通过构建围绕摄像头球形视场的切线三角棱镜结构作为投影平面,该系统能够确保精确的空间映射和特征跟踪。在多个公开的真实时间数据集上进行验证后,结果显示,Geotri-VIO在定位精度和鲁棒性方面均显著优于LF-VIO和VINS-Mono等现有领先系统,标志着广角视觉定位技术的一次重大突破。
Geotri-VIO的核心是一项基于数学原理的创新技术——三角棱镜投影模型。该模型让每张图像平面都与全景摄像头的球面相切,从而保留了像素间的空间关系,校正了全方位投影中常见的非线性失真。研究人员对不同面数的棱镜模型进行了评估,发现三角形结构在局部和全局几何一致性之间实现了最佳平衡。
大量实验结果证实,该投影方法显著提升了点和线特征的提取性能,而这些特征正是姿态估计的核心要素。与其他模型相比,Geotri-VIO表现出更高的特征跟踪率,并有效降低了姿态估计误差和轨迹误差。例如,在室内PALVIO数据集及室外真实场景序列中,该系统能够实现高达39%的绝对轨迹误差降幅,并在动态环境下展现出更强的鲁棒性。
值得注意的是,Geotri-VIO经过设计,融合了基于点和基于点线的跟踪方法,从而使该系统具有极高的通用性。该系统运行效率高,投影过程导致的计算负荷几乎可以忽略不计,因而能够实时运行,甚至在移动机器人和自动驾驶的高要求场景下也能运行。其性能优势源于一个关键的见解:尊重全景空间的真实几何结构。
Geotri-VIO是一种强大且无失真的视觉系统,在各种行业中都具备广泛的应用潜力。在机器人技术和自动驾驶领域,其能够在城市、室内或GPS信号受阻的环境中提供更可靠的定位。对于增强现实和虚拟现实应用而言,改进后的空间一致性能够确保更稳定且更具沉浸式的体验。该框架具备灵活性,兼容了点特征和线特征,表明其能够适应不同的平台和任务。至关重要的是,其低计算负荷特性使其适用于实时嵌入式系统。随着全景成像技术的不断发展,Geotri-VIO为实现准确且广视野的视觉感知提供了一种及时且具有变革意义的解决方案。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。