近日,以电子信息工程学院周燕教授为第一作者、JN江南官方为第一署名单位、广东省工业智能检测技术重点实验室为第二署名单位的学术论文“Recurrent Diffusion for 3D Point Cloud Generation from a Single Image”被图像处理领域国际顶级期刊IEEE Transactions on Image Processing(TIP)在线刊登。
从单张图像重建三维形状是自动驾驶、机器人导航和增强/虚拟现实等领域的关键任务之一。然而,由于缺乏深度和视角等关键三维信息,以及存在图像模糊和遮挡等问题,传统的单图像三维重建方法面临着巨大挑战。现有的基于扩散模型的方法虽然在形状重建质量上取得了进展,但仍存在几何不一致性和细节丢失等问题。为了解决这些问题,本文提出了一个三维点云递归扩散框架,通过递归细化噪声预测并结合输入目标的显式指导,显著抑制累积误差并改善细节建模。此外,为了增强网络在单图像推理时的几何感知能力,本文还引入了一种多视图训练方案,配备了视图鲁棒条件生成机制,即使在推理时仅提供单张图像,也能有效提升生成质量。实验结果表明,该方法在两个公共三维形状数据集上的表现优于现有最先进的方法,能够生成具有几何一致性和丰富细节的三维点云。该技术显著提升了复杂场景下的三维重建精度与鲁棒性,为智能机器人环境交互、虚拟现实动态建模等研究提供了新的解决方案。
TIP是人工智能和计算机视觉领域公认的顶级学术期刊,2024年影响因子10.8,是中科院一区TOP期刊,被中国计算机学会(CCF)推荐为A类。被TIP录用的论文需要在理论和工程实践上对相关领域具有重要推动作用。该研究成果得到了国家自然科学基金(61972091)和广东省自然科学基金(2022A1515010101,2021A1515012639)支持。
周燕教授领衔的电子信息工程学院视觉感知与智能信息处理团队,长期深耕学术研究与成果转化,聚焦人工智能视觉技术、图形图像处理、机器学习等前沿方向,积极探索其在智能制造、智能交通、智慧教育等多领域的创新应用。
2024年该团队发表高水平论文共14篇。其中,中科院SCI一区论文4篇、CCF A类国际顶级学术会议论文2篇,分别为周燕教授在Pattern Recognition发表2篇,何志敏博士在CCF A类会议AAAI和Neural Networks各发表1篇,易长安博士IEEE Transactions on Circuits and Systems for Video Technology和CCF A类会议ACM MM各发表1篇。同时,何志敏博士在《中国科学:物理学 力学 天文学》(中国科技期刊卓越行动计划中文领军期刊)、周燕教授在《计算机辅助设计与图形学学报》(CCF T1)期刊上各发表1篇中文核心期刊。这些成果不仅彰显了团队在学术研究方面的深厚积淀,更充分展现了其在前沿技术领域的卓越创新能力。
稿件来源:电子信息工程学院
通讯员:周月霞
Copyright JN江南官方 2024 . All Rights Reserved.
新版网站试运行中,如您发现问题请联系我们xchb@fosu.edu.cn,感谢您的关注!