科学网-iOptics | AI赋能视网膜精准投射实现沉浸式裸眼3D桌面显示（中山大学周建英、朱炬波教授团队）-科爱KeAi的博文

iOptics | AI赋能视网膜精准投射实现沉浸式裸眼3D桌面显示（中山大学周建英、朱炬波教授团队）

2026-3-10 08:42

阅读：1807

文章导读

裸眼3D显示作为沉浸式视觉技术的重要发展方向，旨在摆脱传统眼镜或头戴式设备的束缚，为用户提供自然、舒适的立体视觉体验。在医学可视化、工业设计、人机交互、泛娱乐与电子游戏等领域，裸眼3D被认为具有广阔应用前景。然而，尽管该技术已发展数十年，其规模化应用仍受多重瓶颈制约。

目前的主流裸眼3D系统依赖视差光栅、柱透镜或指向背光等结构，将不同视图分别投射至左右眼以产生立体视觉。这种基于预设的离散视区设计，仅当用户双眼精确处于特定空间位置时，才能获得正确的双目图像；一旦用户发生轻微头部或眼睛移动，就可能偏离最佳视区，引发串扰、鬼影、亮度不均或闪烁等问题，严重影响观看舒适性与立体稳定性。其次，裸眼3D系统本质上是强用户依赖的动态系统，不同个体的瞳距差异、头部姿态变化、视线方向改变以及自然的无意识微动，都会改变双眼空间位置，这对系统实时调节能力提出极高要求。再者，环境光变化、佩戴眼镜产生的反射折射等外部因素，进一步增加了视觉系统的不确定性。

更为关键的是，当系统引入眼动追踪来动态匹配视区时，数据采集、处理与光学调制之间存在数十毫秒级的端到端延迟。在此时间内，用户眼睛已发生位移，导致投影光束无法准确对准目标视网膜位置，从而抵消了动态追踪带来的优势。

为此，中山大学周建英、朱炬波课题组提出了一种面向桌面级裸眼3D显示的AI辅助视网膜投影框架，并将其集成于时序指向背光裸眼显示架构（Time-Sequential Directional Backlight Autostereoscopic Display, TS-DBAD）之中，构建出具备延迟感知能力的动态显示系统。该策略的核心思想并非简单提高追踪精度，而是引入人工智能算法对视网膜未来位置进行实时预测并完成端到端的延迟补偿，成功将定向光传输与观察者视网膜的未来位置进行动态对准，从而在桌面设备上实现了兼具高度稳定性和超高分辨率的3D感知。

AI预测与高分辨率指向背光相结合，不仅解决了延迟与视区离散问题，还在系统架构层面实现了分辨率、视场自由度与视觉稳定性的统一。这一策略为裸眼3D显示从实验室原型迈向实际应用提供了可行路径，也为未来智能化沉浸式显示技术提供了全新的技术思路。

ITATIONS

文章信息

Jinyan Lin, Yong He, Qiayu Du, Kai Huang, Zihao Gou, Dongyan Deng, Jubo Zhu, Jianying Zhou, AI-Powered Retinal Projection for Immersive Autostereoscopic Display, iOptics,2026,100030

DOI: 10.1016/j.iopt.2026.100030

核心研究内容

iOptics

本研究的核心是在TS-DBAD显示架构上构建一套完整的从数据采集到运动补偿的端到端工作流程（如图1所示）。与常规柱镜式裸眼3D显示系统不同，该系统通过光学设计清晰分离了照明光学与显示光学边界，实现了单目3200×2000的无像差、无色差的立体显示效果。

瞳孔跟踪技术通过红外摄像头实时采集瞳孔中心位置数据，获得包含时间戳的多维坐标序列。然而，原始眼动数据往往存在帧率不稳定、时间间隔不均匀及静止状态下的坐标漂移等问题，若直接用于预测，会显著降低模型稳定性。因此，研究团队首先对原始数据进行时间尺度统一与高斯平滑处理，并通过线性插值将数据重采样至固定时间间隔，构建均匀时间轴上的标准化序列。

数据预处理完成后，进一步利用深度学习时序平滑器抑制高频抖动噪声，提升数据的物理连续性与鲁棒性，随后再将平滑器的输出传递给LSTM网络，对未来瞳孔空间位置进行预测。为提升模型泛化能力，研究中引入了数据增强策略，包括随机幅值缩放、随机偏移及时间拉伸等操作，并在模型输入前进行Z-score标准化与主成分分析降维处理。最终，预测结果经逆变换恢复至原始坐标空间，并实时传输至指向背光控制模块，用于动态调节光束投射方向。整个AI推理过程耗时约7 ms，远低于系统约60 ms的端到端延迟，确保预测机制本身不会成为新的性能瓶颈。

为验证模型精度与系统稳定性，开展了可控导轨假人实验。假人安装在三维电动滑台上，可沿X轴进行重复、可控运动，同时存在微小Y、Z轴扰动。这种实验方式能够构建高可重复性的标准运动轨迹，用于评估预测误差。结果表明，在80 ms预测时域下，系统平均绝对误差小于1 mm，均方根误差亦保持在毫米级范围内，预测精度足以支撑稳定的视网膜对准。

真人实验情况更为复杂。真实用户在观看过程中会产生无意识微动、姿态调整及大幅度左右摆动等非规则运动，这对时序预测模型提出更高要求。实验结果显示，模型在自然头部运动条件下仍能准确预测未来瞳孔位置，仅在运动急剧反向的瞬间出现轻微偏差，且未影响整体视觉稳定性。值得强调的是，该AI框架具备数据持续学习与优化能力，随着真实用户数据的不断积累，模型泛化性能有望进一步提升。

图2（优化前后的性能对比）直观展示了系统在未启用AI预测与启用预测后的效果差异。未加载预测模型时，尽管系统可准确检测当前瞳孔位置，但由于约60 ms的系统延迟，当定向光束实际发射时，瞳孔已移动至新位置，导致光斑与瞳孔错位，产生明显串扰与双目图像不均匀现象；启用AI预测后，系统将预测的未来瞳孔坐标提前输入背光控制模块，当光束发射完成时，瞳孔恰好移动至预测位置，实现精准对准，显著改善双目图像稳定性。

图3 补偿前后的双目3D立体显示效果呈现

图3（补偿前后的双目3D显示效果呈现）进一步从图像质量角度验证了优化效果。未优化情况下，左右眼图像存在明显互相渗透现象，高对比区域串扰尤为突出，同时亮度分布不均，易引发视觉疲劳；引入AI预测后，双目图像边界更清晰，串扰显著降低，亮度均匀性明显提升。定量指标显示，串扰由6.3%下降至3.5%，亮度均匀性由73.8%提升至86.1%，且系统帧率保持不变（60 FPS）。这表明AI模块在不牺牲实时性能的前提下，有效补偿了系统延迟，显著提升了动态裸眼3D显示的视觉质量与稳定性。

研究意义与影响

iOptics

该工作围绕裸眼3D显示技术中的关键技术难题：瞳孔动态跟踪不稳定与系统延迟导致的3D效果退化，提出了结合AI预测与指向背光架构的视网膜投影方案，成功克服了分辨率、观看自由度和视觉真实感之间的长期权衡难题。相比单纯依赖增加硬件技术指标或缩短信号链路延迟，基于算法的预测补偿提供了一种可扩展、可迭代改进方向，为高分辨与高品质裸眼3D显示提供了新解法，为裸眼3D智能体提供了工程框架。

TS-DBAD架构与AI预测模块的结合，体现了软硬件协同优化的设计思路，不仅为用户提供了媲美VR的优秀3D用户体验，还完全兼容现有LCD制造工艺，在需要高保真3D可视化的桌面显示器、笔记本电脑和平板设备中展现出规模化商业部署价值

转载本文请联系原作者获取授权，同时请注明本文来自科爱KeAi科学网博客。

链接地址：https://wap.sciencenet.cn/blog-3496796-1525120.html?mobile=1

当前推荐数：0

推荐到博客首页

网友评论0 条评论

该博文允许注册用户评论请点击登录