我院师生在国际计算机视觉领域顶级会议发表人工智能基础研究的最新成果

发布时间:2026-03-05作者:张晶晶

近日,计算机与网络空间安全学院科研成果再传捷报。2023级硕士研究生谭玉婷(第一作者)、程曦龙在秦云霄副教授与导师张晶晶教授的联合指导下,合作完成的论文《Towards Stable Self-Supervised Object Representations in Unconstrained Egocentric Video》,被国际计算机视觉领域顶级会议IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026(简称CVPR 2026)正式接收。该成果标志着学院在人工智能基础研究领域取得重要进展,充分彰显了学院“前沿牵引、厚植根基、团队托举、师生共进”的科学研究与人才培养理念。

随着具身智能、服务机器人和可穿戴智能系统的快速迭代,第一视角视频正成为人工智能理解真实环境的重要数据来源。然而,无标注自中心视频中普遍存在视角变化快、遮挡严重、背景复杂和相机运动剧烈等问题,使模型难以在长时序条件下学习稳定的目标表征,成为制约第一视角视觉学习发展的关键挑战。针对这一难题,我院师生团队潜心攻关,创新提出统一视觉Transformer自监督框架EgoViT,融合原型目标学习、深度正则化与教师过滤时序一致性三项关键机制,构建了一套面向第一视角视频的稳定目标表征学习方案。

面向第一视角视频的自监督表征学习框架

该方案实现了对目标外观、几何结构与时间一致性的协同建模,不仅有效提升了目标表征的稳定性,还在无监督目标发现、语义分割等任务中取得了显著性能提升,为具身智能系统构建持续感知能力提供了新的技术路径,也为目标持续感知和具身智能感知建模提供了重要参考。

未来,计算机与网络空间安全学院将继续坚持面向世界科技前沿与国家重大需求,强化有组织科研,深化科教融合、产教协同,聚焦关键核心技术攻关,着力培育更多高质量、标志性科研成果,为提升我国在网络空间安全、计算机科学与技术、人工智能领域的自主创新能力注入强劲动力。


返回原图
/