近日,计算机与网络空间安全学院2024级博士生王越峰(第一作者),在导师林卫国教授、徐君锋教授的指导下,联合其他合作者在国际顶级期刊《Pattern Recognition》(简称PR)发表重要研究论文。
PR是模式识别与人工智能领域的顶级学术期刊,入选中国科学院SCI一区TOP期刊,同时被国家一级学会—中国计算机学会(CCF)列为人工智能领域B类推荐期刊、中国自动化学会(CAA)A类推荐期刊,其收录论文代表该领域前沿研究水平。
聚焦红外安全痛点:构建红外对抗样本生成新框架
红外成像在夜间与复杂环境中具有稳定成像优势,广泛应用于安防监控、医疗分析与工业检测等场景。随着深度学习模型在上述任务中的部署,其在对抗扰动下可能出现误判的风险逐渐受到关注:攻击者仅需在输入图像中注入微小扰动,即可能诱导模型产生错误预测,从而威胁依赖红外感知的安全关键系统。
视觉语言预训练(VLP)模型通过大规模图文预训练实现跨模态对齐,在图文检索、图像描述与视觉推理等任务中表现突出,但其在红外场景下的鲁棒性研究仍相对不足。

对抗样本生成过程的对比:(a) SGA, (b) ATA和(c) AT-LSA (ours)
针对上述问题,我院科研团队从攻击评估视角切入,系统分析红外对抗扰动对多模态感知系统的潜在影响,创新性提出并构建“红外图像增强+对抗样本生成”两阶段研究框架。其中,所设计的红外图像增强方法可显著提升VLP模型对红外场景的语义理解与表征能力;同时,在对抗扰动生成过程中,有助于获得更稳定的梯度信号与更丰富的可攻击结构,从而提升扰动优化的有效性与可控性。在此基础上,团队进一步提出AT-LSA算法,用于生成高质量对抗样本。实验结果表明,该算法通过迁移攻击成功揭示了VLP模型在红外场景下的潜在脆弱性;同时,针对GPT等闭源模型的迁移攻击也取得了良好效果,为后续红外多模态系统的鲁棒性设计提供了重要依据。

论文所述方法流程图

红外图像视觉增强流程图
成果价值凸显 赋能红外与AI安全
此次研究成果具有重要的实际应用价值,为安防监控、工业检测、应急巡检等场景提供了可用于风险评估与安全加固的方法参考,有助于构建更安全可信的红外多模态智能系统。
近年来,计算机与网络空间安全学院紧扣学科发展前沿,围绕人工智能安全、多媒体取证、网络攻防等方向持续深耕,科研创新能力与人才培养质量稳步提升。此次在国际顶级期刊发表研究成果,既是学院学科建设与科研创新工作的重要突破,也为网络空间安全专业人才培养提供了高质量科研实践平台,对推动学院学科高质量发展、提升相关领域人才培养质量具有深远意义。
多方资助加持,彰显科研硬实力
该研究工作得到国家自然科学基金 国家自然科学基金青年基金、中央高校基本科研业务费、河南省重点研发计划等多个项目的联合资助,充分体现了学院在人工智能安全与对抗样本攻击领域的科研实力与持续创新能力。
附:论文链接 https://doi.org/10.1016/j.patcog.2026.113131


