2月27日,计算机视觉领域国际顶级会议——IEEE国际计算机视觉与模式识别会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2025)公布论文录用结果。中国海洋大学信息科学与工程学部师生共有7篇论文被大会收录,论文全部由学部作为第一作者或通讯作者单位完成,研究成果覆盖三维重建、人脸鉴伪、图像生成、语义分割等前沿方向。
CVPR是计算机视觉领域三大国际顶会之一,由中国计算机学会(CCF)推荐为A类会议,在全球人工智能与计算机视觉领域具有极高影响力。本届会议共收到投稿13008份,录用了2878篇论文,录用率为22.1%,竞争尤为激烈。
本次录用论文由学部董军宇教授、郑海永教授、蔡青副教授、都勇副教授、郭宗辉副教授、俞智斌副教授、李岳尊讲师、张继超讲师等研究组主导完成,第一作者主要为学部在校硕士研究生,展现了学部在人工智能领域科研的深度与广度,以及学生在计算机视觉领域的扎实功底与创新思维。
学部近年来在人工智能领域和计算机视觉领域持续发力,通过建设人工智能研究院、设立人工智能交叉学科博士点等一系列举措,为学校的学科建设、人才培养、科学研究注入了新的活力。
录用论文
1、MESC-3D:Mining Effective Semantic Cues for 3D Reconstruction from a Single Image
Shaoming Li (硕士生,中国海洋大学), Qing Cai (通讯作者,中国海洋大学), Songqi Kong, Runqing Tan, Heng Tong, Shiji Qiu, Yongguo Jiang, Zhi Liu
简介:本工作提出了一种基于有效语义线索挖掘的无标定单视图3D重建方法,突破了传统3D重建需要相机位姿和相机参数的限制,仅靠一幅图像就能准确完成目标3D重建。
第一作者:中国海洋大学信息科学与工程学部计算机学院2023级硕士李绍铭
通讯作者:蔡青副教授
2、Multi-focal Conditioned Latent Diffusion for Person Image Synthesis
Jiaqi Liu, Jichao Zhang (通讯作者,中国海洋大学), Paolo Rota, Nicu Sebe
简介:姿态控制的人体二维生成是生成领域中重要的研究问题。先前的扩散模型方法通常忽略人体图片中复杂的纹理和身份信息,并且对于局部编辑具有较差的表现力和自由度。为此,本文提出了一种新颖的Multiple-Focal的模块,嵌入到扩散模型架构中。
该论文由中国海洋大学和特伦托大学团队合作完成。
第一作者:2024特伦托大学博士生李佳琦
通讯作者:张继超讲师
3、Forensics Adapter: Adapting CLIP for Generalizable Face Forgery Detection
Xinjie Cui (硕士生,中国海洋大学), Yuezun Li (通讯作者,中国海洋大学), Ao Luo, Jiaran Zhou, Junyu Dong
简介:CLIP 具有丰富的语义知识先验,具备提升现有人脸鉴伪技术泛化性的潜力。但由于鉴伪相关知识与其他知识深度杂糅,CLIP无法直接应用于此任务。为此,我们提出了 Forensics Adapter,旨在将 CLIP 转化为高效且具备强泛化能力的人脸伪造检测器。在仅增加 5.7M 可训练参数的情况下,该方法在五个标准数据集上的平均性能提升约 7%,证明了其有效性。
第一作者:中国海洋大学信息科学与工程学部计算机学院2023级硕士崔欣洁
通讯作者:李岳尊讲师
4、Where the Devil Hides: Deepfake Detectors Can No Longer Be Trusted
Shuaiwei Yuan (硕士生,中国海洋大学), Junyu Dong, Yuezun Li (通讯作者,中国海洋大学)
简介:本文探讨了现有人脸鉴伪模型所面临的一种新型安全问题,即第三方数据提供方可通过污染数据来给模型植入后门,影响正常预测过程。对此,我们提出了一种可密码控制、表达抑制、自适应和不可见的触发模式,确保攻击有效且隐匿地实施。该研究不仅揭示了现有人脸鉴伪模型的安全漏洞,也为其防护措施的设计提供思路。
第一作者:中国海洋大学信息科学与工程学部计算机学院2023级硕士袁帅威
通讯作者:李岳尊讲师
5、Boost the Inference with Co-training: A Depth-guided Mutual Learning Framework for Semi-supervised Medical Polyp Segmentation
Yuxin Li (硕士生,中国海洋大学), Zihao Zhu, Yuxiang Zhang, Yifan Chen, Zhibin Yu(通讯作者,中国海洋大学)
简介:医学息肉语义分割受限于标注数据稀缺,同时息肉图像通常面临着对比度低息肉形状多变等挑战,仅从RGB图像角度无法从无标记数据中学习到更多关键信息,为此本文提出了一种新颖的深度引导的半监督框架。在五个具有挑战性的息肉分割数据集的结果表明,所提方法在不同标签比例下均达到了最优性能。
第一作者:中国海洋大学信息科学与工程学部电子工程学院2023级研究生李余新
通讯作者:俞智斌副教授
6、Face Forgery Video Detection via Temporal Forgery Cue Unraveling
Zonghui Guo, Yingjie Liu (硕士生,中国海洋大学), Jie Zhang, Haiyong Zheng (通讯作者,中国海洋大学), Shiguang Shan
简介:人脸伪造视频检测是鉴别数字人脸视频真伪的至关重要且极具挑战的任务。现有人脸视频伪造检测方法侧重于孤立空间信息或粗粒度融合时空信息,不能有效捕获细微的时序伪造线索而导致性能有限。本文致力于通过三个渐进层次来逐步解析视频中伪造线索,即瞬时异常,逐渐不一致和累积失真,从而强化模型对通用伪造特征的提取能力。
第一作者:中国海洋大学信息科学与工程学部电子工程学院郭宗辉副教授、2022级硕士生刘英杰
通讯作者:郑海永教授、中国科学院计算技术研究所山世光研究员
7、NexusGS: Sparse View Synthesis with Epipolar Depth Priors in 3D Gaussian Splatting
Yulong Zheng (硕士生,中国海洋大学), Zicheng Jiang, Shengfeng He, Yandu Sun, Junyu Dong, Huaidong Zhang, Yong Du (通讯作者,中国海洋大学)
简介:本文提出了一种基于三维高斯溅射的稀疏视角新视图合成方法 NexusGS。该方法利用源-目标视图间的光流结合极几何生成深度候选值,并基于光流误差敏感性筛选最优深度,以构建训练所需的高密度点云覆盖。不同于现有方法对单目深度先验的隐式矫正,NexusGS 通过显式深度估计提供更可靠的几何信息,减少高斯溅射自适应密度控制中的随机性,从而有效缓解监督不足导致的过拟合问题。
第一作者:中国海洋大学信息科学与工程学部计算机科学技术学院2022级硕士生郑玉龙
通讯作者:都勇副教授
通讯员
初审:徐君岭
终审:宋青