快捷入口

  • 投稿
  • 审稿
  • 编辑

2025年第5期

更多
  • 《中国图象图形学报》视觉及多模态大模型专栏简介 AI导读

    在人工智能领域,专家建立了深度学习体系,为智能技术发展提供新方向。
    方乐缘, 贾伟, 林倞, 谭明奎, 王耀威, 吴庆耀, 韩向娣
    DOI:10.11834/jig.2500005

    2025-05-14

    5

    19

  • 视觉模型及多模态大模型推进图像复原增强研究进展 AI导读

    图像复原增强技术取得重要进展,为自动驾驶和智能医疗等领域提供新思路。
    韦炎炎, 毛天一, 李柏昂, 王飞, 李锋, 张召, 赵洋
    DOI:10.11834/jig.240436

    2025-05-14

    181

    123

  • 基于联合嵌入空间的视频文本检索研究综述 AI导读

    视频文本检索技术发展综述,为检索视频信息提供便捷方式,推动视频检索技术进步。
    董闯, 栗伟, 巴聪, 覃文军
    DOI:10.11834/jig.240747

    2025-05-14

    34

    65

  • 以神经辐射场和三维高斯泼溅为基础的文本指导三维编辑综述 AI导读

    在三维编辑领域,专家聚焦基于神经辐射场和三维高斯泼溅的文本指导三维编辑最新进展,为创建高质量三维资产提供新思路。
    卢丽华, 张晓辉, 魏辉, 李茹杨, 杜国光, 王斌强
    DOI:10.11834/jig.240589

    2025-05-14

    111

    71

  • 大语言模型引导的视频检索数据迭代优化 AI导读

    在视频文本跨模态检索领域,专家提出了大语言模型引导的数据迭代优化方法,有效缓解了数据集中一对多问题,显著提升了模型性能。
    曾润浩, 李嘉梁, 卓奕深, 段海涵, 陈奇, 胡希平
    DOI:10.11834/jig.240545

    2025-05-14

    26

    53

  • 信息解耦式自监督预训练语音大模型 AI导读

    在语音交互领域,专家提出了基于语音信息解耦策略的预训练大模型,有效提升了模型对语音信息的解析与重构能力,为言语交互大模型提供了新的研究视角与实用工具。
    王龙标, 江宇, 王天锐, 王晓宝, 党建武
    DOI:10.11834/jig.240607

    2025-05-14

    60

    73

0