2025年7月12日,聂婕教授受邀参加由中国计算机学会主办,CCF青岛分部、CCF YOCSEF青岛学术委员会和山东省人工智能学会视觉应用与智能技术(SDAI-VAIT)专委会协办的“海洋大数据智能分析研讨会”,会议在中国海洋大学西海岸校区举办。
本次研讨会邀请了南京信息工程大学张荣华教授、中国海洋大学聂婕教授、浙江大学张宁豫副教授/特聘研究员(“OceanGPT(沧渊)海洋大模型”主要参与人)和中科院海洋所杨楠助理研究员(“琅琊大模型”总技术负责人)做引导发言,中科院自动化所赵恺副研究员、青岛励图高科信息技术有限公司张俊虎博士(大模型研发负责人)、中国海洋大学崔英哲博士(“问海大模型”主要参与人)担任思辨嘉宾。
CCF青岛秘书长王胜科,CCF青岛执行委员李昕、仲国强,以及来自北京、济南、西安、兰州、重庆、武汉、厦门、长沙、广州、杭州、大连、长春、哈尔滨等地高等院校、科研院所和企事业单位的专家学者参加了本次研讨会。
活动背景:海洋在全球生态、气候调控及国家战略中至关重要,是资源宝库与科学前沿。近年来,“问海”“琅琊”“羲和”“OceanGPT”等海洋大模型的兴起,为高分辨率环境预报、灾害预警、智慧渔业及智能航运等应用带来新机遇,有望推动海洋科技新变革。然而,海洋大模型产业落地应用仍面临严峻的数据共性难题,包括稀疏高噪声的观测瓶颈,以及通用性与多场景专用化之间的适配难题。本此研讨会聚焦海洋大模型的典型落地实践,通过对数据现状的深刻洞察、对未来数据生态的战略擘画、以及对技术实现路径的前瞻探索,汇聚跨界共识,激发体系化创新,形成一套可复制、可推广、聚焦数据处理的海洋大模型应用方法论,为海洋科学研究与蓝色经济发展提供理论支撑与技术指引。
会议概况:本次研讨会分为引导发言和思辨讨论环节。在引导发言环节,四位嘉宾围绕海洋科学发现与海洋大模型研发的技术进展与挑战进行了深入分享;在思辨讨论环节,嘉宾与参会者针对关键议题展开热烈思辨,现场气氛活跃,观点交锋不断。
学术报告环节
报告一:南京信息工程大学的张荣华教授做了题为《物理驱动与数据驱动相融合的海气耦合模式研发及其对 ENSO 的模拟》的报告。他系统梳理了从传统中间型(ICM)、混合型(HCM)到全耦合 GCM 的物理模式体系,并与最新的深度学习(DL)方法逐一对比其建模原理、过程表征、时间积分与可解释性差异,指出单一范式难以同时兼顾物理一致性与预测精度。围绕这一痛点,他提出“深度融合”思路:在大气侧利用 U-Net 训练获得的海表风应力模型替代 ICM 中的经验统计模块,在海洋侧以动力框架承载耦合反馈,形成 ICM-UNet;进一步将 AI 风场与 ROMS 环流耦合,构建 AI-HCM。实验显示,该混合模式显著降低了模式误差并准确再现多种关键特征。随后,张教授展示了以深度前馈网络重构上层海洋剪切湍混合参数化的最新成果,验证了“物理启发 + 数据驱动”在气候模式误差订正中的潜力。报告最后强调,未来 ENSO 预测需依托多层级耦合模式与 AI 的互补优势,打造高效、稳健且透明的混合建模框架,以支撑次季节到年代际气候服务。
报告二:中国海洋大学聂婕教授做了题为《从可计算系统到大语言模型:面向海洋环境智能预测新路径》的报告。她在报告中回顾了海洋科学范式从“观测-建模-仿真”到“数据-知识-模型”三位一体的跃迁,并围绕两大核心议题展开:(1) AI 如何提升物理驱动可计算系统的完备性——针对中尺度以下物理-生物相互作用认知薄弱的问题,提出“数值流+神经网络流”双流异构嵌套架构(DP-BICNN),通过热量收支方程嵌入物理约束并用 ConvLSTM 补偿非物理过程,在渤海、东海、南海 SST 预测中整体优于九种基线模型;(2) 语义级知识计算能否替代物理数值计算——构建“特征工程-Reprogramming-Prompt”三段式框架,引入大语言模型执行显式推理,初步验证了在中国近海显著波高 > 2 m 预报中相较 Conv-LSTM、FNO 等方法精度大幅提升。报告最后强调:物理规律仍是可解释、高效“AI4Science”的基石,大语言模型凭借融合感知与通用认知将成为决策-预测“大脑”,而大小模型协同则是未来海洋智能预测的关键范式。
报告三:浙江大学张宁豫副教授以《OceanGPT:沧渊海洋基础大模型》为题,介绍了面向“数字海洋与人工智能”国家战略需求的 OceanGPT 研发历程与技术框架。团队历经 OceanGPT-1 到 OceanGPT-2 两个阶段,构建了基于 MoE(Mixture‐of‐Experts)架构的多子模型体系:OceanGPT-basic 专注海洋专业问答,OceanGPT-omni 实现声-光-电-磁等海洋特色多模态数据与自然语言对齐,OceanGPT-coder 则面向水下机器人操控与具身智能。为强化专业知识,研究人员通过 KAG 知识增强框架与海洋知识图谱,在后训练阶段对小参数 SFT 模型进行微调,使模型在推理和问答中具备更深的海洋语义理解力。报告展示了“一句话生成 MOOS 任务代码”的实践:大模型能够自动生成并下发水下机器人指令,将编码效率从小时级压缩至秒级。此外,OceanGPT 已在海洋渔船态势分析、水下多机器人协同等场景落地。他还指出,大模型在海洋具身智能中仍面临三大挑战:缺乏高保真“世界模型”以支撑复杂物理交互、幻觉生成难以完全规避,以及受限带宽的水下通信亟需高效协同机制。未来,团队将持续迭代模型能力,并通过 MCP 协议实现多机器人协作,推动海洋智能感知与作业迈向更高水平。
报告四:中国科学院海洋研究所杨楠助理研究员做了题为《挑战与展望:琅琊海洋大模型-跨时空尺度全球海洋状态变量及现象预报》,以“琅琊海洋大模型”回应海洋大模型滞后于气象的现状,针对自回归误差累积、海气耦合表征不足、训练不稳和跃层预测精度低四大痛点,提出包含 Time-Embedding 时间先验、大气驱动异步交叉采样、余弦注意力稳收敛、温跃层自适应损失 的 v1.0 框架。模型在 1/12° 分辨率下一次性生成 7 天全球 3D 温盐流场,并以 ERA5 与 GLORYS12 为输入对比四套权威数值系统(FOAM、PSY4、GIOPS、OceanMPAS),在温度、洋流等指标全面领先且推算速度快近万倍。误差空间分析显示高精度集中于公海,大尺度现象(黑潮、阿古拉斯流)拟合度显著提升。未来版本将扩展至 30 天多帧预测、支持观测/模式混合驱动,并打造面向涡旋、台风、海浪等现象的多任务生态与国际 Benchmark,惟有算力仍是将来卡点。
参考:https://www.ccf.org.cn/Member_Activities/2025-07-18/846570.shtml