2026 年 4 月最热的 AI 进展不是闭源新版本,而是一批垂直开源项目在单一场景做到 frontier 级别、成本砍到地板:视频(OpenMontage)/ 3D(HY-World 2.0)/ 编码(Aider)/ RAG(ColVec1)/ Agent 框架(Goose)。「专精 + 开源 + 模型无关」正在替代「大而全 + 付费」。
Aider(终端原生 AI 编码助手,Apache 2.0)在 SWE Bench 高分并被多个评测列为 top 开源编码助手。webAI-ColVec1(9B 多模态 RAG 嵌入模型)在 ViDoRe V3 榜单进入 top-tier(非 #1;NVIDIA Nemotron ColEmbed V2 声称 #1)。共同点:不做全能平台,只在一个垂直切面做到最强。
国内首个完全开源的多模态 3D 世界模型:文本/图片/视频 → 可编辑、持久化的 3D 场景(mesh / 3DGS),直接导入 Blender / Unity / Unreal / Isaac Sim。区别于 Genie3 / Cosmos「生成视频」的 world model,HY-World 2.0 直接输出可编辑 3D 资产,对标 NVIDIA Omniverse 但开源。
HunyuanWorld 迭代到 1.5 版本(WorldPlay),加入可交互 3D 元素生成能力,开始对接 Unity / Unreal 工作流。距离 2.0 只差一步。
腾讯混元发布第一代多模态 3D 世界模型 HunyuanWorld 1.0,开源代码 + 模型权重。奠定 HY-World 2.0 的技术基础。对 Embodied AI 赛道的合成训练场景产生早期冲击。
