阿里 Qwen3.5-Omni 超越 Gemini 3.1 Pro,登顶全模态大模型榜
阿里发布新一代全模态大模型 Qwen3.5-Omni,在音视频理解、识别、交互等 215 项任务中取得 SOTA,综合性能超越 Google Gemini 3.1 Pro,跻身全球最强全模态模型行列。该模型支持文本、图像、音频、视频四类输入,可处理长达 10 小时的音频或 400 秒 720p 视频。与此同时,国家数据局披露,2026 年 3 月中国日均 Token 调用量已突破 140 万亿,两年内增长超千倍。值得关注:这是国产大模型首次在全模态综合榜全面超越 Google 旗舰产品,标志中国 AI 在多模态方向实现代际突破。
Anthropic Claude Code 新增"计算机使用"能力,形成编码-测试-修复闭环
Anthropic 以研究预览形式向 Claude Pro/Max 用户开放 Claude Code 的"计算机使用"功能:Agent 可直接操控应用界面、点击 UI 元素、通过 CLI 运行代码,完成"编码→运行→检查 UI→修复→重新测试"全流程自动化。同日,OpenAI 推出 Claude Code 的 Codex 插件,实现 Anthropic 工具链内一键触发 ChatGPT 代码审查与对抗测试,标志编码工具栈从单一产品转向可组合生态。值得关注:AI 编程工具从代码生成向端到端自主软件工程演进的拐点信号,开发者工作流将被深度重塑。
工信部发布首份具身智能基准测试标准(YD/T 6770—2026)
中国工业和信息化部发布国内首份具身智能基准测试行业标准 YD/T 6770—2026,将于 2026 年 6 月 1 日起正式实施,推动具身智能产品评测走向规范化、可对比化。同期,谷歌研究院发布 TurboQuant 压缩算法,可将 LLM KV Cache 内存占用压缩至原来的 1/6、几乎零精度损失,注意力计算速度在特定场景提升 8 倍,单张显卡可同时服务用户数从 1 人提升至 6 人,且无需重新训练,即插即用。值得关注:前者填补了具身智能产业标准空白,为量产门槛的规范化奠定基础;TurboQuant 则大幅降低长文本推理的硬件门槛,利好边缘部署。
宇树科技发布全尺寸 H2 人形机器人,CEO 预告六个月内实现任意动作生成
宇树科技在上海"首发上海"活动上发布全尺寸人形机器人 H2:身高 1.8 米、31 个关节自由度,搭载自研高性能运动控制算法与通用大模型,将以沉浸式体验馆形式面向公众亮相(亚洲首店落地上海静安南京西路)。CEO 王兴兴同期表示,“机器人任意动作生成、自主出招对打"等高级运动能力,预计**六个月后(2026 年 9 月底前)**即可实现。宇树 2025 年人形机器人出货量已位居全球第一,盈利模式依赖全栈自研降本与规模效应。值得关注:H2 是宇树向消费级沉浸式体验场景迈出的重要一步,六个月的技术路线图若兑现,将是全球具身智能运动控制的重要里程碑。