阿里 Qwen3.5-Omni 超越 Gemini 3.1 Pro 登顶全模态;Anthropic Claude Code 新增计算机使用能力形成编码闭环;工信部首发具身智能基准测试标准;宇树 H2 全尺寸机器人亮相上海
微软开源 VibeVoice,包含 TTS 与 ASR 两大语音 AI 模型,支持长达 90 分钟的文本转语音和 60 分钟的语音识别,采用超低帧率连续语音标记器与下一代标记扩散框架,今日 GitHub Trending 第一。
腾讯WorkBuddy通过微信小程序实现远程控制电脑,让AI成为真正的数字助手,简化日常办公流程。
Deep-Live-Cam 是一款开源的实时人脸替换工具,仅需一张源人脸图片,即可实现直播、视频通话中的实时换脸,支持 CUDA/CoreML/DirectML/OpenVINO 多种 GPU 加速方案。
xAI 创始团队归零;谷歌 TurboQuant 陷学术造假争议;北京全国最大人形机器人训练基地揭牌;Anthropic 付费用户翻倍;中关村论坛确认2026年为具身智能规模化应用元年。