20260601 AI 资讯快报
20260601 AI 资讯快报
2026-06-01 · 实时更新
扣子 3.0 正式上线
3.0 正式上线,实现 iOS、Android、Mac、Windows 及网页端全量更新。新版本定位新一代 AI 团队,核心升级多 Agent 协作与项目空间管理,用户可创建项目召集不同职能 Agent 与团队推进任务。同时支持接入 Claude Code、Codex CLI 等本地 Agent,提供云端 Agent 长期运行能力,平台内置投资顾问、自媒体达人等职业模板。
MiniMax 开源新一代 AI 模型 MiniMax M3
MiniMax技推出,国内首个同时具备前沿编程能力、1M超长上下文和原生多模态能力的开源模型。在SWE-Bench Pro等国际权威评测中,M3多项指标超越等海外模型,接近领先水平。模型采用全新的MSA稀疏注意力架构,支持100万token上下文窗口,显著提升处理效率。
响指HaiSnap APP正式上线
正式上线,产品定位为移动端AI创作Agent平台。用户可通过语音、文本或上传文件发起任务,AI自动执行并生成网页应用、文档、PPT、图片等可发布成果。核心功能包括智能体工作区、我的成果库、任务回放及技能调用。
VAST 获近2亿美元 A 轮系列融资
通用人工智能公司VAST完成A+及A++两轮近2亿美元融资,由渶策资本、国寿长三角科创基金领投,荣耀等产业方及多家一线财务资本联合投资。同时,VAST推出全新世界模型项目Project Eden,创新性地将底层状态推演与视觉呈现解耦,解锁环境长程持久、场景自由复用、多人并发交互等颠覆性能力。
小米开源可控视频音效生成模型 ControlFoley
小米大模型应用团队开源可控视频音效生成模型,统一支持文本引导视频配音、文本控制视频配音及参考音频控制视频配音三类任务。模型通过联合视觉编码、时间-音色解耦与模态鲁棒训练,解决现有方案文本控制弱、参考音频难同步等问题,在 VGGSound-Test 等多个 benchmark 上达到开源 SOTA 表现。
阿里通义推出通用具身智能统一动作框架 Qwen-VLA
通义实验室推出,以Qwen3.5-4B为底座搭配DiT动作解码器,通过统一动作轨迹预测框架、本体感知提示条件化及文本到动作预训练(T2A)技术,将操作、导航与轨迹预测整合为单一通用具身模型。模型在多项基准测试中超越专用模型,支持11种机器人平台跨本体控制。
