MAI-Voice-2 – Microsoft AI推出的多语言文本转语音与语音克隆模型

MAI-Voice-2是Microsoft AI于2026年发布的多语言文本转语音模型,支持AI语音生成、零样本语音克隆、情感控制、代码混说和长文本语音合成。适用于智能助手、有...

MAI-Thinking-1 – 微软推出的高级推理与代码生成模型

MAI-Thinking-1是微软推出的高级推理大语言模型,支持数学推理、软件工程代码生成、长上下文分析与Agent任务执行。模型采用MoE架构并支持256K上下文,在AIME...

Bernini – 字节跳动开源视频生成与语义规划统一框架

Bernini是字节跳动开源的视频生成与编辑统一框架,基于MLLM语义规划与DiT扩散渲染架构,支持文本生成视频、图像生成视频、多参考视频编辑与风格迁移等能力,...

Devin Desktop – Cognition推出的多智能体AI软件工程开发与协作平台

Devin Desktop 是 Cognition 推出的多智能体AI软件工程开发与协作平台,基于Windsurf IDE升级而来,支持Agent Command Center统一管理本地与云端AI Agent,并...

Qwen3.7-Plus – 阿里通义推出的多模态智能体与视觉语言大模型

Qwen3.7-Plus是阿里通义千问推出的新一代多模态智能体大模型,支持视觉、文本、视频与GUI统一处理,具备视觉推理、代码生成与工具调用能力,适用于复杂软件工...

语构 – 阿里巴巴达摩院推出的AI原生应用开发与Vibe Coding平台

语构(Creo4U)是阿里巴巴达摩院推出的AI原生应用开发平台,基于Vibe Coding范式,通过自然语言驱动应用生成,实现从需求描述、功能拆解、代码生成到部署上线...

Qwen-VLA – 阿里通义推出的通用视觉语言动作具身智能模型

Qwen-VLA是阿里通义实验室推出的通用视觉-语言-动作模型,支持机器人操作、视觉语言导航、轨迹预测和跨本体控制。模型基于Qwen3.5-4B与DiT动作解码器构建,具...

ControlFoley – 小米开源的可控视频音效生成与多模态V2A模型

ControlFoley是小米开源的可控视频音效生成模型,支持TV2A、TC-V2A与AC-V2A多任务视频配音,通过文本、视频与参考音频实现可控音频生成,适用于短视频创作、...

MiniMax M3 – MiniMax推出的百万上下文多模态智能体大模型

MiniMax M3是MiniMax推出的新一代大语言模型,支持1M超长上下文、多模态图像与视频输入及Agent智能体任务执行能力,覆盖AI编程、代码生成、长文档分析、会议...

PilotDeck – 清华联合面壁智能开源的AI Agent操作系统与WorkSpace多智能体平台

PilotDeck是清华大学THUNLP、面壁智能与OpenBMB联合开源的AI Agent操作系统与WorkSpace多智能体平台,支持工作舱任务隔离、白盒记忆、智能路由与Always-on自...
1 2 3 4 5 6 46