博客 | 第 4 页 | AI工具箱

MAI-Voice-2 – Microsoft AI推出的多语言文本转语音与语音克隆模型

MAI-Voice-2是Microsoft AI于2026年发布的多语言文本转语音模型，支持AI语音生成、零样本语音克隆、情感控制、代码混说和长文本语音合成。适用于智能助手、有...

AI模型

3周前

MAI-Thinking-1是微软推出的高级推理大语言模型，支持数学推理、软件工程代码生成、长上下文分析与Agent任务执行。模型采用MoE架构并支持256K上下文，在AIME...

AI模型

3周前

Bernini是字节跳动开源的视频生成与编辑统一框架，基于MLLM语义规划与DiT扩散渲染架构，支持文本生成视频、图像生成视频、多参考视频编辑与风格迁移等能力，...

AI模型

3周前

Devin Desktop 是 Cognition 推出的多智能体AI软件工程开发与协作平台，基于Windsurf IDE升级而来，支持Agent Command Center统一管理本地与云端AI Agent，并...

AI工具

3周前

Qwen3.7-Plus是阿里通义千问推出的新一代多模态智能体大模型，支持视觉、文本、视频与GUI统一处理，具备视觉推理、代码生成与工具调用能力，适用于复杂软件工...

AI模型

3周前

语构（Creo4U）是阿里巴巴达摩院推出的AI原生应用开发平台，基于Vibe Coding范式，通过自然语言驱动应用生成，实现从需求描述、功能拆解、代码生成到部署上线...

AI工具

3周前

Qwen-VLA是阿里通义实验室推出的通用视觉-语言-动作模型，支持机器人操作、视觉语言导航、轨迹预测和跨本体控制。模型基于Qwen3.5-4B与DiT动作解码器构建，具...

AI模型

3周前

ControlFoley是小米开源的可控视频音效生成模型，支持TV2A、TC-V2A与AC-V2A多任务视频配音，通过文本、视频与参考音频实现可控音频生成，适用于短视频创作、...

AI模型

3周前

MiniMax M3是MiniMax推出的新一代大语言模型，支持1M超长上下文、多模态图像与视频输入及Agent智能体任务执行能力，覆盖AI编程、代码生成、长文档分析、会议...

AI模型

3周前

PilotDeck是清华大学THUNLP、面壁智能与OpenBMB联合开源的AI Agent操作系统与WorkSpace多智能体平台，支持工作舱任务隔离、白盒记忆、智能路由与Always-on自...

AI工具

4周前