AI模型大全 - 最新大模型与垂直AI模型集合 | 第 10 页

VoxCPM2 – OpenBMB推出的多语言语音生成与高保真克隆模型

VoxCPM2是OpenBMB发布的多语言TTS模型，支持文本到语音转换、语音克隆与可控声线生成，可应用于视频配音、内容创作、会议记录自动转写及字幕生成，提供API接...

AI模型

2个月前

InternSVG 是由上海人工智能实验室推出的SVG生成与理解多模态模型，支持文本生成SVG、图像转SVG、SVG编辑与解析等任务。基于大规模SAgoge数据集训练，适用于...

AI模型

2个月前

Wan2.7-Video 是阿里通义推出的 AI 视频创作模型，支持文本、图像、视频、音频全模态输入，提供分镜生成、剧情续写、角色控制及多维度风格化，帮助创作者高效...

AI模型

2个月前

MAI-Transcribe-1 是微软推出的语音转文字模型，支持多语言语音转写、字幕生成与会议记录自动化，提供API调用方式，适用于视频字幕制作、语音识别、音频转文...

AI模型

2个月前

Gemma 4是谷歌DeepMind开源的多模态大语言模型，支持文本、图像和音频输入，具备长上下文处理能力、强推理能力及API支持，适用于复杂逻辑任务、代码生成和智...

AI模型

2个月前

GLM-5V-Turbo是智谱AI发布的多模态大语言模型，支持图像、视频与文本输入，具备长上下文推理能力、视觉编程输出及多任务协同，适用于复杂文档解析、自动化GUI...

AI模型

2个月前

Qwen3.6-Plus 是阿里通义推出的通用大语言模型，具备增强的 Agent 编程能力，支持文本生成、视觉理解、多模态处理及长上下文推理，适用于智能体开发、工程级...

AI模型

2个月前

LongCat-AudioDiT 是美团推出的高保真语音生成与语音克隆模型，支持长上下文语音建模、多模态推理、API 接入及开源部署，可满足语音助手、配音、语音克隆等多...

AI模型

3个月前

Wan2.7-Image 是阿里通义实验室推出的AI图像生成模型，支持文生图、图生图、多图参考生成与图像编辑等多模态能力，提供API调用与参数化控制，适用于品牌设计...

AI模型

3个月前

PixVerse V6 是爱诗科技推出的多模态AI视频生成模型，支持15秒1080P视频生成、多镜头叙事与原生音频同步输出，适用于广告制作、电商视频与短剧内容生产。该模...

AI模型

3个月前