AI语音模型 | AI工具箱

StepAudio 2.5 Realtime – 阶跃星辰推出的实时语音交互与AI语音模型

StepAudio 2.5 Realtime 是阶跃星辰推出的实时语音AI模型，支持实时语音对话、语音转文字、AI语音识别、副语言理解与多角色语音生成，适用于AI语音助手、会议...

AI模型

1个月前

GPT-Realtime-Whisper 是 OpenAI 推出的实时语音识别模型，支持语音转文字、多语言语音转写、会议记录AI工具与视频字幕自动生成。模型基于 Realtime API 提供...

AI模型

1个月前

GPT-Realtime-Translate是OpenAI推出的实时语音翻译模型，支持语音转文字、实时语音识别、多语言语音转写与语音转语音输出，适用于会议记录AI工具、视频字幕...

AI模型

1个月前

StepAudio 2.5 ASR 是阶跃星辰推出的AI语音自动识别模型，支持长音频转写、多语言语音转文字、语音转文字API调用与视频字幕自动生成，适用于会议记录AI工具、...

AI模型

2个月前

Fun-ASR1.5是阿里通义实验室推出的语音识别大模型，支持多语言与方言语音转文字、自动标点与字幕生成，具备端到端语音识别能力，适用于会议记录、视频字幕制...

AI模型

2个月前

Seeduplex是字节跳动推出的全双工语音大模型，支持实时语音对话、语音转文字、多轮语音理解与低延迟交互，适用于语音助手、会议记录、客服系统等场景，具备语...

AI模型

2个月前

VoxCPM2是OpenBMB发布的多语言TTS模型，支持文本到语音转换、语音克隆与可控声线生成，可应用于视频配音、内容创作、会议记录自动转写及字幕生成，提供API接...

AI模型

2个月前

LongCat-AudioDiT 是美团推出的高保真语音生成与语音克隆模型，支持长上下文语音建模、多模态推理、API 接入及开源部署，可满足语音助手、配音、语音克隆等多...

AI模型

3个月前

Xiaomi MiMo-V2-TTS 是小米推出的语音合成AI模型，基于MiMo大模型架构实现文本转语音生成，支持多风格语音、音色克隆与情感表达，适用于智能语音助手、内容配...

AI模型

3个月前

Fun-AudioGen-VD 是阿里通义实验室推出的高质量语音生成模型，支持自然语言指令生成个性化音色、情绪表达及沉浸式场景音频，适用于影视配音、游戏角色语音、...

AI模型

3个月前