AI模型大全 - 最新大模型与垂直AI模型集合 | 第 4 页

Vidu Q3 – 支持16秒音画同步的AI视频生成模型

Vidu Q3 是生数科技推出的新一代 AI 视频生成模型，支持一次生成 16 秒 1080p 音画同步视频，集成对白、环境音效与 BGM，具备导演级镜头切换、多语言文字渲染...

AI模型

1个月前

TranslateGemma 是基于 Google Gemma 系列优化的多语言翻译模型，专注于高质量文本翻译、长上下文语义保持与可控输出，适合开发者、企业本地化及私有部署翻译...

AI模型

2个月前

GLM-Image 是由智谱 AI 推出的国产多模态图像生成模型，基于自回归与扩散解码器混合架构，支持高分辨率文生图、复杂中文文字渲染与知识密集型图像生成，适用...

AI模型

2个月前

Gemini 3 Flash 是谷歌推出的高速低成本 AI 模型，支持长上下文理解、多模态推理与稳定高并发调用，适用于搜索增强、代码生成、实时交互与企业级应用部署。

AI模型

3个月前

GPT-5.2 是 OpenAI 最新发布的通用 AI 模型系列，具备更长的上下文处理能力、更高推理稳定性和更快生成速度。适用于内容创作、代码生成、知识问答、自动化任...

AI模型

3个月前

QwenLong-L1-32B 是阿里通义推出的长上下文推理模型，支持超大规模文本输入，在文档理解、跨段推理、多场景分析等任务中表现稳定。适用于科研、法律、财务与...

AI模型

3个月前

CosyVoice 2.0 是阿里通义实验室 / FunAudioLLM 推出的高保真中文 TTS 与语音克隆模型，支持多语种、低延迟实时合成与可控情感表达。本文详解模型原理、功能...

AI模型

5个月前

SlowFast-LLaVA-1.5 是苹果团队推出的视觉语言模型，支持长视频理解与多模态推理，兼顾高性能与轻量化部署，适合教育、安防、影视等多场景应用。

AI模型

6个月前

Nano Banana 是 LMArena 平台上的代号，对应 Google 的 Gemini 2.5 Flash Image 模型。它支持智能图像编辑、风格迁移、短视频生成与团队协作。本文详解功能、...

AI模型

6个月前

dots.llm1 是由 Rednote-hilab 开源的高效 Mixture-of-Experts 模型，激活参数仅 14B，支持 32K 上下文长度和中英文生成，成本远低于同级模型，适合科研与应...

AI模型

6个月前