AI模型

汇集最全的AI模型资源,包括通用大模型、垂直领域模型及实用工具,提供使用教程、测评与更新动态,让你快速掌握AI模型应用。

Qwen-Image-2.0 – 阿里通义千问推出的高分辨率图像生成与编辑模型

Qwen-Image-2.0是阿里通义千问推出的新一代图像生成与编辑模型,支持2K分辨率输出与长文本精准渲染,具备文生图与图像编辑统一架构能力,适合设计创作、信息...

Seedream 5.0 – 字节跳动推出的高分辨率AI图像生成与编辑模型

Seedream 5.0 是字节跳动推出的新一代 AI 图像生成模型,支持文本生成图像、多参考图融合、高分辨率 2K/4K 输出及自然语言图像编辑,适用于内容创作、设计、...

Seedance 2.0 – 字节跳动推出的多模态AI视频生成与创作工具

Seedance 2.0是字节跳动推出的多模态AI视频生成模型,支持文本、图片、视频和音频参考,提供多镜头叙事、原生音视频同步和高一致性角色生成,适用于短视频创...

SenseNova-MARS – 商汤科技开源的多模态自主推理与视觉搜索模型

SenseNova-MARS 是商汤科技推出的开源多模态视觉语言模型,支持图像与文本联合推理、动态工具调用与多步任务执行。该模型提供 8B 与 32B 参数版本,适用于跨...

UnifoLM-VLA-0 – 宇树科技开源的通用视觉语言动作机器人模型

UnifoLM-VLA-0 是宇树科技推出的开源视觉-语言-动作(VLA)大模型,基于 Qwen2.5-VL 架构构建,面向通用机器人操作与具身智能研究,支持多模态感知、空间推理...

Claude Opus 4.6 – Anthropic推出的多任务智能与超长上下文AI模型

Claude Opus 4.6是Anthropic推出的先进AI模型,支持1百万token超长上下文、多智能体协作和动态思考控制,适用于企业级任务、编程、文档分析及自动化工作流程。

GPT-5.3-Codex – OpenAI 推出的新一代高级智能编码与工程执行模型

GPT-5.3-Codex 是由 OpenAI 推出的新一代智能编码模型,面向真实软件工程场景,强化了多语言代码生成、终端操作、长周期任务执行与工程级推理能力。该模型在...

Voxtral Transcribe 2 – Mistral AI推出的多语言低延迟语音转写工具

Voxtral Transcribe 2, 语音转写, 多语言转录, 低延迟语音, Mistral AI

Intern-S1-Pro – 上海AI实验室推出的科学多模态大模型

Intern-S1-Pro 是上海 AI 实验室推出的科学多模态大模型,基于 MoE 架构与通专融合技术,支持科学推理、多模态理解、长时序信号分析和科研智能体构建,适用于...

MiniCPM-o 4.5 – 全双工实时交互的开源多模态模型

MiniCPM-o 4.5 是面壁智能推出的 9B 参数开源全模态模型,支持全双工实时交互,集成视觉理解、语音识别与语音生成能力,可在端侧设备与国产算力平台部署,适...
1 8 9 10 11 12