AI模型
汇集最全的AI模型资源,包括通用大模型、垂直领域模型及实用工具,提供使用教程、测评与更新动态,让你快速掌握AI模型应用。
UnifoLM-VLA-0 – 宇树科技开源的通用视觉语言动作机器人模型
UnifoLM-VLA-0 是宇树科技推出的开源视觉-语言-动作(VLA)大模型,基于 Qwen2.5-VL 架构构建,面向通用机器人操作与具身智能研究,支持多模态感知、空间推理...
Claude Opus 4.6 – Anthropic推出的多任务智能与超长上下文AI模型
Claude Opus 4.6是Anthropic推出的先进AI模型,支持1百万token超长上下文、多智能体协作和动态思考控制,适用于企业级任务、编程、文档分析及自动化工作流程。
GPT-5.3-Codex – OpenAI 推出的新一代高级智能编码与工程执行模型
GPT-5.3-Codex 是由 OpenAI 推出的新一代智能编码模型,面向真实软件工程场景,强化了多语言代码生成、终端操作、长周期任务执行与工程级推理能力。该模型在...
Voxtral Transcribe 2 – Mistral AI推出的多语言低延迟语音转写工具
Voxtral Transcribe 2, 语音转写, 多语言转录, 低延迟语音, Mistral AI
Intern-S1-Pro – 上海AI实验室推出的科学多模态大模型
Intern-S1-Pro 是上海 AI 实验室推出的科学多模态大模型,基于 MoE 架构与通专融合技术,支持科学推理、多模态理解、长时序信号分析和科研智能体构建,适用于...
MiniCPM-o 4.5 – 全双工实时交互的开源多模态模型
MiniCPM-o 4.5 是面壁智能推出的 9B 参数开源全模态模型,支持全双工实时交互,集成视觉理解、语音识别与语音生成能力,可在端侧设备与国产算力平台部署,适...
可灵3.0模型 – 快手推出的多模态视频与图像生成模型
可灵3.0模型是快手推出的新一代多模态内容生成模型,支持视频生成、图片生成、多参考主体锁定、智能分镜、多语种口型同步与原生超清输出,适用于短视频创作、...
Qwen3-Coder-Next – 阿里开源的编程智能体模型
Qwen3-Coder-Next是什么 Qwen3-Coder-Next 是由阿里巴巴旗下 Qwen 团队开发的一款面向编程智能体与本地开发场景的开源大型语言模型。它基于新一代 Qwen3-N...
GLM-OCR – 智谱开源的轻量级多模态OCR模型
GLM-OCR是智谱AI推出的轻量级多模态OCR模型,支持手写体、复杂表格、公式与代码识别,输出HTML与JSON结构,适用于企业文档数字化、教育科研及票据解析等场景。
Step 3.5 Flash – 256K上下文与350TPS高速推理的Agent基座模型
Step 3.5 Flash 是阶跃星辰推出的开源大模型,采用稀疏 MoE 架构,总参数 1960 亿,每 token 仅激活 110 亿参数,支持 256K 长上下文与最高 350 TPS 推理速度...

浙公网安备33010202004812号