Intern-S1-Pro – 上海AI实验室推出的科学多模态大模型

Intern-S1-Pro 是上海 AI 实验室推出的科学多模态大模型,基于 MoE 架构与通专融合技术,支持科学推理、多模态理解、长时序信号分析和科研智能体构建,适用于...

MiniCPM-o 4.5 – 全双工实时交互的开源多模态模型

MiniCPM-o 4.5 是面壁智能推出的 9B 参数开源全模态模型,支持全双工实时交互,集成视觉理解、语音识别与语音生成能力,可在端侧设备与国产算力平台部署,适...

可灵3.0模型 – 快手推出的多模态视频与图像生成模型

可灵3.0模型是快手推出的新一代多模态内容生成模型,支持视频生成、图片生成、多参考主体锁定、智能分镜、多语种口型同步与原生超清输出,适用于短视频创作、...

Skywork桌面版 – 昆仑天工推出的本地AI Agent办公工具

Skywork桌面版是昆仑天工推出的 Windows 原生 AI Agent 工具,支持在本地直接处理文档、表格、PPT、图片等多种文件,实现跨格式办公自动化与多模态内容生成,...

Claude Cowork – Anthropic推出的本地文件级AI协作工具

Claude Cowork 是 Anthropic 推出的 AI 协作工具,支持授权访问本地文件夹,由 AI 自主规划并执行多步骤任务,如文件整理、数据提取与文档生成。适合需要提升...

Qwen3-Coder-Next – 阿里开源的编程智能体模型

Qwen3-Coder-Next是什么 Qwen3-Coder-Next 是由阿里巴巴旗下 Qwen 团队开发的一款面向编程智能体与本地开发场景的开源大型语言模型。它基于新一代 Qwen3-N...

GLM-OCR – 智谱开源的轻量级多模态OCR模型

GLM-OCR是智谱AI推出的轻量级多模态OCR模型,支持手写体、复杂表格、公式与代码识别,输出HTML与JSON结构,适用于企业文档数字化、教育科研及票据解析等场景。

Grok Imagine 1.0 – 快速智能短视频生成工具

Grok Imagine 1.0 是 xAI 推出的 AI 视频生成工具,支持文本或图像生成短视频,快速同步画面与音频。适合内容创作者、开发者及机构用户,用于创意验证、素材...

Step 3.5 Flash – 256K上下文与350TPS高速推理的Agent基座模型

Step 3.5 Flash 是阶跃星辰推出的开源大模型,采用稀疏 MoE 架构,总参数 1960 亿,每 token 仅激活 110 亿参数,支持 256K 长上下文与最高 350 TPS 推理速度...

Vidu Q3 – 支持16秒音画同步的AI视频生成模型

Vidu Q3 是生数科技推出的新一代 AI 视频生成模型,支持一次生成 16 秒 1080p 音画同步视频,集成对白、环境音效与 BGM,具备导演级镜头切换、多语言文字渲染...
1 24 25 26 27 28 46