Qwen3.6-35B-A3B – 阿里通义开源的Agent编程与MoE多模态模型

Qwen3.6-35B-A3B快速摘要:Agent编程与多模态推理模型 模型概述:Qwen3.6-35B-A3B是阿里巴巴通义千问团队于2026年4月发布的开源权重大语言模型,支持Agent...

Claude Opus 4.7 – Anthropic推出的高阶推理与多模态大模型

Claude Opus 4.7是Anthropic发布的大语言模型,支持复杂推理、多模态理解与代码生成,适用于软件开发、文档分析与智能代理任务。模型具备高分辨率视觉处理、...

混元3D世界模型2.0 – 腾讯混元开源的生成与重建一体化3D世界模型

混元3D世界模型2.0是腾讯混元开源的多模态3D世界模型,支持文本、图像与视频输入生成可漫游3DGS/mesh场景,并实现世界重建与数字孪生。模型采用全景生成、轨...

有道宝库 – 网易有道推出的AI知识库与知识管理工具

有道宝库是网易有道推出的AI知识库与知识管理工具,支持文档上传、知识库构建、可溯源AI问答及多模态内容生成,包括PPT、思维导图与播客等形式,适用于学习、...

ERNIE-Image – 百度文心开源的8B参数文生图模型

ERNIE-Image是百度文心开源的8B参数文生图模型,提供标准版50步高质量生成与Turbo版8步快速生成两种模式,支持高可控结构化图像生成与中英文长文本精准渲染,...

Spark 2.0 – World Labs 开源的Web端3D高斯溅射渲染引擎

Spark 2.0是World Labs开源的Web端3D高斯溅射渲染引擎,支持3DGS实时渲染、多对象融合与流式加载能力。适用于Web 3D展示、虚拟世界构建和数字孪生场景,具备L...

LPM 1.0 – 米哈游蔡浩宇推出的多模态对话视频生成模型

LPM 1.0是一款面向多模态交互的视频生成模型,支持图像、语音与文本联合驱动生成对话视频与虚拟人内容。该模型具备身份一致性控制、语音驱动口型同步及长时序...

MiniMax Music 2.6 – MiniMax推出的AI音乐生成与可控创作模型

MiniMax Music 2.6是一款由MiniMax研发的AI音乐生成模型,支持文本生成音乐、音乐结构控制与Cover重编曲功能,适用于短视频配乐、游戏音频制作与内容创作场景...

VimRAG – 阿里通义开源的多模态RAG与Agent检索增强生成框架

VimRAG快速摘要: VimRAG是阿里巴巴NLP团队提出的多模态检索增强生成RAG框架,支持文本、图像与视频的联合检索与推理任务,适用于复杂知识理解与多模态问...

Octo – 即梦AI推出的多模态协作式内容创作工具

Octo是一款由即梦AI推出的多模态协作创作工具,支持对话式生成、实时内容编辑与创意扩展,适用于短视频脚本、文案创作和多模态内容生产。Octo怎么用简单直观...
1 2 3 34