AI模型
汇集最全的AI模型资源,包括通用大模型、垂直领域模型及实用工具,提供使用教程、测评与更新动态,让你快速掌握AI模型应用。
LPM 1.0 – 米哈游蔡浩宇推出的多模态对话视频生成模型
LPM 1.0是一款面向多模态交互的视频生成模型,支持图像、语音与文本联合驱动生成对话视频与虚拟人内容。该模型具备身份一致性控制、语音驱动口型同步及长时序...
MiniMax Music 2.6 – MiniMax推出的AI音乐生成与可控创作模型
MiniMax Music 2.6是一款由MiniMax研发的AI音乐生成模型,支持文本生成音乐、音乐结构控制与Cover重编曲功能,适用于短视频配乐、游戏音频制作与内容创作场景...
VimRAG – 阿里通义开源的多模态RAG与Agent检索增强生成框架
VimRAG快速摘要: VimRAG是阿里巴巴NLP团队提出的多模态检索增强生成RAG框架,支持文本、图像与视频的联合检索与推理任务,适用于复杂知识理解与多模态问...
Muse Spark – Meta 推出的原生多模态多智能体推理模型
Muse Spark是Meta推出的原生多模态多智能体推理模型,支持视觉理解、工具调用与多Agent协同推理,适用于复杂任务拆解、智能问答与多模态交互应用场景。模型具...
Seeduplex – 字节跳动推出的全双工实时语音交互大模型
Seeduplex是字节跳动推出的全双工语音大模型,支持实时语音对话、语音转文字、多轮语音理解与低延迟交互,适用于语音助手、会议记录、客服系统等场景,具备语...
GLM-5.1 – 智谱AI推出的Agent智能体与自动编程大语言模型
GLM-5.1是智谱AI推出的Agent智能体大语言模型,支持长上下文推理、自动编程、工具调用与复杂任务执行能力。适用于AI编程助手、代码自动修复、DevOps自动化等...
PixVerse C1 – 爱诗科技推出的首个影视级AI视频生成模型
PixVerse C1 是爱诗科技推出的影视级AI视频生成模型,支持文生视频、图生视频、首尾帧过渡和参考分镜生成,最高输出15秒1080P音画同步视频,适用于短视频创作...
Claude Mythos – Anthropic推出的AI网络安全漏洞检测与攻防模型
Claude Mythos是Anthropic推出的AI网络安全模型,支持自动漏洞检测、漏洞利用生成与安全扫描,适用于企业代码审计与基础设施防护。具备AI模型推理能力、长上...
VoxCPM2 – OpenBMB推出的多语言语音生成与高保真克隆模型
VoxCPM2是OpenBMB发布的多语言TTS模型,支持文本到语音转换、语音克隆与可控声线生成,可应用于视频配音、内容创作、会议记录自动转写及字幕生成,提供API接...
InternSVG – 上海人工智能实验室推出的SVG生成与理解多模态模型
InternSVG 是由上海人工智能实验室推出的SVG生成与理解多模态模型,支持文本生成SVG、图像转SVG、SVG编辑与解析等任务。基于大规模SAgoge数据集训练,适用于...

浙公网安备33010202004812号