AI模型
汇集最全的AI模型资源,包括通用大模型、垂直领域模型及实用工具,提供使用教程、测评与更新动态,让你快速掌握AI模型应用。
Claude Mythos – Anthropic推出的AI网络安全漏洞检测与攻防模型
Claude Mythos是Anthropic推出的AI网络安全模型,支持自动漏洞检测、漏洞利用生成与安全扫描,适用于企业代码审计与基础设施防护。具备AI模型推理能力、长上...
VoxCPM2 – OpenBMB推出的多语言语音生成与高保真克隆模型
VoxCPM2是OpenBMB发布的多语言TTS模型,支持文本到语音转换、语音克隆与可控声线生成,可应用于视频配音、内容创作、会议记录自动转写及字幕生成,提供API接...
InternSVG – 上海人工智能实验室推出的SVG生成与理解多模态模型
InternSVG 是由上海人工智能实验室推出的SVG生成与理解多模态模型,支持文本生成SVG、图像转SVG、SVG编辑与解析等任务。基于大规模SAgoge数据集训练,适用于...
Wan2.7-Video – 阿里通义AI 视频创作与分镜生成模型
Wan2.7-Video 是阿里通义推出的 AI 视频创作模型,支持文本、图像、视频、音频全模态输入,提供分镜生成、剧情续写、角色控制及多维度风格化,帮助创作者高效...
MAI-Transcribe-1 – 微软推出的语音转文字模型
MAI-Transcribe-1 是微软推出的语音转文字模型,支持多语言语音转写、字幕生成与会议记录自动化,提供API调用方式,适用于视频字幕制作、语音识别、音频转文...
Gemma 4 – 谷歌开源多模态大语言模型与推理引擎
Gemma 4是谷歌DeepMind开源的多模态大语言模型,支持文本、图像和音频输入,具备长上下文处理能力、强推理能力及API支持,适用于复杂逻辑任务、代码生成和智...
GLM-5V-Turbo – 智谱AI推出的多模态大语言模型与视觉编程基座
GLM-5V-Turbo是智谱AI发布的多模态大语言模型,支持图像、视频与文本输入,具备长上下文推理能力、视觉编程输出及多任务协同,适用于复杂文档解析、自动化GUI...
Qwen3.6-Plus – 阿里通义推出的Agent 编程能力增强型的通用大模型
Qwen3.6-Plus 是阿里通义推出的通用大语言模型,具备增强的 Agent 编程能力,支持文本生成、视觉理解、多模态处理及长上下文推理,适用于智能体开发、工程级...
LongCat-AudioDiT – 美团推出的高保真语音生成与语音克隆模型
LongCat-AudioDiT 是美团推出的高保真语音生成与语音克隆模型,支持长上下文语音建模、多模态推理、API 接入及开源部署,可满足语音助手、配音、语音克隆等多...
Wan2.7-Image – 阿里通义推出的多模态图像生成与编辑模型
Wan2.7-Image 是阿里通义实验室推出的AI图像生成模型,支持文生图、图生图、多图参考生成与图像编辑等多模态能力,提供API调用与参数化控制,适用于品牌设计...

浙公网安备33010202004812号