InternSVG – 上海人工智能实验室推出的SVG生成与理解多模态模型
InternSVG 是由上海人工智能实验室推出的SVG生成与理解多模态模型,支持文本生成SVG、图像转SVG、SVG编辑与解析等任务。基于大规模SAgoge数据集训练,适用于...
Wan2.7-Video – 阿里通义AI 视频创作与分镜生成模型
Wan2.7-Video 是阿里通义推出的 AI 视频创作模型,支持文本、图像、视频、音频全模态输入,提供分镜生成、剧情续写、角色控制及多维度风格化,帮助创作者高效...
MAI-Transcribe-1 – 微软推出的语音转文字模型
MAI-Transcribe-1 是微软推出的语音转文字模型,支持多语言语音转写、字幕生成与会议记录自动化,提供API调用方式,适用于视频字幕制作、语音识别、音频转文...
Gemma 4 – 谷歌开源多模态大语言模型与推理引擎
Gemma 4是谷歌DeepMind开源的多模态大语言模型,支持文本、图像和音频输入,具备长上下文处理能力、强推理能力及API支持,适用于复杂逻辑任务、代码生成和智...
GLM-5V-Turbo – 智谱AI推出的多模态大语言模型与视觉编程基座
GLM-5V-Turbo是智谱AI发布的多模态大语言模型,支持图像、视频与文本输入,具备长上下文推理能力、视觉编程输出及多任务协同,适用于复杂文档解析、自动化GUI...
Qwen3.6-Plus – 阿里通义推出的Agent 编程能力增强型的通用大模型
Qwen3.6-Plus 是阿里通义推出的通用大语言模型,具备增强的 Agent 编程能力,支持文本生成、视觉理解、多模态处理及长上下文推理,适用于智能体开发、工程级...
ClawHub镜像站 – OpenClaw生态推出的AI技能分发与本地加速平台
ClawHub镜像站是OpenClaw生态中的技能镜像分发平台,主要提供AI Agent技能库的本地加速访问与管理能力,支持开发者通过Web和CLI快速获取、安装与更新技能模块...
updream – 哔哩哔哩推出的AI视频创作与智能剪辑工具
updream是哔哩哔哩推出的 AI 视频创作工具,支持脚本生成、智能分镜、自动剪辑与素材处理,适用于短视频创作与内容生产。本文详解 updream怎么用、updream功...
LongCat-AudioDiT – 美团推出的高保真语音生成与语音克隆模型
LongCat-AudioDiT 是美团推出的高保真语音生成与语音克隆模型,支持长上下文语音建模、多模态推理、API 接入及开源部署,可满足语音助手、配音、语音克隆等多...
Wan2.7-Image – 阿里通义推出的多模态图像生成与编辑模型
Wan2.7-Image 是阿里通义实验室推出的AI图像生成模型,支持文生图、图生图、多图参考生成与图像编辑等多模态能力,提供API调用与参数化控制,适用于品牌设计...

浙公网安备33010202004812号