QBotClaw – 腾讯推出的浏览器自动化执行与AI智能体工具
QBotClaw是腾讯推出的浏览器AI智能体工具,集成自动化执行、跨页面操作与数据抓取能力,支持自然语言指令完成复杂网页任务。适用于办公自动化、电商比价、内...
GLM-5.1 – 智谱AI推出的Agent智能体与自动编程大语言模型
GLM-5.1是智谱AI推出的Agent智能体大语言模型,支持长上下文推理、自动编程、工具调用与复杂任务执行能力。适用于AI编程助手、代码自动修复、DevOps自动化等...
PixVerse C1 – 爱诗科技推出的首个影视级AI视频生成模型
PixVerse C1 是爱诗科技推出的影视级AI视频生成模型,支持文生视频、图生视频、首尾帧过渡和参考分镜生成,最高输出15秒1080P音画同步视频,适用于短视频创作...
Claude Mythos – Anthropic推出的AI网络安全漏洞检测与攻防模型
Claude Mythos是Anthropic推出的AI网络安全模型,支持自动漏洞检测、漏洞利用生成与安全扫描,适用于企业代码审计与基础设施防护。具备AI模型推理能力、长上...
VoxCPM2 – OpenBMB推出的多语言语音生成与高保真克隆模型
VoxCPM2是OpenBMB发布的多语言TTS模型,支持文本到语音转换、语音克隆与可控声线生成,可应用于视频配音、内容创作、会议记录自动转写及字幕生成,提供API接...
LLM Wiki – Karpathy 发布的持久化知识库构建模式
LLM Wiki 是 Karpathy 发布的开源知识库构建模式,支持大语言模型增量生成结构化 Markdown 页面,实现知识持久化和复用,适合研究者和高级 LLM agent 工作流...
InternSVG – 上海人工智能实验室推出的SVG生成与理解多模态模型
InternSVG 是由上海人工智能实验室推出的SVG生成与理解多模态模型,支持文本生成SVG、图像转SVG、SVG编辑与解析等任务。基于大规模SAgoge数据集训练,适用于...
Wan2.7-Video – 阿里通义AI 视频创作与分镜生成模型
Wan2.7-Video 是阿里通义推出的 AI 视频创作模型,支持文本、图像、视频、音频全模态输入,提供分镜生成、剧情续写、角色控制及多维度风格化,帮助创作者高效...
MAI-Transcribe-1 – 微软推出的语音转文字模型
MAI-Transcribe-1 是微软推出的语音转文字模型,支持多语言语音转写、字幕生成与会议记录自动化,提供API调用方式,适用于视频字幕制作、语音识别、音频转文...
Gemma 4 – 谷歌开源多模态大语言模型与推理引擎
Gemma 4是谷歌DeepMind开源的多模态大语言模型,支持文本、图像和音频输入,具备长上下文处理能力、强推理能力及API支持,适用于复杂逻辑任务、代码生成和智...

浙公网安备33010202004812号