FireRed-OCR – 小红书推出的文档结构解析与Markdown转换工具

FireRed-OCR是一款轻量级文档结构解析模型,可高效识别复杂表格、数学公式和层级标题,将PDF、扫描文档等内容转换为结构化Markdown文本,适合科研、财务和企...

Fun-AudioGen-VD – 阿里通义专业语音生成与场景化音频模型

Fun-AudioGen-VD 是阿里通义实验室推出的高质量语音生成模型,支持自然语言指令生成个性化音色、情绪表达及沉浸式场景音频,适用于影视配音、游戏角色语音、...

Fun-CosyVoice3.5 – 阿里通义语音生成模型支持多语种音色克隆与自然语言控制

Fun-CosyVoice3.5 是阿里通义实验室推出的语音生成模型,支持多语种语音合成、音色克隆、自然语言控制和低延迟流式输出,适用于数字人、语音助手、有声内容制...

Lemon AI – 全栈开源智能体平台,支持自动化任务管理与多工具集成

Lemon AI是什么 Lemon AI 是一款全栈、开源的通用 AI 智能体平台(AI Agent),旨在帮助个人和团队实现从需求规划到自动化执行的完整工作流程自动化。它通...

Nano Banana 2 – 谷歌高效图像生成模型,支持多语言与高分辨率

Nano Banana 2 是 Google DeepMind 发布的新一代图像生成模型,支持高分辨率、多语言文字渲染、角色与物品一致性保持,并可通过 Gemini App、Google API 和 V...

SkyReels V4 – 昆仑万维推出的多模态音视频生成与统一编辑模型

SkyReels V4 是昆仑万维推出的多模态音视频生成基础模型,支持文本、图像、视频与音频联合控制,集视频生成、修复与编辑于一体,最高支持1080p分辨率输出。本...

MaxClaw – MiniMax推出的云端AI智能代理与自动化助手

MaxClaw 是由 MiniMax 推出的云端 AI 代理服务,基于 OpenClaw 框架和 MiniMax M2.5 模型构建,实现一键部署、持久记忆与多平台集成,适合需要自动化日常办公...

Perplexity Computer – Perplexity推出的多模型协作全流程数字员工

Perplexity Computer是一款由Perplexity推出的基于浏览器的数字员工平台,支持任务拆解、多模型协作、异步后台运行和多类型输出生成,适合研发、数据分析及内...

Spirit-v1.5 – 千寻智能推出的开源具身智能基础模型与VLA机器人架构实践

Spirit-v1.5 是千寻智能发布的开源具身智能基础模型,基于统一 Vision-Language-Action 架构,支持多机器人平台部署与跨任务泛化能力,在 RoboChallenge 真机...

Claude Code Security – Anthropic推出的AI代码语义级安全审计工具

Claude Code Security 是 Anthropic 基于 Claude Opus 4.6 打造的 AI 代码安全扫描工具,支持语义级漏洞分析、数据流追踪与 GitHub 集成,适用于企业级代码基...
1 20 21 22 23 24 46