博客 | 第 22 页 | AI工具箱

FireRed-OCR – 小红书推出的文档结构解析与Markdown转换工具

FireRed-OCR是一款轻量级文档结构解析模型，可高效识别复杂表格、数学公式和层级标题，将PDF、扫描文档等内容转换为结构化Markdown文本，适合科研、财务和企...

AI模型

4个月前

Fun-AudioGen-VD 是阿里通义实验室推出的高质量语音生成模型，支持自然语言指令生成个性化音色、情绪表达及沉浸式场景音频，适用于影视配音、游戏角色语音、...

AI模型

4个月前

Fun-CosyVoice3.5 是阿里通义实验室推出的语音生成模型，支持多语种语音合成、音色克隆、自然语言控制和低延迟流式输出，适用于数字人、语音助手、有声内容制...

AI模型

4个月前

Lemon AI是什么 Lemon AI 是一款全栈、开源的通用 AI 智能体平台（AI Agent），旨在帮助个人和团队实现从需求规划到自动化执行的完整工作流程自动化。它通...

AI工具

4个月前

Nano Banana 2 是 Google DeepMind 发布的新一代图像生成模型，支持高分辨率、多语言文字渲染、角色与物品一致性保持，并可通过 Gemini App、Google API 和 V...

AI模型

4个月前

SkyReels V4 是昆仑万维推出的多模态音视频生成基础模型，支持文本、图像、视频与音频联合控制，集视频生成、修复与编辑于一体，最高支持1080p分辨率输出。本...

AI模型

4个月前

MaxClaw 是由 MiniMax 推出的云端 AI 代理服务，基于 OpenClaw 框架和 MiniMax M2.5 模型构建，实现一键部署、持久记忆与多平台集成，适合需要自动化日常办公...

AI工具

4个月前

Perplexity Computer是一款由Perplexity推出的基于浏览器的数字员工平台，支持任务拆解、多模型协作、异步后台运行和多类型输出生成，适合研发、数据分析及内...

AI工具

4个月前

Spirit-v1.5 是千寻智能发布的开源具身智能基础模型，基于统一 Vision-Language-Action 架构，支持多机器人平台部署与跨任务泛化能力，在 RoboChallenge 真机...

AI模型

4个月前

Claude Code Security 是 Anthropic 基于 Claude Opus 4.6 打造的 AI 代码安全扫描工具，支持语义级漏洞分析、数据流追踪与 GitHub 集成，适用于企业级代码基...

AI工具

4个月前