SenseNova-MARS – 商汤科技开源的多模态自主推理与视觉搜索模型
SenseNova-MARS 是商汤科技推出的开源多模态视觉语言模型,支持图像与文本联合推理、动态工具调用与多步任务执行。该模型提供 8B 与 32B 参数版本,适用于跨...
UnifoLM-VLA-0 – 宇树科技开源的通用视觉语言动作机器人模型
UnifoLM-VLA-0 是宇树科技推出的开源视觉-语言-动作(VLA)大模型,基于 Qwen2.5-VL 架构构建,面向通用机器人操作与具身智能研究,支持多模态感知、空间推理...
Pallas AI – AI可见性优化Agent工具,品牌自动分析与内容策略
Pallas AI 是面向企业品牌的 AI 可见性优化平台,通过智能 Agent 自动分析品牌表现、生成高质量内容,并提供多维度竞争对比与策略优化,帮助品牌在生成式 AI ...
Claude Opus 4.6 – Anthropic推出的多任务智能与超长上下文AI模型
Claude Opus 4.6是Anthropic推出的先进AI模型,支持1百万token超长上下文、多智能体协作和动态思考控制,适用于企业级任务、编程、文档分析及自动化工作流程。
GPT-5.3-Codex – OpenAI 推出的新一代高级智能编码与工程执行模型
GPT-5.3-Codex 是由 OpenAI 推出的新一代智能编码模型,面向真实软件工程场景,强化了多语言代码生成、终端操作、长周期任务执行与工程级推理能力。该模型在...
2026 年如何持续赚美金的 3 个 AI 项目:拆解 100+ 案例后的发现
本文是一篇 AI 项目教程,基于 100+ 案例,系统解析 AI 在 YouTube、Etsy 与 Amazon KDP 等海外平台中的实际应用流程,适合希望了解 AI 内容创作与平台实践的...
Voxtral Transcribe 2 – Mistral AI推出的多语言低延迟语音转写工具
Voxtral Transcribe 2, 语音转写, 多语言转录, 低延迟语音, Mistral AI
Intern-S1-Pro – 上海AI实验室推出的科学多模态大模型
Intern-S1-Pro 是上海 AI 实验室推出的科学多模态大模型,基于 MoE 架构与通专融合技术,支持科学推理、多模态理解、长时序信号分析和科研智能体构建,适用于...
MiniCPM-o 4.5 – 全双工实时交互的开源多模态模型
MiniCPM-o 4.5 是面壁智能推出的 9B 参数开源全模态模型,支持全双工实时交互,集成视觉理解、语音识别与语音生成能力,可在端侧设备与国产算力平台部署,适...
可灵3.0模型 – 快手推出的多模态视频与图像生成模型
可灵3.0模型是快手推出的新一代多模态内容生成模型,支持视频生成、图片生成、多参考主体锁定、智能分镜、多语种口型同步与原生超清输出,适用于短视频创作、...

浙公网安备33010202004812号