AI工具箱 AI工具箱 AI工具箱 AI工具箱
  • AI写作工具
  • AI图像工具
    • 常用AI图像工具
    • AI图片插画生成
    • AI图片背景移除
    • AI图片无损放大
    • AI图片优化修复
    • AI图片物体抹除
    • AI商品图生成
    • Logo工具
  • AI视频工具
    • 常用AI视频工具
    • AI视频生成工具
    • AI视频剪辑工具
    • AI数字人工具
  • AI办公工具
    • AI幻灯片和演示
    • AI表格数据处理
    • AI文档工具
    • AI思维导图
    • AI会议工具
    • AI效率提升
    • AI招聘面试
  • AI设计工具
  • AI对话聊天
  • AI编程工具
  • AI搜索引擎
  • AI音频工具
  • AI开发平台
  • AI语言翻译
  • AI内容检测
  • AI提示指令
  • AI训练模型
  • AI模型评测
  • AI商品图生成
  • AI学习网站
AI工具箱 AI工具箱
  • AI工具箱
    • AI写作工具
    • AI图像工具
    • AI视频工具
    • AI办公工具
    • AI对话聊天
    • AI搜索引擎
    • AI音频工具
    • AI语言翻译
    • AI编程工具
    • AI设计工具
    • AI内容检测
    • AI学习网站
    • AI开发平台
    • AI提示指令
    • AI训练模型
    • AI模型评测
    • AI商品图生成
  • 关于我们

AI工具集

    AI模型评测

    MMLU
    MMLU

    一个用于评估语言模型在多任务、多领域知识推理和理解能力的基准测试工具

    Open LLM Leaderboard
    Open LLM Leaderboard

    一个由Hugging Face提供的开源大语言模型(LLMs)和聊天机器人性能评测平台

    C-Eval
    C-Eval

    一个由上海交通大学、清华大学和爱丁堡大学联合推出的中文基础模型评估套件

    FlagEval
    FlagEval

    北京智源人工智能研究院推出的大模型评测体系及开放平台

    SuperCLUE
    SuperCLUE

    中文通用大模型综合性测评基准

    AGI-Eval
    AGI-Eval

    一个AI大模型评测社区

    CMMLU
    CMMLU

    一个专门为评估语言模型在中文语境下的知识和推理能力而设计的综合性评估基准

    MMBench
    MMBench

    由OpenCompass社区开发的多模态基准测试工具

    Helm Lite
    Helm Lite

    斯坦福大学CRFM团队开发的一个轻量级语言模型评估基准

    Chatbot Arena
    Chatbot Arena

    是一个基于人类偏好评估AI聊天机器人性能的开放平台

    H2O Eval Studio
    H2O Eval Studio

    由H2O.ai开发的一款企业级AI模型评估平台

    PubMedQA
    PubMedQA

    一个用于生物医学研究问题回答的数据集

    AI工具箱 AI工具箱
    AI工具箱导航官网汇集了来自国内外的上千款AI工具。每日更新和添加最新的AI工具。此外还收录了常用的AI学习开发网站、框架和模型。帮助你轻松跟上人工智能的步伐,实现任务自动化,提升工作效率! Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

    友链申请 免责声明 广告合作 关于我们

    Copyright © 2025 AI工具箱 浙ICP备2024072740号-1  浙公网安备33010202004812号