AI工具箱 AI工具箱 AI工具箱 AI工具箱
  • AI写作工具
  • AI图像工具
    • 推荐图像工具
    • 插画生成
    • 背景移除
    • 图像放大
    • 图像修复
    • 物体抹除
    • 商品图生成
    • Logo工具
  • AI视频工具
    • 推荐视频工具
    • 视频生成
    • 视频剪辑
    • 数字人生成
  • AI办公工具
    • PPT制作
    • 表格处理
    • 文档编辑
    • 思维导图
    • 会议工具
    • 效率助手
    • 招聘面试
  • AI智能体
    • 推荐智能体
    • 金融助手
    • 视频助手
    • 办公助手
  • AI对话聊天
  • AI设计工具
  • AI编程工具
  • AI搜索引擎
  • AI音频工具
  • AI开发平台
  • AI训练模型
  • AI内容检测
  • AI语言翻译
  • AI提示指令
  • AI模型评测
  • AI学习网站
AI工具箱 AI工具箱
  • AI工具箱
    • AI写作工具
    • AI图像工具
    • AI视频工具
    • AI办公工具
    • AI对话聊天
    • AI搜索引擎
    • AI音频工具
    • AI语言翻译
    • AI编程工具
    • AI设计工具
    • AI内容检测
    • AI学习网站
    • AI开发平台
    • AI提示指令
    • AI训练模型
    • AI模型评测
  • AI每日资讯
  • 关于我们

AI工具集

    AI模型评测

    MMLU
    MMLU

    一个用于评估语言模型在多任务、多领域知识推理和理解能力的基准测试工具

    Open LLM Leaderboard
    Open LLM Leaderboard

    一个由Hugging Face提供的开源大语言模型(LLMs)和聊天机器人性能评测平台

    C-Eval
    C-Eval

    一个由上海交通大学、清华大学和爱丁堡大学联合推出的中文基础模型评估套件

    FlagEval
    FlagEval

    北京智源人工智能研究院推出的大模型评测体系及开放平台

    SuperCLUE
    SuperCLUE

    中文通用大模型综合性测评基准

    AGI-Eval
    AGI-Eval

    一个AI大模型评测社区

    CMMLU
    CMMLU

    一个专门为评估语言模型在中文语境下的知识和推理能力而设计的综合性评估基准

    MMBench
    MMBench

    由OpenCompass社区开发的多模态基准测试工具

    Helm Lite
    Helm Lite

    斯坦福大学CRFM团队开发的一个轻量级语言模型评估基准

    Chatbot Arena
    Chatbot Arena

    是一个基于人类偏好评估AI聊天机器人性能的开放平台

    H2O Eval Studio
    H2O Eval Studio

    由H2O.ai开发的一款企业级AI模型评估平台

    PubMedQA
    PubMedQA

    一个用于生物医学研究问题回答的数据集

    AI工具箱 AI工具箱
    AI工具箱导航官网汇集了来自国内外的上千款AI工具。每日更新和添加最新的AI工具。此外还收录了常用的AI学习开发网站、框架和模型。帮助你轻松跟上人工智能的步伐,实现任务自动化,提升工作效率! Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

    友链申请 免责声明 广告合作 关于我们

    Copyright © 2025 AI工具箱 浙ICP备2024072740号-1  浙公网安备33010202004812号