AI模型评测

PubMedQA

一个用于生物医学研究问题回答的数据集

标签:

PubMedQA,这是一个从PubMed摘要中收集的新型生物医学问题回答(QA)数据集。

PubMedQA的任务是使用相应的摘要来回答研究问题,答案可以是是/否/可能(例如:术前使用他汀类药物是否能减少冠状动脉搭桥术后的心房颤动?)。PubMedQA包含1k条专家注释、61.2k条未标记和211.3k条人工生成的QA实例。

每个PubMedQA实例包括:

(1)一个问题,可以是现有的研究文章标题或者从中派生的问题,

(2)一个上下文,即相应摘要但不包括结论部分,

(3)一个长答案,即摘要的结论部分,据推测,应该可以回答研究问题,

(4)一个是/否/可能答案,总结了结论。

PubMedQA是第一个需要对生物医学研究文本进行推理,特别是对其定量内容进行推理以回答问题的QA数据集。我们最佳的模型是使用BioBERT进行多阶段微调,并使用长答案词袋统计作为额外监督,其准确率达到68.1%,而单个人的表现为78.0%的准确率,多数基线为55.2%的准确率,仍有很大的改进空间。PubMedQA公开可用于此https URL。

相关导航

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...