PubMedQA | AI工具箱

PubMedQA，这是一个从PubMed摘要中收集的新型生物医学问题回答（QA）数据集。

PubMedQA的任务是使用相应的摘要来回答研究问题，答案可以是是/否/可能（例如：术前使用他汀类药物是否能减少冠状动脉搭桥术后的心房颤动？）。PubMedQA包含1k条专家注释、61.2k条未标记和211.3k条人工生成的QA实例。

每个PubMedQA实例包括：

（1）一个问题，可以是现有的研究文章标题或者从中派生的问题，

（2）一个上下文，即相应摘要但不包括结论部分，

（3）一个长答案，即摘要的结论部分，据推测，应该可以回答研究问题，

（4）一个是/否/可能答案，总结了结论。

PubMedQA是第一个需要对生物医学研究文本进行推理，特别是对其定量内容进行推理以回答问题的QA数据集。我们最佳的模型是使用BioBERT进行多阶段微调，并使用长答案词袋统计作为额外监督，其准确率达到68.1％，而单个人的表现为78.0％的准确率，多数基线为55.2％的准确率，仍有很大的改进空间。PubMedQA公开可用于此https URL。