PICO乳腺癌数据集
该数据集是一个专门针对乳腺癌研究的医学文本数据集,包含1011篇来自PubMed的乳腺癌随机对照试验摘要,标注了26种医学实体类型,主要用于医学命名实体识别研究,支持乳腺癌临床试验文献中的实体抽取和分析,为医学自然语言处理研究提供标准化的文本资源。
更新时间2024-06-17
原始链接
https://hf-mirror.com/datasets/cuevascarlos/PICO-breast-cancer
官方服务
帮我联系如需原始数据获取支持或标注服务,请联系我们。
资源简介
该数据集是从PICO-Corpus中提取的专门针对乳腺癌研究的医学文本数据集,包含1011篇来自PubMed数据库的乳腺癌随机对照试验摘要。数据集标注了26种医学实体类型,比传统PICO框架的4个实体更为丰富,提供了三个版本:完整数据集、按8:1:1比例划分的训练/验证/测试集、以及按8:2比例划分的训练/测试集。该数据集主要用于医学命名实体识别研究,特别关注乳腺癌临床试验文献中的实体抽取,所有预处理代码和可重复性分析材料均在GitHub开源。
提供机构:cuevascarlos
精度瓶颈?数据缺失?
当前公开数据无法满足您的算法精度?千方提供针对 乳腺癌 的高质量、多模态真实临床数据定制解决方案。