PICO-乳腺癌数据集

该数据集是一个基于文本模态的医学文献数据集,包含1011篇来自PubMed的乳腺癌随机对照试验摘要,并标注了26个实体,主要用于命名实体识别任务,支持乳腺癌领域临床试验信息的自动化抽取与分析研究。

cuevascarlos
Hugging Face
2024-06-17 更新
乳腺癌命名实体识别
更新时间2024-06-17
原始链接

https://hf-mirror.com/datasets/cuevascarlos/PICO-breast-cancer

访问原始数据
官方服务

如需原始数据获取支持或标注服务,请联系我们。

帮我联系

资源简介

该数据集是从PICO-Corpus中提取的,包含了1011篇来自PubMed的乳腺癌随机对照试验摘要。数据集中标注了26个实体,比传统PICO语料库的4个实体更为丰富。数据集提供了三个版本:Data-v2(未分割的原始数据)、Default_split-v2(按80%训练、10%验证、10%测试划分)和Train_test_split-v2(按80%训练、20%测试划分)。该数据集主要用于命名实体识别(NER)任务,支持医学文献信息抽取研究,尤其在乳腺癌领域可用于分析临床试验中的患者、干预、比较和结果等关键要素。所有预处理代码已在GitHub开源,便于可重复性研究。

提供机构:cuevascarlos

精度瓶颈?数据缺失?

当前公开数据无法满足您的算法精度?千方提供针对 乳腺非典型增生 的高质量、多模态真实临床数据定制解决方案。

获取专属数据定制方案
影像PICO-breast-cancer