PICO乳腺癌数据集

该数据集是一个专门针对乳腺癌研究的医学文本数据集,包含1011篇来自PubMed的乳腺癌随机对照试验摘要,标注了26种医学实体类型,主要用于医学命名实体识别研究,支持乳腺癌临床试验文献中的实体抽取和分析,为医学自然语言处理研究提供标准化的文本资源。

cuevascarlos
Hugging Face
2024-06-17 更新
乳腺癌命名实体识别
更新时间2024-06-17
原始链接

https://hf-mirror.com/datasets/cuevascarlos/PICO-breast-cancer

访问原始数据
官方服务

如需原始数据获取支持或标注服务,请联系我们。

帮我联系

资源简介

该数据集是从PICO-Corpus中提取的专门针对乳腺癌研究的医学文本数据集,包含1011篇来自PubMed数据库的乳腺癌随机对照试验摘要。数据集标注了26种医学实体类型,比传统PICO框架的4个实体更为丰富,提供了三个版本:完整数据集、按8:1:1比例划分的训练/验证/测试集、以及按8:2比例划分的训练/测试集。该数据集主要用于医学命名实体识别研究,特别关注乳腺癌临床试验文献中的实体抽取,所有预处理代码和可重复性分析材料均在GitHub开源。

提供机构:cuevascarlos

精度瓶颈?数据缺失?

当前公开数据无法满足您的算法精度?千方提供针对 乳腺癌 的高质量、多模态真实临床数据定制解决方案。

获取专属数据定制方案
影像PICO-breast-cancer