糖尿病临床指令数据集
该数据集是一个包含745个样本的英语文本指令调优数据集,专注于糖尿病临床领域,涵盖1型糖尿病、2型糖尿病、妊娠糖尿病、胰岛素泵管理、连续血糖监测数据解释和饮食指南等模态内容,主要用于大型语言模型的对齐、医疗助手微调以及健康科技原型开发,旨在支持糖尿病相关的智能医疗应用研究。
创建时间2026-03-05
更新时间2026-03-05
原始链接
https://huggingface.co/datasets/Bernardosalerno/Diabetes-Clinical-Intruction-ENG
官方服务
帮我联系如需原始数据获取支持或标注服务,请联系我们。
资源简介
Diabetes Clinical Instruction Dataset 是一个经过医学验证的高质量指令调优数据集,包含745个样本,专注于糖尿病学、血糖管理和患者护理。该数据集专为大型语言模型(LLM)的对齐(SFT)和专用医疗助手的微调而设计,每个样本都经过了严格的多阶段精炼和审核过程。数据集采用JSONL格式,包含'instruction'、'input'、'output'字段,语言为英语,临床重点涵盖1型糖尿病、2型糖尿病、妊娠糖尿病、胰岛素泵管理、连续血糖监测(CGM)数据解释以及饮食临床指南等内容。该数据集适用于模型无关的对齐、检索增强生成(RAG)基准测试以及健康科技原型开发,并采用CC-BY-NC-4.0许可发布,仅用于研究和模型训练目的,不能替代专业医疗建议。
精度瓶颈?数据缺失?
当前公开数据无法满足您的算法精度?千方提供针对 糖尿病 的高质量、多模态真实临床数据定制解决方案。