GIRAFE:声门成像数据集(用于高级分割、分析和辅助播放评估)
该数据集是一个包含65条声带高速视频内窥镜序列的医学影像数据集,以彩色视频形式记录了声带在发声过程中的动态变化,每段序列包含502帧图像,采集帧率为4000 fps,空间分辨率为256×256像素,数据涵盖健康与疾病状态下的声带振动情况。其主要用途是支持声带语义分割算法的开发与评估,并应用于语音障碍诊断、声带生物力学研究以及临床内窥镜影像分析等领域。
创建时间2024-12-19
更新时间2026-04-23
资源简介
GIRAFE是一个专门设计的数据集,旨在促进声带高速视频内窥镜序列的语义分割、分析和快速评估技术的发展。该数据集包含2013年至2015年间由马德里Gregorio Marañón医院耳鼻喉科专家采集的65条高速视频记录,涉及50名患者(30名女性、20名男性,平均年龄55.65±19.35岁),其中包括15名健康受试者和26名有明确声带振动异常或疾病的病例。所有视频使用WOLF® HRES ENDOCAM 5562相机系统和70度视角硬质内窥镜采集,以4000帧/秒的速率记录,每段序列包含502帧(总计32,630幅图像),空间分辨率为256×256像素,并包含彩色影像。数据涵盖了不同光照条件、对比度、声门部分遮挡及相机侧向位移等真实临床场景,记录了持续元音发音(部分包括发声起始阶段),适用于声带生物力学研究、语音障碍诊断、以及鲁棒的语义分割算法开发与评估。
提供机构:Zenodo
精度瓶颈?数据缺失?
当前公开数据无法满足您的算法精度?千方提供针对 声带震颤 的高质量、多模态真实临床数据定制解决方案。