结肠癌顶级1000帖子更新版(2024年4月5日)
该数据集是一个文本模态的医学社交媒体数据集,包含从Reddit的r/coloncancer子论坛收集的约1000个公开帖子和评论,内容涵盖结肠癌患者的经历、症状、治疗及支持寻求等多方面讨论,主要用于研究在线健康社区中的患者行为、疾病认知以及自然语言处理在医疗文本分析中的应用。
创建时间2025-11-02
更新时间2025-11-14
原始链接
https://figshare.com/articles/dataset/coloncancer_top_1000_updated_04052024/30509012/1
官方服务
帮我联系如需原始数据获取支持或标注服务,请联系我们。
资源简介
该数据集是一个公开可获取的医学社交媒体数据集,专门收集自Reddit平台的r/coloncancer子论坛。数据集包含约1000个帖子和相关评论,用于研究关于结肠癌的在线讨论,内容涵盖患者的个人经历、症状描述、治疗方案、支持寻求行为等多个方面。每个数据条目包含完整的文本内容(帖子正文和热门评论)、元数据以及人工编码的主题变量,如用户特征、临床背景和沟通主题。数据来源于公开的Reddit页面,除公开可见的用户名外,不包含个人身份信息。该数据集主要用于医学信息学、健康传播、患者行为研究以及自然语言处理在医疗领域的应用。
提供机构:Zuo, Mei Xing; Singh, Angadh
精度瓶颈?数据缺失?
当前公开数据无法满足您的算法精度?千方提供针对 结肠癌 的高质量、多模态真实临床数据定制解决方案。