科学家们构建了一种人工智能系统它能够利用单夜的睡眠数据预测数十种严重疾病的风险。通过识别大脑与身体信号间细微的不协调该系统能在疾病显现前很久就揭示出早期预警信号。图片来源: Shutterstock辗转难眠的夜晚通常会导致次日疲劳但它也可能预示着更晚才会显现的健康问题。斯坦福医学院Stanford Medicine的科学家及其合作者开发了一种人工智能系统可以检测单夜睡眠中的身体信号并评估一个人罹患100多种不同医学疾病的风险。该系统名为SleepFM使用了来自65,000名个体近60万小时的睡眠记录进行训练。这些记录来自多导睡眠图这是一种深入的睡眠测试在睡眠期间使用多个传感器追踪大脑活动、心脏功能、呼吸模式、眼球运动、腿部运动以及其他身体信号。睡眠研究蕴含未被开发的健康数据多导睡眠图被认为是评估睡眠的黄金标准通常在实验室环境中通宵进行。虽然它广泛用于诊断睡眠障碍但研究人员意识到它也捕获了大量鲜少被充分分析的生理信息。“我们在研究睡眠时记录了数量惊人的信号”这项新研究的共同高级作者伊曼纽尔·米尼奥Emmanual Mignot医学博士、哲学博士说。该研究将于1月6日发表在《自然医学》杂志上。“我们在一个完全被动的受试者身上用八小时研究了一种通用的生理学。这蕴含着极其丰富的数据。”在常规临床实践中这些信息中只有一小部分被检视。人工智能的最新进展现在使研究人员能够更彻底地分析这些庞大而复杂的数据集。据该团队称这项工作是首次将人工智能大规模应用于睡眠数据。“从人工智能的角度来看睡眠的研究相对不足。有很多其他人工智能工作在关注病理学或心脏病学但关注睡眠的相对较少尽管睡眠是生命中如此重要的一部分”该研究的共同高级作者、生物医学数据科学副教授詹姆斯·邹James Zou哲学博士说。教AI学习睡眠模式为了从数据中发掘洞见研究人员构建了一个基础模型这是一种旨在从非常庞大的数据集中学习广泛模式然后将该知识应用于众多任务的人工智能类型。像ChatGPT这样的大型语言模型使用了类似的方法尽管它们是在文本而非生物信号上进行训练的。SleepFM 在从睡眠诊所评估的患者那里收集的 585,000 小时多导睡眠图数据上进行了训练。每个睡眠记录被分割成五秒的片段其功能类似于用于训练基于语言的 AI 系统的“单词”。“SleepFM 本质上是在学习睡眠的语言”邹说。该模型整合了多路信息流包括大脑信号、心律、肌肉活动、脉搏测量值和呼吸时的气流并学习这些信号如何相互作用。为了帮助系统理解这些关系研究人员开发了一种名为留一法对比学习的训练方法。这种方法每次移除一种类型的信号并要求模型利用剩余数据重建它。“我们在这项工作中取得的技术进步之一是弄清楚如何协调所有这些不同的数据模式使它们能够汇聚在一起学习同一种语言”邹说。从睡眠预测未来疾病训练完成后研究人员调整模型以执行特定任务。他们首先在标准的睡眠评估上对其进行了测试例如识别睡眠阶段和评估睡眠呼吸暂停的严重程度。在这些测试中SleepFM 匹配或超越了当前使用的主流模型的性能。随后团队追求一个更雄心勃勃的目标确定睡眠数据能否预测未来的疾病。为此他们将多导睡眠图记录与同一批个体的长期健康结果关联起来。这之所以成为可能是因为研究人员可以访问来自单一睡眠诊所的数十年医疗记录。斯坦福睡眠医学中心由已故的威廉·德门特William Dement医学博士、哲学博士于1970年创立他被广泛认为是睡眠医学之父。用于训练 SleepFM 的最大群体包括约 35,000 名年龄在2至96岁之间的患者。他们的睡眠研究是在1999年至2024年间在该诊所记录的并与电子健康记录配对这些记录跟踪了部分患者长达25年之久。米尼奥在2010年至2019年间指导该睡眠中心他表示该诊所的多导睡眠图记录甚至可以追溯到更早但仅限于纸质记录。利用这个组合数据集SleepFM 审查了 1000 多个疾病类别并识别出 130 种仅使用睡眠数据就能以合理准确度预测的疾病。在癌症、妊娠并发症、循环系统疾病和心理健康障碍方面结果最为显著其 C-index 预测得分高于 0.8。预测准确性如何衡量C-index即一致性指数concordance index衡量模型根据风险对人群进行排序的能力。它反映了模型正确预测两个个体中谁将先经历健康事件的频率。“对于所有可能的个体对模型会给出一个排序表明谁更有可能更早经历某个事件——比如心脏病发作。C-index 为 0.8 意味着在 80% 的情况下模型的预测与实际发生的情况一致”邹说。SleepFM 在预测帕金森病C-index 0.89、痴呆0.85、高血压性心脏病0.84、心脏病发作0.81、前列腺癌0.89、乳腺癌0.87和死亡0.84方面表现尤为出色。“我们惊喜地发现对于相当多样化的疾病模型能够做出有信息量的预测”邹说。邹还指出准确性较低的模型通常 C-index 在 0.7 左右已经在医疗实践中使用例如帮助预测患者对某些癌症治疗可能有何反应的工具。理解AI所见的模式研究人员现在正致力于改进 SleepFM 的预测并更好地理解系统是如何得出结论的。未来的版本可能会整合来自可穿戴设备的数据以扩展生理信号的范围。“它不会用英语向我们解释”邹说。“但我们开发了不同的解释技术来弄清楚模型在进行特定疾病预测时是在关注什么。”团队发现虽然心脏相关的信号在预测心血管疾病方面影响更大大脑相关的信号在心理健康预测中扮演更重要的角色但最准确的结果来自于结合所有类型的数据。“我们获得用于预测疾病的最多信息是通过对比不同通道的数据”米尼奥说。不同身体组成部分之间不同步——例如大脑看起来像在睡觉但心脏看起来像醒着——似乎预示着麻烦。生物医学数据科学博士生拉胡尔·塔帕Rahul Thapa和丹麦技术大学的博士生马格努斯·鲁德·凯尔Magnus Ruud Kjaer是这项研究的共同第一作者。来自丹麦技术大学、哥本哈根大学医院 - 里格肖斯皮塔莱特、BioSerenity、哥本哈根大学和哈佛医学院的研究人员为这项工作做出了贡献。该研究获得了美国国立卫生研究院资助号 R01HL161253、奈特-汉尼斯学者项目和陈-扎克伯格生物中心的资助。FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享
AI模型“睡眠语”解码疾病预警信号
科学家们构建了一种人工智能系统它能够利用单夜的睡眠数据预测数十种严重疾病的风险。通过识别大脑与身体信号间细微的不协调该系统能在疾病显现前很久就揭示出早期预警信号。图片来源: Shutterstock辗转难眠的夜晚通常会导致次日疲劳但它也可能预示着更晚才会显现的健康问题。斯坦福医学院Stanford Medicine的科学家及其合作者开发了一种人工智能系统可以检测单夜睡眠中的身体信号并评估一个人罹患100多种不同医学疾病的风险。该系统名为SleepFM使用了来自65,000名个体近60万小时的睡眠记录进行训练。这些记录来自多导睡眠图这是一种深入的睡眠测试在睡眠期间使用多个传感器追踪大脑活动、心脏功能、呼吸模式、眼球运动、腿部运动以及其他身体信号。睡眠研究蕴含未被开发的健康数据多导睡眠图被认为是评估睡眠的黄金标准通常在实验室环境中通宵进行。虽然它广泛用于诊断睡眠障碍但研究人员意识到它也捕获了大量鲜少被充分分析的生理信息。“我们在研究睡眠时记录了数量惊人的信号”这项新研究的共同高级作者伊曼纽尔·米尼奥Emmanual Mignot医学博士、哲学博士说。该研究将于1月6日发表在《自然医学》杂志上。“我们在一个完全被动的受试者身上用八小时研究了一种通用的生理学。这蕴含着极其丰富的数据。”在常规临床实践中这些信息中只有一小部分被检视。人工智能的最新进展现在使研究人员能够更彻底地分析这些庞大而复杂的数据集。据该团队称这项工作是首次将人工智能大规模应用于睡眠数据。“从人工智能的角度来看睡眠的研究相对不足。有很多其他人工智能工作在关注病理学或心脏病学但关注睡眠的相对较少尽管睡眠是生命中如此重要的一部分”该研究的共同高级作者、生物医学数据科学副教授詹姆斯·邹James Zou哲学博士说。教AI学习睡眠模式为了从数据中发掘洞见研究人员构建了一个基础模型这是一种旨在从非常庞大的数据集中学习广泛模式然后将该知识应用于众多任务的人工智能类型。像ChatGPT这样的大型语言模型使用了类似的方法尽管它们是在文本而非生物信号上进行训练的。SleepFM 在从睡眠诊所评估的患者那里收集的 585,000 小时多导睡眠图数据上进行了训练。每个睡眠记录被分割成五秒的片段其功能类似于用于训练基于语言的 AI 系统的“单词”。“SleepFM 本质上是在学习睡眠的语言”邹说。该模型整合了多路信息流包括大脑信号、心律、肌肉活动、脉搏测量值和呼吸时的气流并学习这些信号如何相互作用。为了帮助系统理解这些关系研究人员开发了一种名为留一法对比学习的训练方法。这种方法每次移除一种类型的信号并要求模型利用剩余数据重建它。“我们在这项工作中取得的技术进步之一是弄清楚如何协调所有这些不同的数据模式使它们能够汇聚在一起学习同一种语言”邹说。从睡眠预测未来疾病训练完成后研究人员调整模型以执行特定任务。他们首先在标准的睡眠评估上对其进行了测试例如识别睡眠阶段和评估睡眠呼吸暂停的严重程度。在这些测试中SleepFM 匹配或超越了当前使用的主流模型的性能。随后团队追求一个更雄心勃勃的目标确定睡眠数据能否预测未来的疾病。为此他们将多导睡眠图记录与同一批个体的长期健康结果关联起来。这之所以成为可能是因为研究人员可以访问来自单一睡眠诊所的数十年医疗记录。斯坦福睡眠医学中心由已故的威廉·德门特William Dement医学博士、哲学博士于1970年创立他被广泛认为是睡眠医学之父。用于训练 SleepFM 的最大群体包括约 35,000 名年龄在2至96岁之间的患者。他们的睡眠研究是在1999年至2024年间在该诊所记录的并与电子健康记录配对这些记录跟踪了部分患者长达25年之久。米尼奥在2010年至2019年间指导该睡眠中心他表示该诊所的多导睡眠图记录甚至可以追溯到更早但仅限于纸质记录。利用这个组合数据集SleepFM 审查了 1000 多个疾病类别并识别出 130 种仅使用睡眠数据就能以合理准确度预测的疾病。在癌症、妊娠并发症、循环系统疾病和心理健康障碍方面结果最为显著其 C-index 预测得分高于 0.8。预测准确性如何衡量C-index即一致性指数concordance index衡量模型根据风险对人群进行排序的能力。它反映了模型正确预测两个个体中谁将先经历健康事件的频率。“对于所有可能的个体对模型会给出一个排序表明谁更有可能更早经历某个事件——比如心脏病发作。C-index 为 0.8 意味着在 80% 的情况下模型的预测与实际发生的情况一致”邹说。SleepFM 在预测帕金森病C-index 0.89、痴呆0.85、高血压性心脏病0.84、心脏病发作0.81、前列腺癌0.89、乳腺癌0.87和死亡0.84方面表现尤为出色。“我们惊喜地发现对于相当多样化的疾病模型能够做出有信息量的预测”邹说。邹还指出准确性较低的模型通常 C-index 在 0.7 左右已经在医疗实践中使用例如帮助预测患者对某些癌症治疗可能有何反应的工具。理解AI所见的模式研究人员现在正致力于改进 SleepFM 的预测并更好地理解系统是如何得出结论的。未来的版本可能会整合来自可穿戴设备的数据以扩展生理信号的范围。“它不会用英语向我们解释”邹说。“但我们开发了不同的解释技术来弄清楚模型在进行特定疾病预测时是在关注什么。”团队发现虽然心脏相关的信号在预测心血管疾病方面影响更大大脑相关的信号在心理健康预测中扮演更重要的角色但最准确的结果来自于结合所有类型的数据。“我们获得用于预测疾病的最多信息是通过对比不同通道的数据”米尼奥说。不同身体组成部分之间不同步——例如大脑看起来像在睡觉但心脏看起来像醒着——似乎预示着麻烦。生物医学数据科学博士生拉胡尔·塔帕Rahul Thapa和丹麦技术大学的博士生马格努斯·鲁德·凯尔Magnus Ruud Kjaer是这项研究的共同第一作者。来自丹麦技术大学、哥本哈根大学医院 - 里格肖斯皮塔莱特、BioSerenity、哥本哈根大学和哈佛医学院的研究人员为这项工作做出了贡献。该研究获得了美国国立卫生研究院资助号 R01HL161253、奈特-汉尼斯学者项目和陈-扎克伯格生物中心的资助。FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享