全球健康学院

合作交流

合作论坛

当前的位置是: 首页 >> 合作交流 >> 合作论坛 >> 正文

全健康论坛第21讲:统计学在健康数据科学中的作用

作者:张其羽、王舒珣   发布时间 :2022年12月20日

2022年12月19日下午,上海交通大学医学院-国家热带病研究中心全球健康学院、上海交通大学-爱丁堡大学全健康研究中心特邀复旦大学大数据学院傅博教授主讲全健康论坛第21讲,主题是“统计学在健康数据科学中的作用”,全球健康学院全院师生参加了本次论坛。

首先,傅博教授首先从统计学的概念说起,指明统计思维的重要性,并对现代统计学的发展历史进行了介绍。并由此引出两种统计文化,即数据建模文化(Data modelling culture)和算法建模文化(Algorithmic modelling culture)。傅博教授就两种统计文化进行了介绍,前一种文化的要点是更加强调拟合度和统计推断,后一种文化更加强调预测而不是理解机制。

而后,由“什么是数据科学”之问,傅博教授指出,数据科学是一个跨学科的领域,它使用科学方法、流程、算法和系统从许多结构性和非结构性数据中汲取知识和深层见解。同时,傅教授结合许多实际问题列举大数据在当今信息爆炸时代中的许多优势,也指出现今统计学学所面对的挑战中“偏倚”是最不容忽视的问题之一,其中选择性偏倚可以基于两种思想使用因果推断、加权等方法进行处理。除此之外,傅教授结合疫情间部分实例,展示了数据质量对于结果也有着至关重要的影响,数据质量的影响因素包括数据缺失、数据收集过程缺陷等。研究者们可以通过统计思维加强理解模型“如何、何时以及为何起作用或不起作用”、评估其对统计结论和科学发现的影响和使用更健全的建模方法提升数据质量。


在方法学的挑战方面,傅博教授列举了因混杂造成的数据缺失、无法测的混杂因素、时依性混杂等挑战。在实践中,观察性研究里一些测量值的缺失几乎是不可避免的,但如果缺失程度很高,将会产生问题。

最后,傅博教授就统计学在健康数据科学中的作用做出总结,指出在未来医学领域的发展中,大数据的深度学习有助于医疗诊断、风险预测等分类与预测型任务,并提供有效帮助。在研究中的统计因果推断有助于评估治疗效果和医疗决策支持或干预行为,如精准医疗等,并且因果推断还有利于降低偏倚,与大数据深度学习相辅相成。会后,傅博教授与全健康学院全体师生进行了深入的探讨交流,对大家提出的问题进行了详细的解答,并表示在未来希望能与全球健康学院进行线下交流,并进行更进一步的合作。

傅博,复旦大学大数据学院教授、博士生导师。2003年在香港大学获得统计学博士学位,2003-2006年在剑桥大学从事博士后研究。2006年至2017年先后在新加坡南洋理工大学数学科学系、英国曼彻斯特大学医学院、英国伦敦大学学院医学院任教职。2015-2017年同时在英国行政数据研究中心和剑桥大学MRC生物统计中心兼职。作为项目负责人主持过英国医学研究理事会、英国儿童健康研究基金、中国国家自然科学基金等机构资助的多项科研基金项目。研究论文发表在统计学、数据科学、人工智能、生物医学、公共卫生、流行病学、卫生政策、运筹管理等领域。


上一条:全健康论坛第11讲——动物源细菌耐性监测体系情况及“禁抗”政策解读

关闭