提起近年炙手可熱的「大數據」(big data),你大概會想到它關乎商家們做生意。然而,除了商界之外,醫學研究也能採用大數據,協助統計分析成千上萬人,林林總總的長期身體狀況。
甚麼是大數據?「醫療大數據」又是甚麼?
「大數據」看似很離地很高科技,但其實並不複雜。顧名思義,它就是指「非常大量的數據」。通常我們聽到大數據,都來自科網或商界企業,由各種渠道搜集和統計普羅大眾的上網、消費和生活習慣,以訂出市場推廣策略。
然而,大數據不單能用在科技發展或商業,運用「醫療大數據」,對醫學研究也大有幫助。
醫療大數據是指統合我們每一位市民的醫療紀錄,包括年齡、性別、病歷、家族病史、藥物使用情況、身體檢查報告等等。由於數據量龐大又複雜,研究時往往需要使用人工智能技術。
使用醫療大數據作醫學研究的三大優勢
傳統的醫學研究,難以長期追蹤大量人群的健康狀況,這正是運用醫療大數據研究的優點:
- 樣本人數多:傳統研究難以追蹤大量人群。大數據的數據庫人數多,研究對象的範圍更廣。
- 數據來自真實生活:數據在真實世界中收集,比受控實驗更反映真實生活的影響,容易應用於常規臨床實踐和患者管理。
- 觀察期長:大數據的紀錄歷時長久,可以調查需要跟進很長時間的健康問題,例如乙肝、脂肪肝、糖尿病等各種慢性疾病的病理,或藥物的長期影響。
簡而言之,使用醫療大數據作醫學研究,能夠分析大量人群的真實健康紀錄,有助我們得知長遠的醫療成效和病理發展。
大數據的私隱問題
你可能會問:那些數據,其實都是我們市民的真實活動,那大數據會有私隱問題嗎?
如何維護個人私隱,的確是對大數據研究的常見疑慮之一。我們運用醫療大數據研究時,必須先通過醫學倫理委員會批核,保證數據只用作研究用途。數據全部會經去識別化(de-identification)處理,確保研究對象的個人身份及私隱資料不能被研究者識別。數據會受嚴格密碼保護,避免資料外洩,亦會在相關研究完成後一定時間銷毀。
香港中文大學醫學數據分析中心
2020年,香港中文大學醫學數據分析中心成立,由腸胃肝科專科醫生黃麗虹教授擔任主任、醫療統計學者葉卓風教授擔任副主任,致力利用醫療大數據,通過統計方法和人工智能分析,精進醫學研究。大家可以瀏覽新近架設的醫學數據分析中心網站,得知各種健康問題的研究進展、最新的出版物和對不同疾病的預測算式。
校閱:黃麗虹教授及葉卓風教授
日期:2023年5月12日