對付“沉默殺手”敗血症,醫院用上了人工智慧

語言: CN / TW / HK

本文來自微信公眾號: 出色WSJ中文版 (ID:WSJmagazinechina) ,作者:Laura Landro,翻譯:萬志文(熊貓譯社),原文標題:《醫院正如何利用人工智慧拯救生命?》,頭圖來自:視覺中國

一、人工智慧VS敗血症

敗血症是由感染引起的一種極端反應,可致命,而且往往難以診斷。目前,人工智慧在幫助檢測和預測住院病患是否患有敗血症,以便及早發現和治療方面好壞參半,醫生和資料科學家正在對預測模型進行完善。

根據美國醫療保險和醫療補助服務中心的資料,2015 年,全美嚴重敗血症和敗血性休克患者只有不到一半獲得適當的治療。

自開始使用 Sepsis Watch (杜克大學的一款人工智慧應用) 以來,杜克大學醫院的這些數字有所改善,獲得適當治療的患者比例從遠低於全美平均水平攀升至遠高於全美平均水平。

敗血症發病和惡化很快,通常在病人進入急診室的幾個小時內發生。因此,杜克大學專注於為入院患者儘快檢測和預測敗血症發病風險,提高治療速度。

Sepsis Watch 基於 4.2 萬名住院病人的資料,其中 21.3% 曾患有敗血症。這些資料包括 2500 萬次生命體徵測量、520 萬次實驗結果和 200 萬次用藥資訊。

一名護士正在使用該應用檢查病人狀態

Sepsis Watch 會不斷監測病人的生命體徵、用藥資訊和實驗室結果,將所有這些資料用作診斷或預測敗血症發病風險的基礎。

第一步,Sepsis Watch 會對每一名進入急診科的病人進行分析,應急護士負責監控 Sepsis Watch 的情況。

第二步則是病人分類。對於出現全身炎症反應綜合徵 (SIRS) 的病人——包括高體溫、高心率和高呼吸頻率以及內臟器官損傷,Sepsis Watch 會將其標記為符合敗血症標準。對於不符合敗血症標準的病人,Sepsis Watch 會用彩色標記卡片對其敗血症發病風險進行標記,風險等級分為高、中和低。這些卡片每 5 分鐘會根據病人的最新資料更新一次。

最後一步即為預警和治療。應急護士與主治醫生討論被標記為患有敗血症或患敗血症風險高的病人情況。然後,醫生獨立審查醫療記錄,評估病人的狀況,做出敗血症治療決策。治療方案分兩個階段進行:一套三小時的干預措施,然後是一套包括抗生素的六小時干預措施。

“掌控權還得在臨床醫生手裡,但人工智慧和預測模型讓通過挖掘大量資料得出的深刻洞見變得觸指可及,因而只要及時治療,就可以改善病患療效。”加州非營利醫療組織 Kaiser Permanente 的研究員兼重症監護專家 Vincent X. Liu 表示。

以下是正在進行的一些努力:

二、追趕關鍵的12小時

一旦病人的病情惡化引發緊急情況,一切往往為時已晚,病患通常需要生命維持治療或重症監護。

Vincent Liu 說, 藉助資料分析,提前 12 小時預測出病人的病情惡化,就會避免這類緊急情況的出現,讓病人避免進 ICU,即便需要重症監護,病況也會相對好一些

凱撒醫療 (Kaiser Permanente) 開發了一個名為 Advance Alert Monitor 的預測模型,它可以識別出約一半病情會惡化的病人。它會持續掃描分析病患資料,對病人轉入 ICU 或死亡的風險進行評分。12 個小時的時間視窗可讓醫療人員在病人狀況相對穩定、可能只是需要加強篩查或監護的時候接觸他們。Vincent Liu 指出,“這就像大海撈針,所以預測模型必須要仔細分析所有病患的情況,從中發現高風險病人。”

為了儘量減少“警報疲勞”,模型預測結果不會直接呈現給醫院工作人員,而是由受過專門培訓的護士遠端監控,這樣床旁護士就可以集中精力照看病人。

如果病人的評分達到特定的閾值,遠端護士就會聯絡病房的應急護士,然後後者會啟動正式評估,並聯系病人的醫生,醫生可以啟動救援計劃,包括轉入 ICU。

去年 11 月,《新英格蘭醫學雜誌》發表了一項對凱撒醫療旗下 19 家醫院持續將近三年的研究。凱撒醫療稱,相較於沒有使用該預測模型的醫院,有使用的醫院病患死亡率較低,ICU 進入率較低,住院時間較短。凱撒目前在 21 家醫院推行該模型,護士每年處理超過 1.6 萬次警報。

三、新時代的“作戰室白板”

對病人來說,敗血症是最危險的情況之一。敗血症意味著,原有的感染在體內引發了危及生命的連鎖反應,如果不及時治療,就會導致器官衰竭和死亡。美國疾病控制與預防中心的資料顯示, 在醫院死亡病例中,近三分之一患有敗血症,87% 在住院之前就開始出現敗血症

在大多數病例中,可以通過快速診斷和治療對其加以預防,但研究表明,許多敗血症病人可能沒有得到相應的治療。目前還沒有診斷敗血症的黃金標準,其症狀也見於別的疾病,例如發燒和心率過快,所以很難確定病患是否患有敗血症。

一些醫院發現,外部供應商和開發者設計的演算法是基於不相關的資料開發的,會引發錯誤警報和發生更多問題的隱憂。

據杜克大學醫學院內科醫生、助理教授 Cara O’Brien 說, 在發現一個常用的敗血症檢測模型發出錯誤警報後,杜克大學醫院決定開發自有的機器學習模型,利用自己的病人病歷資料快速準確地預測敗血症發病風險。

O’Brien 帶領一個由醫生和護士組成的團隊,利用超過 3200 萬個資料點對該模型進行訓練,其中包括生命體徵測量、實驗室報告和藥物管理。這些資料涵蓋 14 個月內分析的 4.2 萬多名住院病人的情況,其中 21.3% 曾被診斷出敗血症。該模型每隔五分鐘從病人的生命體徵、藥物和實驗室測量資料中採集資料,分析 86 個不同的變數,進行多次資料取樣,發現可能預示敗血症發病的關聯性。

Sepsis Watch 的控制面板包含按四種顏色標記劃分的病人名單,其中患敗血症風險高的的病人標記為紅色。一名應急護士 12 小時輪班,負責在 iPad 上監控該控制面板,聯絡急診醫生,就任何一位敗血症病人或有患敗血症風險的病人的情況進行討論。病人須經過醫生同意才能接受治療。

醫院必須公開報告遵守敗血症治療指南 (已被證明可以改善病情) 的情況,治療指南包括在病人到達急診室後的特定時間內開抗生素處方、進行某些實驗室測試等行動。在啟動該專案後的 15 個月內,杜克大學對敗血症治療指南的遵從率提高到了 64%,而在此之前的 18 個月裡,這一比例僅為 31%。共同領導該專案的杜克大學醫生兼臨床資料科學家 Mark Sendak 表示, 對 Sepsis Watch 效果的最終分析正在進行中,但病患死亡率可見在下降 ,該演算法現在也被用在急診室的所有病人身上。

大型醫院連鎖集團 HCA Healthcare 則自主開發了 名為“Spot”的預測演算法,用於敗血症的預測和治療優化 。在此之前,護士主要是在換班時,或病人被轉到不同科室時人工檢視病人資料,檢查是否可能患有敗血症。而該預測演算法則可以持續監測生命體徵、實驗室結果、護理報告和其他資料,在多個預示即將出現敗血症的訊號同時出現時會直接向護士發出警報。

這些警報呈現給臨床醫生的不僅僅是預測結果,還是他們臨床判斷病人是否患有敗血症的觸發因素。

該連鎖醫院發現,Spot 檢測出敗血症的時間比臨床醫生早 6 個小時,檢測準確率也更高;早期識別和治療使得 160 家醫院的敗血症死亡率降低了近 30%。

HCA 首席資料科學家 Edmund Jackson 及其團隊利用 Spot 平臺開發了應用更廣泛的程式 Nate 。藉助機器學習技術,Nate 可更快地發現其他危急或危及生命的病況,如創傷病人的休克、術後併發症、各類疾病的早期惡化跡象等等。

在設計新的演算法時,資料科學家與臨床工作人員進行合作,以確定哪些預測模型對後者最有用,以及如何將模型融入病人護理流程。其中一項努力專注於研究如何讓婦產科部更好地引入預測模型,利用胎兒心臟監測器資料,助力主動管理胎兒宮內窘迫的風險。

HCA 神經外科醫生兼護理轉型與創新高階副總裁 Michael Schlosser 表示,“我們有一個專門的創新團隊,他們會在醫院與床旁護理人員密切合作。我們不會獨自開發完,然後跟醫療人員說,‘這是一個專為你打造的、經過訓練的人工智慧。’”

新冠疫情期間,團隊能夠使用 Nate 平臺開發針對感染者問題的演算法,例如提醒重症監護醫生、護士和呼吸治療師留意使用機械呼吸機的病人,告知他們可能需要根據病情調整治療方案。

Schlosser 稱,演算法也有望用於應對自然災害,比如在颶風來臨前迅速評估哪些病人可以安全撤離,以往工作人員則必須依靠“便利貼在作戰室的白板上進行這種安排”。

四、再入院風險評估

醫院也在利用機器學習解決一大棘手問題: 如何判斷哪些病人在出院 30 天內重新入院的風險最高。

醫院通常使用標準的再入院風險評分系統,該系統所基於的資料點比較有限,包括病人住院時長、入院時的病情、他們身上的其他疾病和症狀以及入院前六個月內是否看過急診。但這些標準評分並沒有考慮到醫院各自的病人病歷資料情況。

例如,在 2019 年發表的一項針對三家醫院的研究中,馬里蘭大學的研究人員發現,與常用的再入院風險評分系統相比,基於各醫院再入院資料的機器學習評分能夠更好地判定哪些病人需要更多幹預措施,以避免再次入院。

但根據這項研究,再入院預測只是預防再入院的第一步。防止病人再入院的干預措施往往費用高昂,需要大量人力,其中包括將他們轉到出院診所、過渡性護理和遠端監護。他們也並不總能認識到健康的各種社會決定因素。

David Vawdrey 是賓夕法尼亞州擁有 10 家醫院的 Geisinger Health System 的首席資料資訊學官,在他看來,缺乏資源幫助再入院風險最高的病人是一個主要問題,不過預測演算法有望幫助採取措施讓病人一開始就不必住院,確保他們對嚴重疾病進行預防性篩查。

例如,Geisinger 與 Medial EarlySign 公司合作發現逾期未做結直腸癌篩查的病人,使用機器學習演算法標記那些高風險病人。然後,由照護經理打電話給病人,告知他們所面臨的風險,並提出安排進行結腸鏡檢查。根據 NEJM Catalyst 最近的一份報告,這兩家公司能夠為 68.1% 被標記的高風險病人安排進行結腸鏡檢查,其中約 70% 的檢查有重大發現。

Vawdrey 指出,“人工智慧的優先排序能力讓我們能夠更深入地接觸病患,為那些風險最高的人採取額外步驟,告訴他們,‘你真的該來接受檢查了。’”

五、發現模型缺陷

隨著人工智慧系統在醫院中發揮越來越大的作用,研究人員也在設法更好地判斷它們何時不起作用以及為什麼不起作用。

演算法使用統計方法從臨床資料中學習重要模式,並預測未來的結果,但有許多因素可能會導致用於構建演算法的資料不適合用於演算法的現實用途。 如果沒有被發現,這樣的缺陷可能會致使演算法無法診斷重症病人,或者提供有害的治療建議。

Karandeep Singh 是密歇根大學健康科學和內科醫學助理教授,以及密歇根醫學臨床智慧委員會主席。他說,開發者可能會採用在一個衛生系統中受過訓練的模型,然後開始將其應用於其他有著不同病患群體的衛生系統,或者在一個醫院中長期執行一個模型,但不使用新資料對其進行更新升級。

例如,當新冠病例開始在全美各地的醫院激增時,常用的人工智慧敗血症演算法無法區分細菌性敗血症和新冠病毒;二者症狀相似,但治療方法完全不同。在護士報告了過多的敗血症警報後,密歇根大學在 2020 年 4 月至 7 月暫時禁用了該演算法。該大學目前正在研發替代模型。

研究人員正在探究演算法模型可能失效的其他常見原因,設法減輕它們帶來的影響。例如,Singh 說,主要針對白人群體訓練的預測模型在其他種族或族裔群體的病人身上往往表現不佳,但改用涵蓋更多群體的資料集重新訓練或重新設計那些模型,使用專門的演算法,或許是可行的。

“目前,醫院可接觸到的人工智慧模型多得用不過來。”他說,為了在未來安全地使用這些工具,它們必須“瞭解人工智慧何時產生不了預期作用,並根據問題是否可解決來確定問題的優先順序,而不是僅僅根據有哪些人工智慧工具可用。”

本文來自微信公眾號: 出色WSJ中文版 (ID:WSJmagazinechina) ,作者:Laura Landro,翻譯:萬志文(熊貓譯社)