京東健康:用數實融合,做一個醫生「玩得轉」的醫療資料科研平臺

語言: CN / TW / HK

數年前,數字醫療的火熱,讓不少人把目光投向RWD——真實世界資料。

如字面意思,這一概念強呼叫患者的真實資料做研究,將日常所收集的各種與患者有關的資料,通過常見的資料探勘等工作釋放資料價值,從而將資料再用於醫學研究。

如今,已有臨床CRO、大資料、人工智慧、醫生平臺、基因檢測公司等多種產業角色湧入RWD,相繼推出面向醫生群體的科研工具。

但長期以來,這一賽道都缺少一個大體量的公司入場。

2022年5月,京東健康宣佈正式佈局RWS(真實世界研究)業務,啟動運營真實世界資料(RWD)平臺,開放自身的資料服務與技術能力,供醫療機構、學會、醫生、企業等研究者使用。京東健康背後的供應鏈資料、線上問診資料等資料、醫療機構夥伴資料,也將全部會在自建的RWD平臺上“跑起來”。

在雷峰網看來,京東健康RWD平臺是對既往能力厚積薄發和對行業痛點的敏銳洞察的產品,讓繁多的、面向醫生的科研工具多了另一種角色。京東健康的C端佈局與積累,只是一個開始。京東健康C端服務,與B端服務和H端服務的協同推進,讓人看到了這家巨頭更多的可能。

真實世界資料,對醫療科研工作者意味著什麼?

過去,臨床科研專案中的多資料來源整合問題,一直都是行業痛點。

中國中醫科學院中醫臨床基礎醫學研究所等機構,分析國內RWS熱點發現,截至2021年9月的十年間,RWS的資料來源主要包括醫院資訊系統、電子病歷、病例註冊登記平臺、醫療保險資料庫、全國人口資料庫等,研究熱點集中在HIS(醫療資訊化)資料的挖掘與分析。

儘管RWD的入局者橫跨醫院、藥企、保險、大資料公司,卻大都聚集在院內資料探勘上,這番景象無異於幾家地主同爭一畝二分地,入局的壁壘和天花板都很低。

實際上,醫生的科研需求,遠不止是用好手頭僅有的院內資料。對他們來說,由於丟失了患者在院外的資料,無法觀察疾病進展的全過程,通常導致現有的醫學研究的知識圖譜難以支援精確診斷和個體化治療。雷峰網瞭解到,不少醫院的醫生,曾向一些網際網路醫療和AI廠商直言:“誰能幫我找回院外的患者,就是一件大好事了。”

為何不去尋找新大陸?問題可能是,廠商們無法做到。

實際上,真實世界研究通常覆蓋人群廣、樣本量大、隨訪時間久、專案週期長,導致研究實施成本過高。同時,真實世界資料分散,無論是在院內還是院外,都形成了不同程度的資訊孤島。

時間、成本、技術,都是擺在前面的三重風險,不少企業對於這項費力卻不一定討好的事情,望而卻步。而這,正是京東健康過去所一直隱而不露的優勢——具備全場景使用者全生命週期的資料。

據雷峰網瞭解,此次推出的RWD平臺,建立在京東健康業務佈局的基礎上,覆蓋了“防、篩、診、治、康”的醫療全流程,幫助醫生們補齊院外資料這一塊拼圖。

京東健康RWD平臺對多源資料的處理流程

在資料收集上,京東健康RWD平臺整合院內外資料,結合患者在京東健康網際網路醫院的電子病歷、科研隨訪記錄、居家裝置資料等,形成完整的真實世界資料鏈條。據京東健康方面表示,資料收集效率達到傳統模式的6-7倍,可以極大提升醫生開展研究的效率。在這些資料的基礎上,京東健康RWD平臺基於健康知識圖譜,通過開放的、可擴充套件的資料對映元件與清洗元件,解決資料清洗難題。

在資料處理上,針對個人資訊,京東健康基於資料使用和呈現的不同需求,使用資料脫敏系統對敏感資料進行脫敏處理。資料脫敏系統內建了豐富高效的脫敏演算法,可根據不同資料特徵來快速脫敏常見的敏感資料,如姓名、證件號、患者健康狀況等。也可根據自身的資料特徵或政策合規、應用系統等需要,自定義脫敏演算法自定義演算法功能。此外,資料脫敏系統可以有效防止對隱私資料的濫用,防止隱私資料在未經脫敏的情況下從系統流出,從而實現既滿足對隱私資料的保護,又滿足監管合規的雙重需求。

對於科研人員而言,RWD平臺是一個SaaS化的產品,可以在這個平臺上對患者多源資料進行採集,並對資料進行深度處理和分析,獲得醫療產品的使用情況或潛在獲益的臨床證據。

此外,在醫生基於RWD平臺的日常科研中,京東還提供了另一大優勢:線上隨訪。依託京東健康網際網路醫院線上隨訪能力,包括量表、健康值測評、隨訪答題激勵等多種工具,醫生可對患者的疾病進展、治療情況進行全程跟蹤,幫助醫生多維度進行患者管理,增強患者的依從性,保持良好的醫患關係。

有了這個RWD平臺,研究者不僅獲得了全方位的科研及臨床決策支援,也在SaaS化服務中探索患者管理新模式,提高資料管理效率,降低科研成本。

據雷峰網 (公眾號:雷峰網) 瞭解,目前,心血管疾病將成為京東健康RWD平臺的首個應用領域。

近期,京東健康聯合中國心血管健康聯盟發起“中國高血壓患者院外規範化管理推廣工程”,計劃推動一萬名心內科醫生在《高血壓院外網際網路管理中國專家共識》的指導下管理、服務超過一百萬名患者。

在提升醫生工作效率、增進患者自我管理意識的同時,京東健康RWD平臺將沉澱隨訪資料和醫患兩端的反饋,生成百萬量級的結構化院外隨訪資料,並依託這些資料,分析併產出真實世界下高血壓院外管理的研究報告和患者管理白皮書。

而這只是一個開始。未來。京東健康RWD平臺將實現與醫療機構、區域醫學聯盟實現資料互聯互通,為更多大型真實世界研究提供解決方案。

用技術,打破多源資料融合的那堵牆

在京東健康RWD平臺的背後,一方面源於京東健康敏感的業務拓展嗅覺,另一方面是整個集團層面的技術助力。

京東健康技術產品部網際網路醫療高階產品總監袁曉春表示,“RWD的資料探勘、資料結構化、線上隨訪能力,都建立在京東健康的已有數智技術叢集中。我們認為,現階段平臺的使用者管理規模和資料規模達到了一個合理的量級,推出RWD平臺的條件已經成熟。”

在袁曉春看來,從一開始,京東健康就是奔著醫生們最迫切的院內院外一體化資料需求去的。

其中,獲取難度最高的使用者隨訪資料,可以說是所有院外資料中最關鍵的資料。這一環節,既強調與患者的關聯、患者隨訪的防脫落,又要強調隨訪資料的真實性等,對缺少與C端使用者打交道的公司來說,極易導致使用者失訪、使用者資料不完整或失真。

袁曉春表示,這正是網際網路公司更擅長的部分。目前,京東健康所用的工具迭代、隨訪激勵、醫療器械資料自動採集等,更貼合網際網路公司的打法和經驗。

從隨訪資料的出發點看,京東健康一直強調的是醫生的自我驅動。她表示,“患者也需要醫生隨訪,比如很多慢病患者非常需要線上院外的診後管理,隨訪資料則會與患者的健康強相關。醫生也不是為了科研而科研,RWD實際是網際網路醫療價值的延伸和體現。”

以京東健康隨訪專案資料來看,一些專案使用者的失訪率可以控制在30%以內。如果以京東健康年度活躍使用者數量1.23億(京東健康2021年全年財報資料)計算,後續一旦全面開放面向使用者端的隨訪功能,將能夠在很大程度上擴充套件RWD平臺的資料體量。

此外,關係RWD平臺搭建效果的第二點,是資料融合處理的能力。

作為坐擁海量C端使用者的企業,京東健康旗下網際網路醫院沉澱的診療資料、京東大藥房積累的用藥和隨訪資料、京東家醫從使用者健康狀態就開始沉澱的醫療健康全維度資料、消費醫療連線的各類檢驗檢測資料,均構建了一個海量的資料池。

為此,京東健康RWD平臺會對收集到的多源資料,支援對問卷欄位進行單因素分析、相關性分析、生存分析等常見的資料分析;並通過搭載的Flink實時計算引擎,提供千萬級規模的實時資料分析,可多維度分析調研內容的相關性;提供多維圖表形式,支援分析結果匯出,幫助研究者更全面的瞭解資料情況。

讓機器對醫療資料進行清洗和理解,一直是一個讓行業頭疼的問題。

開發者拿到一個簡短的文字後,要去解決實體識別的準確率問題,包括文字糾錯、名詞短語抽取、NER ( 命名實體識別 ) 和實體連結。最後,則需要結合底層資料的積累,包括知識圖譜的建設以及結合具體業務場景的資料來完成語義上的擴充。

例如,患者的就診記錄中會有一些日常語句。比如,患者會說“口腔潰瘍”、“口瘡”等,而這些欄位,在醫生那裡會有一個專有醫學名詞——“複發性阿弗他口炎”。因此,對於京東健康來說,就需要建立內部的標準欄位集,用機器來對患者的日常用語進行分類和理解。

實際上,在推出RWD平臺之前,京東集團層面就已經具備了非常多的資料處理“武器庫”,比如隱喻識別、聚類分類、資料的結構化和標準化處理等通用技術。而京東健康多年的技術和知識圖譜積累,涉及自然語言處理、聚類分類、通用欄位的對映標準等,在醫療大資料的定製化清洗和提取層面,能夠達到臨床科研級別。

“京東集團的長期的技術能力積累可以給我們更好的支援,我們可以在RWD平臺上將集團的技術能力充分複用和發揮。”

值得一提的是,除了集團層面,京東健康內部還有一個技術中臺,有一支專業的資料產品和技術團隊投入在RWD平臺的開發上。

袁曉春透露,無論是人員設定,還是技術建設,最終的目標都是打通院內院外的資料,低成本、規模化、連續地開放給醫療研究人員們使用。

醫療資料價值探索的下半場

回顧京東健康過去的發展路徑,我們能發現,過去,京東健康加速從“商品提供者”向“服務提供者”轉型,而這也是其走向“數實融合”發展的重要基礎。

京東健康的2021年業績報告顯示,其總收入達306.8億元,同比增長58.3%,其中服務收入同比增長72.7%,佔整體收入的14.7%,這一板塊的增速和比重均提升明顯。

據瞭解,京東健康的“服務”含義覆蓋廣泛,除了為C端使用者服務,還為廣大醫療健康行業的相關參與方,如醫院、醫生、產業鏈夥伴等提供各類服務和解決方案,但最終又實現對使用者需求的“反哺”。這說明,京東健康的醫療健康服務效應正在逐漸凸顯。

實際上,打通全流程健康服務閉環,京東健康早在2017年年底就有所行動。

彼時,京東健康獲得國內首批網際網路醫院牌照,開展線上諮詢問診業務,著手將醫生資源平移到網際網路醫院。另一邊,京東健康也在探索醫生與使用者的服務模式,並在隨後重點進行了專科中心、專病庫建設、專病欄位集等建設,為日後滿足多方科研訴求打下地基。

目前,平臺已經開設了包括心臟中心、耳鼻喉中心、中醫院、呼吸中心、精神心理中心等在內的27個專科中心,外部醫生團隊覆蓋超過1.5萬家醫院的十餘萬名醫生,併入駐近百位權威專家和頂級名醫,如韓德民院士、胡大一教授、高思華教授、林江濤教授等。

因此,基於以往的積累,RWD平臺已經規劃了心血管、消化內科、耳鼻喉科、婦產、精神心理等12個學科內的約100個專病庫,不斷開放給多個學科的研究者使用,形成平臺與醫生的正向迴圈。

這表明,面向醫生端的需求,京東健康打響了平臺化建設的第一槍。

比如,2020年起,京東健康推出了基於藥學知識圖譜的處方稽核引擎,這是基於藥學知識庫和真實世界資料,結合語義理解、機器學習等人工智慧技術構建的藥學知識圖譜,相關產品可以為各方提供高效便捷的合理用藥和智慧處方稽核等服務。

實際上,在長期被資訊割裂的醫療行業中,醫生和零售藥房能夠在京東健康的數智化工具幫助下,提供更多樣化的患者服務;同時,除了打造自身的全流程健康服務閉環外,京東健康還利用自身的技術基礎設施和能力,幫助H端的醫療機構及B端供應商提供智慧醫療解決方案。而京東健康也因為有這些業務沉澱出的能力資源和資料服務做底氣,在拓展新業務時有更多想象力。

袁曉春表示,一直以來,京東健康非常重視資訊保安工作,在“醫”、“患”、“藥”、“械”等業務領域都做了安全佈防。除了滿足國家“三法一條例”等法律法規及行業監管政策的要求之外,京東健康也在不斷打磨符合健康醫療行業特有規定深度資訊保安保障能力。截至目前,京東健康已獲得ISO27001和ISO27002認證,同時在此基礎上不斷提升醫療健康資訊保安能力,為使用者和合作夥伴提供更好的資料安全服務保障。

迴歸到創立RWD平臺的初衷,袁曉春對雷峰網表示,在京東健康的發展中,越來越多的醫生、院士、以及基層醫生加入進來,他們看到京東健康佈局的鏈條,也會主動和平臺溝通,希望京東健康能夠幫助打通院外資料,建立一個公開使用的資料研究平臺。

“如今,RWD平臺以SaaS形式向外服務,其實是京東健康不斷與平臺醫生規劃、設計的結果。在這個過程中,京東健康也在不斷向醫生的真實需求靠攏。”據袁曉春透露,RWD平臺中的隨訪管理工具已經逐步面向醫生全量開放。

針對未來規劃,京東健康將會基於每一個專業病種、學科,推出更深層次的管理工具和資料能力。“這將是未來一段時間裡我們的重點工作。”

基於全產業鏈的醫藥能力和全週期健康管理能力,京東健康正在不斷拓展和匹配更貼近使用者需求的健康管理服務。對京東健康來說,在探索資料價值的下半場,以RWD平臺滿足醫生的長期職業發展需要,將是個新使命與新機會。同時,基於京東健康在C端服務的技術積累,在與H端的協同創新中,也讓人感受到了可期的未來。

“我們在智慧輔診和數字療法方面也會持續發力,目前正在快速迭代更加數智化的解決方案,所以,京東健康接下來也不斷會有全新的醫院服務產品推出。”袁曉春說。

雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知

「其他文章」