新聞 > 大陸 > 正文

中國多地醫院,出售患者數據

越來越多「沉睡」在醫院中的「隱形資產」正在被交易。

不久前,首都醫科大學附屬北京同仁醫院與拜耳集團、恆瑞醫藥籤署數據交易協議,完成全球首個眼科全維度隨訪數據集交易。今年1月,估值達45萬餘元的福建閩清縣總醫院神內、心內、老年科專病庫數據資源,在北京國際大數據交易所達成交易。

2023年12月,國家數據局等17部門聯合印發《「數據要素×」三年行動計劃(2024—2026年)》,提到健康醫療等12個領域要有序釋放數據價值。不過,有專家指出,部分醫療機構不知道數據資產的概念。更多公眾關心的是:數據交易過程中,自己的私隱是否會被泄露?

「99%的數據都無法直接出售」

首都醫科大學附屬北京同仁醫院院長袁進說,本次交易的眼科數據集包含全年齡段、共覆蓋10萬人,涵蓋角膜病、乾眼症、近視等臨床高發眼病。拜耳集團處方藥事業部副總裁、中國眼科業務總經理陳白平表示,眼病數據會為拜耳眼科產品線的研發決策提供循證支持,也有助於基於眼底影像的人工智能模型開發。

醫療數據的市場需求始終存在。醫療戰略諮詢公司Latitude Health創始人趙衡告訴《中國新聞周刊》,在醫療數據被允許出售前,許多企業通過與醫院合作的形式獲得需要的醫療數據,例如在院內開展聯合研發項目,並支付相較出售交易形式更高的價格。這樣得到的數據基於院企雙方多年合作。在允許數據交易後,企業能更自主地使用數據。

藥企是醫療數據的常見買主,通過購入數據縮短藥物的研發周期。近幾年,人工智能(AI)行業也助推了數據交易熱潮,相關企業需要通過數據訓練醫療智能體,提升智能體對各種臨床信息的反應能力。一些保險公司會通過醫療數據計算發病規律,確定「百萬醫療險」產品的服務內容。

今年4月,山東第一醫科大學第一附屬醫院將包含「肝病臨床譜系與移植狀態」的數據集,以3萬元的價格交易給山東山科智心科技有限公司(以下簡稱「山科智心」),系山東首筆醫療數據交易。

在這筆交易成交前,山東第一醫科大學第一附屬醫院正高級工程師、山東省數據開放創新應用實驗室主任邢魯民早已感知到醫療數據的價值。邢魯民日常負責醫療領域的人工智能應用,他發現,相較於算力和算法,真正決定一個大模型能否應用於臨床的是數據質量。但在實際場景中,許多醫院的診療數據分散於不同系統,且普遍存在數據標準不統一、錯項缺項等問題。更重要的是,一些以日常對話形式記錄的臨床診斷,無法直接「餵」給AI訓練。

這種基於自然語言描述的數據被稱為非結構化數據。醫療數據中非結構化數據約佔70%。「我們日常查房會問患者『今天精神狀態怎麼樣』,對於醫生的臨床工作來說,這種非結構化文本信息就足夠了。但AI需要的是結構化數據,比如肝臟的長、寬、高都要量化成具體參數。」

朱同玉認為,當前多數AI問診模型的知識面都遠超醫生,但診斷的精準度卻常難以讓人滿意。「例如用戶描述肚子疼,AI可能會理解成很嚴重的病症。」而導致大模型產生「幻覺」的原因之一,便是缺乏高質量的醫療數據。他表示,醫院系統內99%的數據都無法直接出售,國內一些醫院即便做好了數據集,若不經過高質量治理,也無法形成交易。

邢魯民和團隊從2023年起就着手進行醫院醫療數據的加工工作,橫向加工一般包括常見病、慢性病等大體量數據,縱向則囊括一些專病、關鍵技術的數據集。

此次交易的「肝病臨床譜系與移植狀態」數據集屬於後者,該數據集涵蓋1000多例臨床病例,主要聚焦肝功能衰竭、肝病評估等跨度近10年的數據。邢魯民說,山科智心受到一個團隊的委託,進行肝病相關的模型構建和訓練,但憑藉手頭和公開的數據集難以達成訴求。於是,山科智心找到邢魯民團隊,希望通過購買治理後的肝病數據提升模型性能。

不過,在現實中,不少醫院因信息科人手、經費不足等,難以完成數據加工工作。「目前,不少醫院尚未搭建自己的數據中台,也就是數據加工的『中央廚房』,這種情況下,數據加工的成本也會隨之增高。」貴陽大數據交易所(以下簡稱「貴數所」)市場部行業總監周源說。

朱同玉認為,醫院從內部的信息系統(英文縮寫為HIS)中挖取數據本就是一件較困難的事。「基本上各家醫院的HIS都經過多版本疊代,甚至改換過不同系統。一旦改換不同系統,原來儲存的數據就可能大量丟失。」

與此同時,由於早年就醫未實行實名制,許多時間跨度長的醫療數據難以形成連貫性。接受採訪前幾天,朱同玉剛接診過一名做完腎移植手術22年的患者。「我想找患者做手術時的數據,但已找不到了,22年前他是用別的名字開的刀。」朱同玉說,就器官移植數據而言,長期存活器官的數據才真正有價值。

部分醫院會選擇與專業企業團隊合作,將數據加工外包給企業。西安佑君醫療信息有限公司(以下簡稱「佑君醫療」)承接過當地多家醫院的數據處理工作。佑君醫療隸屬於西安國際醫學投資股份有限公司,該公司副總裁王愛萍介紹,處理數據時,首先會根據科室進行分類,再依照國際醫療通用編碼對疾病進一步分類分級,同時整理核磁共振、病理切片等影像資料。

「告知交易售賣用途」

不少患者擔心:自己的醫療數據被出售,是否會產生私隱泄露風險?依據北京市衛生健康大數據與政策研究中心2025年12月發佈的《健康醫療數據匿名化技術規範(試行)》,健康醫療數據持有方對原始數據進行治理,要確保數據使用方無法識別特定自然人且不能復原。針對健康醫療數據流通利用的特定場景,採用保留必要字段(如性別)或對某些字段(如年齡、居住地)採取適度泛化等技術手段,在保留數據價值的同時有效控制數據流通安全風險。

「醫療數據交易的核心是價值釋放,而不是把患者的私隱當成產品,這是數據資產化過程中必須遵守的邊界。」邢魯民說。

一篇2025年發表於《衛生軟科學》的論文提到,醫療數據交易過程中,常面臨二次使用超出原始採集目的倫理風險。北京中醫藥大學醫藥衛生法學教授鄧勇對《中國新聞周刊》指出,一些醫院售賣診療數據前,並未徵求患者的專項知情同意。有院方認為,患者就診時已簽署通用知情同意書,且數據經過匿名化脫敏處理,無法定位到個人。實際上,患者就醫時簽署的常規知情同意書,內容通常僅限定醫療數據用於臨床診療、院內科研等場景,未提及數據可進行商業售賣、市場化交易等用途。患者簽署文件的初衷,也僅是配合完成就醫流程,並未默許自身健康信息流入市場。

北京紅颯律師事務所主任律師黃啟瑞表示,《中華人民共和國個人信息保護法》規定,醫院在收集、使用、提供患者個人信息前,應真實、準確、完整地向患者告知收集、使用個人信息的目的、使用方式等事項。如果醫院未履行告知義務,而出售包含患者信息的醫療數據,則違反法律規定。這種情況下,醫院應通過優化知情同意書條款或其他有效方式,將交易售賣用途如實告知患者。記者了解到,由於醫療數據交易屬於近幾年逐漸升溫的新興事物,國內尚未有徵詢患者同意的統一規範。

也有醫院擔心,由於數據天然具有可複製性,將原始數據交給代加工企業同樣會產生泄露、盜用的風險。可信數據空間被視為應對這種擔憂的有效解法,即通過對數據進行本地化治理,使相關企業只能帶走結果,原始數據仍留在可信數據空間內。

2024年7月,廣州市衛生健康委聯合廣州數字科技集團啟動廣州衛生健康行業可信數據空間建設。目前,已有40多家醫院入駐該空間,完成超千萬條醫療數據交易。

可信數據空間建成後,廣州醫科大學附屬婦女兒童醫院完成了首筆醫療數據交易。「當時有一家生產新生兒黃疸儀的器械公司希望對設備優化升級,我們與醫院合作,將新生兒黃疸數據用於評估設備,通過數據沙箱等技術,在可信數據空間內推出了黃疸儀設備測試評估報告。」李夢君說,相較於原本的「醫療數據不出院」,可信數據空間實現了數據「從醫院到空間」,符合「原始數據不出域,數據可用不可見」原則。

尚無統一定價標準

醫療數據交易流程中,醫院通常會將加工後的數據在數據交易所上架銷售。目前,佑君醫療已在貴數所登記70餘個高質量醫療數據集,聚焦肺癌、肝癌等高發癌種及多專科疑難重症,數據全部來源於西安頭部醫院的真實診療場景。

醫療數據上架交易前,貴數所會首先審核主體資質,其次審核數據來源,確保數據採集流程符合法律法規要求。

除了提供促成交易的平台外,貴數所還為合規數據產品出具數據要素登記憑證。「這一憑證如同房產證一般,為數據流通交易背書。在材料齊全的情況下,登記證書一般2—3個工作日即可發證。」周源說道。

目前,醫療數據交易尚未出台統一定價標準,交易價格主要通過協商敲定,一般會考慮採集成本、稀缺性、質量等因素。周源介紹,貴數所上線了全國首款數據產品交易價格計算器,依託評估模型,為數據產品定價提供參考區間。

邢魯民認為,當前醫療數據交易落地面臨的一大堵點是如何對個體醫療數據進行時間線串聯。「人的流動性很強,患者在不同醫院看病時,如何獲得同一個患者的所有醫療數據,是很現實的問題。」

「當前的醫療數據交易使買賣雙方受益,這些數據還應造福於患者。目前患者對於自己的數據『可用不可得』,建議每家醫院為患者提供類似於銀行流水打印服務的數據下載和打印接口,讓患者更加了解自己的原始健康數據。」朱同玉說。

責任編輯: 李華  來源:中國新聞周刊 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2026/0525/2387850.html