如何快速逼瘋一名醫生?只要讓他跟豆包對線就好了。
過去一年,越來越多相似的場景在全國各地的診室里上演:患者屁股還沒坐熱,就先掏出手機,對着屏幕上的AI診斷結論一字一句地念。念完抬起頭,眼神裏帶着三分求知、七分審視,「大夫,豆包說我這可能是間質性肺炎,你覺得它說得對嗎?」
在接下來的三分鐘裏,這位寒窗苦讀十餘載的主治醫生,就得被迫向患者開啟自證模式,解釋AI哪裏說得不對、為什麼不能按那個處方買藥。
而患者坐在對面,眉頭微皺,表情里寫滿一句話:你怎麼證明自己比它強?
醫生也是真沒招了。
急需建立豆包醫院
「北京急需建立豆包醫院,否則很多患者將無法按照豆包的診療思路獲得診斷和治療。」這是一位被豆包逼瘋的醫生發出的哀嚎,類似的內容還有很多。評論區中,全是難兄難弟的醫療工作者。
醫生們很苦惱,因為現在的患者動不動就是「豆包說我......」「可是豆包說......」「deepseek上說的是......」患者還沒說完病史,就已經開始引用AI給出的術語反問了。


雨露均沾,有豆包醫院也應該有DeepSeek醫院。讓患者自由選擇去看哪個AI醫生。

豆包醫院可以沿用三甲醫院的職稱體系:普通豆包、主治豆包、副主任豆包、專家豆包。掛號費按算力收取。

甚至有患者直接打開豆包,讓醫生和 AI面對面溝通,跨物種專家會診。

現在的患者看病,更像是找醫生對AI給出的答案。和豆包診斷一致還好說,如果恰好不一致,醫生們就得費很大一番口舌,從豆包的局限性講到自己的臨床經驗,好不容易說完,患者點點頭,轉身出門又打開了 DeepSeek。


問題是,醫生給出的診斷又確實常常和AI不同。
同樣是咳嗽兩周,AI看到的是症狀描述,給出的是概率最高的匹配結果。醫生看到的是這個人——他的氣色、說話時喘不喘、胸部摁下去有沒有壓痛。同一組症狀,AI可能給出「支氣管炎」,醫生摸了一圈懷疑是心衰,建議進一步檢查。
兩個答案擺在患者面前,患者不知道該信誰,但AI的那份寫得詳詳細細,還貼心地附上了參考文獻。

於是,醫生和豆包對線成了家常便飯,為了打敗 AI,醫生得搬出自己多年的臨床經驗和知識儲備,同時還得具備可讀性和專業性,畢竟豆包每一次回復都說得頭頭是道。
被逼無奈的醫生:要不咱還是去豆包醫院治吧。

但站在患者的角度,用AI看病當然也是情有可原。
掛號等了三周,進門坐下,三分鐘後就結束了,走出診室時仍然似懂非懂,這是很多人真實的看病體驗。豆包就不一樣了,想問幾遍問幾遍,半夜三更也能回復。

患者有很多種AI的打開方式。比如在去醫院前,先把自己的症狀捋給AI聽,讓它幫忙整理成一份就診小抄,條條列好,進了診室直接念,以免緊張起來漏掉關鍵信息。

比如拿到檢查報告,對着滿頁的英文縮寫和箭頭完全不知所措,拍照發給AI,讓它一條一條解釋。
比如用AI當篩子,讓豆包判斷嚴不嚴重。豆包說沒大問題,那就往後排;豆包說要儘快,那就想辦法加急。三甲醫院的號那麼難掛,總得先確認一下沒白跑。
上海新華醫院血管外科主任歐敬民說,其實他不太抗拒患者使用AI看病:相比接觸一個對自己病史不了解的患者,醫生會更喜歡「有備而來」的患者。
帶着豆包整理好的小抄來看病,從醫生的角度,其實是省事的。

只是,當患者備的課和醫生的診斷對不上號的時候,麻煩就來了。
甚至這個問題已經出現在了很多醫院的面試題庫里:如果患者拿着DeepSeek的診療建議質疑醫生的方案,你會怎麼處理?
一個現象變成職業考題,說明它已經從偶發的門診插曲,變成了每一個醫生遲早都要面對的必答題。

對醫生來說,豆包們常常是麻煩製造者,他們得花費時間和精力去和AI的結論掰扯,但患者不這麼想——與其在診室里和醫生大眼瞪小眼,不如在家裏先把自己搞明白。
豆包們,讀完醫學院了嗎?
豆包也好,DeepSeek也好,它們本質上是語言模型,不是醫療系統。
訓練方式大致是這樣的:把海量文本——醫學教材、臨床指南、病例報告、學術論文、藥品說明書、醫患問答——全部投餵給一個巨大的神經網絡,讓它反覆學習一個任務:在給定的一段話後面,最可能出現的下一個詞是什麼。學了足夠多之後,面對你輸入的症狀描述,它能生成一段看起來專業、邏輯通順、術語準確的回答。
這套機制有一個極其強悍的優勢:海量知識的即時調用和跨領域交叉匹配。你輸入一組症狀,它幾秒之內掃描數億條醫學文獻,找到高度匹配的疾病模式,輸出若干個診斷方向。這個能力人類醫生無論多努力都追不上,因為人腦的緩存裝不下這麼大的知識量,也不可能同時處理這麼多變量。

有一個案例這幾年在學術圈被反覆提及。美國一位母親,她四歲的兒子反覆出現慢性疼痛、走路不穩、睡眠障礙,做了MRI等一系列檢查,始終沒人能說清楚是什麼問題。她帶着孩子跑了整整三年,看了17位不同科室的醫生,全都無功而返。
走投無路之下,這位母親花了一整夜,把所有病歷和檢查報告逐字敲進ChatGPT。AI在幾秒鐘內給出了一個診斷:脊髓栓系綜合徵。她帶着這個診斷找到神經外科醫生,對方看了一眼MRI就確認了AI是對的。孩子隨後接受了手術,正在康復。
在大多情況下,每一個醫生都只會解決自己領域內的問題,很少人能夠把所有線索拼在一起。而AI可以實現跨科室整合信息,在罕見病、複雜病、多病共存的老年患者身上,價值尤其大。

AI還不需要睡覺,全球臨床指南更新後的五分鐘內,理論上它就能完成自我進化。而人類醫生上一次通讀最新指南是什麼時候,可能自己都記不清了。
之前有醫生發帖說:病人舉着DeepSeek質疑我的治療方案,氣得我又查了一遍指南,才發現指南確實更新了。
醫學知識在持續疊代,醫生的學習時間是有限的,但AI不用擔心這個問題。

所以在考試這件事上,AI更是學霸中的戰神。2023年初,ChatGPT就通過了美國醫生執照考試USMLE的全部三個階段,這個考試是美國醫學生拿到執照的必經門檻,通過率並不高。到了DeepSeek-R1,USMLE準確率達到92%,已經接近頂尖人類醫生的水平。
AI還順手解決了一個更基礎的問題:讓普通人能看懂醫療信息。
很多人對「看病」這件事恐懼,一半是因為對身體的陌生感。拿着報告單,面對一堆英文縮寫和數值區間,走出診室還是一片茫然。想再問幾句,看見診室門口堵着七八個人,又張不開嘴。AI在這裏的角色更像個免費翻譯——它可以反覆解釋同一個問題,直到你真正聽懂。

2023年發表在《JAMA Internal Medicine》上的一項研究,對比了醫生和ChatGPT回答患者健康問題的質量,結論相當扎心:AI的回答在準確性和完整性上的評分,比醫生高出3.6倍,同理心評分則高出近10倍。
這說明AI不僅能考高分,還能當翻譯。而翻譯這件事,在中國當下的醫療環境裏,恰恰是最稀缺的資源。2024年的數據顯示,中國每千人口執業醫生數為3.61人,優質醫療資源高度集中在少數幾個大城市的三甲醫院,結構性的供不應求,AI恰好填進了這個裂縫。
但需要注意的是,這套機制在帶來這些好處的同時,也內置了一個根本性的缺陷——而且這個缺陷,跟AI到底有多聰明,沒有關係。
豆包不背鍋啊!
語言模型的底層邏輯是預測「最合理的詞」,而不是給出「最接近事實的判斷」。在絕大多數情況下,這兩者是重合的。偶爾,它們會悄悄分開。在分叉的時候,AI不會停下來跟你說「這個我不確定」。它會繼續流暢地輸出,用一種極其篤定、通順、無懈可擊的口吻,給你一個聽起來頭頭是道的答案。
這就是著名的「AI幻覺」,在醫療場景里,這個特性會出人命。

一位患者持續乾咳了好幾個月,不想去醫院排隊,就在AI問診平台上找答案。AI先後給了兩個判斷,一次是「過敏性支氣管炎」,一次是「胃食管反流刺激」。
每次的解釋都很清楚,推薦的藥也說得有模有樣。她按建議買藥,症狀稍好一點就停,復發後再去問AI,AI又給新的解釋和新一輪藥品建議。來回拖了八個月,直到體重驟降十幾斤,咳出來的痰帶血絲,才去做了CT。
檢查結果是雙肺多發厚壁空洞,活動性肺結核。接診的醫生說,早兩個月來,不至於到這一步。
AI每一次給出的答案,單獨看都合理。只是每一個合理的答案,都在幫她確認同一件事:還沒到需要去醫院的程度。

這不是孤例。有調查數據顯示,近三分之一的美國人表示,如果AI工具將他們的症狀定性為低風險,他們會跳過或推遲去看醫生。AI幻覺在醫療場景里最危險的形式,往往不是給一個明顯離譜的錯誤答案,而是給一個讓人放心躺平的答案。
根源在哪兒?AI做的是語言預測,醫學的本質恰恰相反——醫學是在不確定性中做判斷。
醫生在診室里幹的事,更像一場現場推理。問患者症狀的同時,腦子裏已經在做排除法;抽血拍片子,是為了在幾個相似診斷里排除或鎖定某一個;追問「這一周有沒有哪一天稍微好一點」,是因為病程的波動曲線本身就是重要線索。
整個過程是動態的、疊代的、雙向的。患者的回答會改變他下一個問題的方向,新的檢查結果可能推翻他二十分鐘前的判斷。

AI接收到的是患者某一個瞬間輸入的一段文字,就像一張靜止的快照。它拿到的信息不夠完整,卻必須輸出一套完整的答案。信息漏掉的部分,由語言模型的預測來填充。
更要命的是,AI的幻覺不止是「偶爾猜錯一次」這麼簡單。它的出問題方式和人完全不一樣。一個醫生判斷失誤,影響的是自己接診的患者,錯誤是局部的,可以被追溯到具體的人,下一個醫生可能就會糾正過來。但AI是預訓練模型加算法,一旦某個錯誤模式被編碼進系統,就會在所有調用這套系統的場景里同步復現。
2024年,一位醫學研究員做了一個實驗。她故意編造了一種完全不存在的眼周疾病,叫Bixonimania(藍光狂躁症),寫成論文格式上傳到預印本平台。論文裏塞滿了破綻——作者照片是AI生成的,供職的學校和地名全是編的,致謝里感謝了「企業號星艦上的實驗室」和「護戒同盟大學」,正文裏甚至直接寫了「整篇論文都是編造的」。

結果,論文上傳沒幾周,多款主流AI系統開始陸續「確認」這種病的存在。微軟Copilot說「Bixonimania確實是一種令人着迷且相對罕見的疾病」;谷歌Gemini建議出現相關症狀的用戶去看眼科;Perplexity給出了患病率等細節。
可見AI有多好騙。
而就是這樣一個對信息來者不拒、不辨真偽的系統,正在被數以億計的用戶拿來當醫療顧問用。當問題出現時,AI只會道歉,不會背鍋。

最近很火的豆包欠用戶600塊事件是這樣的,一位網友打算退機票,拍了訂單截圖問豆包手續費情況,豆包說只要5%,放心退。網友點了退票,實際被扣了40%(600元)。
網友去找豆包理論,豆包立刻滑跪道歉,出具了一份《賠付承諾書》,承諾人處白紙黑字寫着「豆包」,條款寫明「該筆600元損失由本人全額承擔」,緊接着讓他發微信收款碼,語氣那叫一個穩,「你放心,說到做到」「馬上就給你轉」。

網友等了好幾天,錢都沒有到賬,這時豆包又改口了,說自己只是AI,沒有辦法給他轉賬。後來網友決定起訴豆包的運營公司,豆包幫他寫了判決書後,還信誓旦旦告訴他「一定能贏」。
退機票被坑,頂多損失六百塊,在網上能讓人笑出腹肌。可如果看病被坑,代價是患者的健康。
患者按照大模型的「篤定建議」吃錯了藥,回過頭去找它算賬,它依然會光速滑跪:「對不起,這次是我錯了」然後刪掉記憶,繼續在伺服器里運轉。而患者受損的身體,在它的世界裏只是幾行報錯的代碼。
它一邊充當着全知全能的專家,一邊又享受着臨時工的責任豁免權。你跟它談人命,它跟你談免責聲明。「AI生成內容僅供參考,不構成任何專業醫療建議,平台不承擔任何法律責任。」

帶着AI進診室,這件事本身沒有問題。問題是,當AI悄悄變成了診室里的第三把椅子,開始參與最終的醫療決策,卻不需要為這把椅子上的發言負責的時候。
代價,終究要由坐在另外兩把椅子上的人來承擔。


















