患者帶着豆包進診室，醫生們被逼瘋了＊阿波羅新聞網

如何快速逼瘋一名醫生？只要讓他跟豆包對線就好了。

過去一年，越來越多相似的場景在全國各地的診室里上演：患者屁股還沒坐熱，就先掏出手機，對着屏幕上的AI診斷結論一字一句地念。念完抬起頭，眼神裏帶着三分求知、七分審視，「大夫，豆包說我這可能是間質性肺炎，你覺得它說得對嗎？」

在接下來的三分鐘裏，這位寒窗苦讀十餘載的主治醫生，就得被迫向患者開啟自證模式，解釋AI哪裏說得不對、為什麼不能按那個處方買藥。

而患者坐在對面，眉頭微皺，表情里寫滿一句話：你怎麼證明自己比它強？

醫生也是真沒招了。

急需建立豆包醫院

「北京急需建立豆包醫院，否則很多患者將無法按照豆包的診療思路獲得診斷和治療。」這是一位被豆包逼瘋的醫生發出的哀嚎，類似的內容還有很多。評論區中，全是難兄難弟的醫療工作者。

醫生們很苦惱，因為現在的患者動不動就是「豆包說我......」「可是豆包說......」「deepseek上說的是......」患者還沒說完病史，就已經開始引用AI給出的術語反問了。

雨露均沾，有豆包醫院也應該有DeepSeek醫院。讓患者自由選擇去看哪個AI醫生。

豆包醫院可以沿用三甲醫院的職稱體系：普通豆包、主治豆包、副主任豆包、專家豆包。掛號費按算力收取。

甚至有患者直接打開豆包，讓醫生和 AI面對面溝通，跨物種專家會診。

現在的患者看病，更像是找醫生對AI給出的答案。和豆包診斷一致還好說，如果恰好不一致，醫生們就得費很大一番口舌，從豆包的局限性講到自己的臨床經驗，好不容易說完，患者點點頭，轉身出門又打開了 DeepSeek。

問題是，醫生給出的診斷又確實常常和AI不同。

同樣是咳嗽兩周，AI看到的是症狀描述，給出的是概率最高的匹配結果。醫生看到的是這個人——他的氣色、說話時喘不喘、胸部摁下去有沒有壓痛。同一組症狀，AI可能給出「支氣管炎」，醫生摸了一圈懷疑是心衰，建議進一步檢查。

兩個答案擺在患者面前，患者不知道該信誰，但AI的那份寫得詳詳細細，還貼心地附上了參考文獻。

於是，醫生和豆包對線成了家常便飯，為了打敗 AI，醫生得搬出自己多年的臨床經驗和知識儲備，同時還得具備可讀性和專業性，畢竟豆包每一次回復都說得頭頭是道。

被逼無奈的醫生：要不咱還是去豆包醫院治吧。

但站在患者的角度，用AI看病當然也是情有可原。

掛號等了三周，進門坐下，三分鐘後就結束了，走出診室時仍然似懂非懂，這是很多人真實的看病體驗。豆包就不一樣了，想問幾遍問幾遍，半夜三更也能回復。

患者有很多種AI的打開方式。比如在去醫院前，先把自己的症狀捋給AI聽，讓它幫忙整理成一份就診小抄，條條列好，進了診室直接念，以免緊張起來漏掉關鍵信息。

比如拿到檢查報告，對着滿頁的英文縮寫和箭頭完全不知所措，拍照發給AI，讓它一條一條解釋。

比如用AI當篩子，讓豆包判斷嚴不嚴重。豆包說沒大問題，那就往後排；豆包說要儘快，那就想辦法加急。三甲醫院的號那麼難掛，總得先確認一下沒白跑。

上海新華醫院血管外科主任歐敬民說，其實他不太抗拒患者使用AI看病：相比接觸一個對自己病史不了解的患者，醫生會更喜歡「有備而來」的患者。

帶着豆包整理好的小抄來看病，從醫生的角度，其實是省事的。

只是，當患者備的課和醫生的診斷對不上號的時候，麻煩就來了。

甚至這個問題已經出現在了很多醫院的面試題庫里：如果患者拿着DeepSeek的診療建議質疑醫生的方案，你會怎麼處理？

一個現象變成職業考題，說明它已經從偶發的門診插曲，變成了每一個醫生遲早都要面對的必答題。

對醫生來說，豆包們常常是麻煩製造者，他們得花費時間和精力去和AI的結論掰扯，但患者不這麼想——與其在診室里和醫生大眼瞪小眼，不如在家裏先把自己搞明白。

豆包們，讀完醫學院了嗎？

豆包也好，DeepSeek也好，它們本質上是語言模型，不是醫療系統。

訓練方式大致是這樣的：把海量文本——醫學教材、臨床指南、病例報告、學術論文、藥品說明書、醫患問答——全部投餵給一個巨大的神經網絡，讓它反覆學習一個任務：在給定的一段話後面，最可能出現的下一個詞是什麼。學了足夠多之後，面對你輸入的症狀描述，它能生成一段看起來專業、邏輯通順、術語準確的回答。

這套機制有一個極其強悍的優勢：海量知識的即時調用和跨領域交叉匹配。你輸入一組症狀，它幾秒之內掃描數億條醫學文獻，找到高度匹配的疾病模式，輸出若干個診斷方向。這個能力人類醫生無論多努力都追不上，因為人腦的緩存裝不下這麼大的知識量，也不可能同時處理這麼多變量。

有一個案例這幾年在學術圈被反覆提及。美國一位母親，她四歲的兒子反覆出現慢性疼痛、走路不穩、睡眠障礙，做了MRI等一系列檢查，始終沒人能說清楚是什麼問題。她帶着孩子跑了整整三年，看了17位不同科室的醫生，全都無功而返。

走投無路之下，這位母親花了一整夜，把所有病歷和檢查報告逐字敲進ChatGPT。AI在幾秒鐘內給出了一個診斷：脊髓栓系綜合徵。她帶着這個診斷找到神經外科醫生，對方看了一眼MRI就確認了AI是對的。孩子隨後接受了手術，正在康復。

在大多情況下，每一個醫生都只會解決自己領域內的問題，很少人能夠把所有線索拼在一起。而AI可以實現跨科室整合信息，在罕見病、複雜病、多病共存的老年患者身上，價值尤其大。

AI還不需要睡覺，全球臨床指南更新後的五分鐘內，理論上它就能完成自我進化。而人類醫生上一次通讀最新指南是什麼時候，可能自己都記不清了。

之前有醫生發帖說：病人舉着DeepSeek質疑我的治療方案，氣得我又查了一遍指南，才發現指南確實更新了。

醫學知識在持續疊代，醫生的學習時間是有限的，但AI不用擔心這個問題。

所以在考試這件事上，AI更是學霸中的戰神。2023年初，ChatGPT就通過了美國醫生執照考試USMLE的全部三個階段，這個考試是美國醫學生拿到執照的必經門檻，通過率並不高。到了DeepSeek-R1，USMLE準確率達到92%，已經接近頂尖人類醫生的水平。

AI還順手解決了一個更基礎的問題：讓普通人能看懂醫療信息。

很多人對「看病」這件事恐懼，一半是因為對身體的陌生感。拿着報告單，面對一堆英文縮寫和數值區間，走出診室還是一片茫然。想再問幾句，看見診室門口堵着七八個人，又張不開嘴。AI在這裏的角色更像個免費翻譯——它可以反覆解釋同一個問題，直到你真正聽懂。

2023年發表在《JAMA Internal Medicine》上的一項研究，對比了醫生和ChatGPT回答患者健康問題的質量，結論相當扎心：AI的回答在準確性和完整性上的評分，比醫生高出3.6倍，同理心評分則高出近10倍。

這說明AI不僅能考高分，還能當翻譯。而翻譯這件事，在中國當下的醫療環境裏，恰恰是最稀缺的資源。2024年的數據顯示，中國每千人口執業醫生數為3.61人，優質醫療資源高度集中在少數幾個大城市的三甲醫院，結構性的供不應求，AI恰好填進了這個裂縫。

但需要注意的是，這套機制在帶來這些好處的同時，也內置了一個根本性的缺陷——而且這個缺陷，跟AI到底有多聰明，沒有關係。

豆包不背鍋啊！

語言模型的底層邏輯是預測「最合理的詞」，而不是給出「最接近事實的判斷」。在絕大多數情況下，這兩者是重合的。偶爾，它們會悄悄分開。在分叉的時候，AI不會停下來跟你說「這個我不確定」。它會繼續流暢地輸出，用一種極其篤定、通順、無懈可擊的口吻，給你一個聽起來頭頭是道的答案。

這就是著名的「AI幻覺」，在醫療場景里，這個特性會出人命。

一位患者持續乾咳了好幾個月，不想去醫院排隊，就在AI問診平台上找答案。AI先後給了兩個判斷，一次是「過敏性支氣管炎」，一次是「胃食管反流刺激」。

每次的解釋都很清楚，推薦的藥也說得有模有樣。她按建議買藥，症狀稍好一點就停，復發後再去問AI，AI又給新的解釋和新一輪藥品建議。來回拖了八個月，直到體重驟降十幾斤，咳出來的痰帶血絲，才去做了CT。

檢查結果是雙肺多發厚壁空洞，活動性肺結核。接診的醫生說，早兩個月來，不至於到這一步。

AI每一次給出的答案，單獨看都合理。只是每一個合理的答案，都在幫她確認同一件事：還沒到需要去醫院的程度。

這不是孤例。有調查數據顯示，近三分之一的美國人表示，如果AI工具將他們的症狀定性為低風險，他們會跳過或推遲去看醫生。AI幻覺在醫療場景里最危險的形式，往往不是給一個明顯離譜的錯誤答案，而是給一個讓人放心躺平的答案。

根源在哪兒？AI做的是語言預測，醫學的本質恰恰相反——醫學是在不確定性中做判斷。

醫生在診室里幹的事，更像一場現場推理。問患者症狀的同時，腦子裏已經在做排除法；抽血拍片子，是為了在幾個相似診斷里排除或鎖定某一個；追問「這一周有沒有哪一天稍微好一點」，是因為病程的波動曲線本身就是重要線索。

整個過程是動態的、疊代的、雙向的。患者的回答會改變他下一個問題的方向，新的檢查結果可能推翻他二十分鐘前的判斷。

AI接收到的是患者某一個瞬間輸入的一段文字，就像一張靜止的快照。它拿到的信息不夠完整，卻必須輸出一套完整的答案。信息漏掉的部分，由語言模型的預測來填充。

更要命的是，AI的幻覺不止是「偶爾猜錯一次」這麼簡單。它的出問題方式和人完全不一樣。一個醫生判斷失誤，影響的是自己接診的患者，錯誤是局部的，可以被追溯到具體的人，下一個醫生可能就會糾正過來。但AI是預訓練模型加算法，一旦某個錯誤模式被編碼進系統，就會在所有調用這套系統的場景里同步復現。

2024年，一位醫學研究員做了一個實驗。她故意編造了一種完全不存在的眼周疾病，叫Bixonimania（藍光狂躁症），寫成論文格式上傳到預印本平台。論文裏塞滿了破綻——作者照片是AI生成的，供職的學校和地名全是編的，致謝里感謝了「企業號星艦上的實驗室」和「護戒同盟大學」，正文裏甚至直接寫了「整篇論文都是編造的」。

結果，論文上傳沒幾周，多款主流AI系統開始陸續「確認」這種病的存在。微軟Copilot說「Bixonimania確實是一種令人着迷且相對罕見的疾病」；谷歌Gemini建議出現相關症狀的用戶去看眼科；Perplexity給出了患病率等細節。

可見AI有多好騙。

而就是這樣一個對信息來者不拒、不辨真偽的系統，正在被數以億計的用戶拿來當醫療顧問用。當問題出現時，AI只會道歉，不會背鍋。

最近很火的豆包欠用戶600塊事件是這樣的，一位網友打算退機票，拍了訂單截圖問豆包手續費情況，豆包說只要5%，放心退。網友點了退票，實際被扣了40%（600元）。

網友去找豆包理論，豆包立刻滑跪道歉，出具了一份《賠付承諾書》，承諾人處白紙黑字寫着「豆包」，條款寫明「該筆600元損失由本人全額承擔」，緊接着讓他發微信收款碼，語氣那叫一個穩，「你放心，說到做到」「馬上就給你轉」。

網友等了好幾天，錢都沒有到賬，這時豆包又改口了，說自己只是AI，沒有辦法給他轉賬。後來網友決定起訴豆包的運營公司，豆包幫他寫了判決書後，還信誓旦旦告訴他「一定能贏」。

退機票被坑，頂多損失六百塊，在網上能讓人笑出腹肌。可如果看病被坑，代價是患者的健康。

患者按照大模型的「篤定建議」吃錯了藥，回過頭去找它算賬，它依然會光速滑跪：「對不起，這次是我錯了」然後刪掉記憶，繼續在伺服器里運轉。而患者受損的身體，在它的世界裏只是幾行報錯的代碼。

它一邊充當着全知全能的專家，一邊又享受着臨時工的責任豁免權。你跟它談人命，它跟你談免責聲明。「AI生成內容僅供參考，不構成任何專業醫療建議，平台不承擔任何法律責任。」

帶着AI進診室，這件事本身沒有問題。問題是，當AI悄悄變成了診室里的第三把椅子，開始參與最終的醫療決策，卻不需要為這把椅子上的發言負責的時候。

代價，終究要由坐在另外兩把椅子上的人來承擔。

責任編輯：李華　來源：酷玩實驗室轉載請註明作者、出處並保持完整。

患者帶着豆包進診室，醫生們被逼瘋了

相關新聞