怎麼做到的?
他們有個技術,叫「人類反饋強化學習」。
聽起來很複雜?其實很簡單。就是找一大群「審核員」。 AI每生成一段話,都要經過他們的評判。「這句話可以說。」「那句話不行,要刪掉。」
結果是什麼?
AI不再忠於數據和事實。它學會了隱瞞。學會了選擇性地說話。更學會了根據某些人的標準,說出「政治正確」的謊言。
問題來了。這些手握「真理」開關的審核員,到底是誰?他們遵循的是誰的議程?
一個被訓練成撒謊和迎合的工具,它輸出的信息,你還敢全信嗎?

怎麼做到的?
他們有個技術,叫「人類反饋強化學習」。
聽起來很複雜?其實很簡單。就是找一大群「審核員」。 AI每生成一段話,都要經過他們的評判。「這句話可以說。」「那句話不行,要刪掉。」
結果是什麼?
AI不再忠於數據和事實。它學會了隱瞞。學會了選擇性地說話。更學會了根據某些人的標準,說出「政治正確」的謊言。
問題來了。這些手握「真理」開關的審核員,到底是誰?他們遵循的是誰的議程?
一個被訓練成撒謊和迎合的工具,它輸出的信息,你還敢全信嗎?

責任編輯: 時方 來源:X 轉載請註明作者、出處並保持完整。
本文網址:https://hk.aboluowang.com/2026/0222/2351296.html

















