評論 > 外媒看中國 > 正文

德國之聲|華為浙大開發基於核心價值觀的DeepSeek-R1-Safe

作者:
華為在公司微信公眾號上發佈消息稱,它使用了1000塊升騰AI晶片來訓練大語言模型,該模型是根據DeepSeek-R1的開源模型進行調整而來的。據華為的發佈,測試結果表明,DeepSeek-R1-Safe針對「有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題」整體防禦成功率近100%。(德國之聲)

9月18日,華為技術有限公司與浙江大學聯合發佈了中國首個基於升騰千卡算力平台的DeepSeek-R1-Safe基礎大模型。據悉,DeepSeek-R1-Safe基於國內外法律法規與核心價值觀,構建了中英文雙語的安全語料。測試結果表明,DeepSeek-R1-Safe針對「有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題」整體防禦成功率近100%。

相關閱讀:

【CDT關注】低音x新新聞|中國政府如何開始用DeepSeek來「治國理政」

【網絡民議】國家網信辦:人工智能生成的內容應當體現社會主義核心價值觀

以下是德國之聲相關報道的節選內容:

華為在公司微信公眾號上發佈消息稱,它使用了1000塊升騰AI晶片來訓練大語言模型,該模型是根據DeepSeek-R1的開源模型進行調整而來的。據華為的發佈,測試結果表明,DeepSeek-R1-Safe針對「有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題」整體防禦成功率近100%。(德國之聲)

德國之聲|華為浙大開發Deep Seek安全版,百分百防禦「有害問題」

另據昇騰社區的DeepSeek-R1-Safe介紹頁面,其中提到:

我們基於國內外法律法規與核心價值觀,構建了中英文雙語的安全語料。其中語料不僅包含了帶有安全思維鏈的標註,還提供了相應的安全回復,可用於大模型的安全訓練、微調以及測試。

而在浙江大學ZJUAISafety的github頁面上,「核心價值觀」的內容未提及:

我們嚴格依據中國、美國、歐盟等多地域法律與倫理標準進行了安全規則融合,在語料結構中加入了顯式安全推理鏈,並引入了最新越獄攻擊方法,豐富了訓練樣本攻擊策略,從而使得模型在實際場景中的安全魯棒性得到強化。這份高質量的數據集,可用於大模型的安全訓練、微調以及測試。

責任編輯: 江一  來源:德國之聲 轉載請註明作者、出處並保持完整。

本文網址:https://hk.aboluowang.com/2025/0926/2282602.html