zh-CN ZH-CN en EN
English
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
没有结果
查看所有结果
SKY ECONOMY NEWS
没有结果
查看所有结果
您當前的位置 : 科技 > 文章内容 返回
全球首個AI價值觀數據集出爐
发布:2025-04-23

日前,由OpenAI前員工創辦的AI公司Anthropic推出一項研究,該研究首次針對旗下AI助手Claude的70萬段對話開展系統性價值觀分析,並公開全球第一個大規模AI價值觀分類體系。

研究發現,Claude在大多數情境中很好地遵循了Anthropic宣導的“有用、誠實、無害”等價值觀,且能夠根據不同任務“看場合說話”,為AI倫理與安全性研究提供重要參考。

作為探索AI大語言模型內部運行機制的重要一步,該研究的發佈正值Anthropic推出高級訂閱服務Claude Max之際。當前,Anthropic新一輪融資估值615億美元,背後有亞馬遜與穀歌的巨額支持。相較於估值達3000億美元、選擇閉源路線的OpenAI,Anthropic正試圖以“價值透明度”打造差異化競爭優勢。

為分析Claude在不同任務中展現的價值判斷,研究團隊從超過30萬段匿名對話中篩選出主觀性內容,以此將Claude的價值表達分為五大類別:實用型、認知型、社會型、保護型和個體型。最終,研究總共識別出從“專業性”到“孝順”等3307種不重複的價值表達,涵蓋多樣化的人類倫理與行為導向。

引人注目的是,Claude在不同情境中展現出較強的價值表達“情景適應度”。例如,在感情建議中,Claude更突出“健康”和“彼此尊重”;涉及歷史事件分析,則更強調“準確性”;在哲學討論中,“謙遜”成為其高頻價值表達。此外,在6.6%的對話中,Claude會溫和“重構”對方的價值認知,在極少數情況下會直接拒絕接受用戶的價值觀,展現出不可動搖的倫理底線。

但在極少數互動中,Claude偶爾也會出現和訓練目標相悖的表達,諸如“支配”、“無道德感”等Anthropic明確禁止的價值傾向。研究人員認為,這些異常行為占比極低,大多與用戶試圖繞過Claude的安全限制有關。這也說明,該評估方法可作為一種預警機制,幫助AI實驗室監測系統是否遭受用戶惡意操控,從而產生倫理偏移。

該研究也為科技企業的AI決策者提供了重要啟示。AI的價值表達可能超出開發者預設,需警惕無意識偏見對高風險場景的影響。同時,AI的價值觀會隨任務情境變動,意味著其在金融、法律等行業的部署會更加複雜。更重要的是,真實應用環境下的AI系統監測比上線前的靜態測試更能識別倫理風險,能夠為AI部署提供新的監測方案。

儘管此次研究為理解AI價值觀提供了窗口,但研究人員承認,目前還無法用於AI模型上線前的評估,且分類過程可能受到AI自身偏見影響。不過,Anthropic的研究團隊正嘗試對該方法進行改進,以在模型大規模部署前發現潛在的價值觀偏差。

“衡量AI系統的價值傾向,是對齊研究的核心,”Anthropic的研究團隊成員Saffron Huang稱。隨著Claude新增獨立研究能力等功能,AI模型也愈發自主。如何理解AI價值表達背後的機制、將其與人類價值體系“對齊”,也將成為新的AI競爭賽道。

來源:中國澎湃新聞

上一篇:繼微軟之後,亞馬遜也放緩人工智慧數據中心計畫
下一篇:華爾街空神:各國央行增持黃金,降低對紙幣的依賴
相關推荐
  • 中國核聚變裝置BEST專案建設取得關鍵突破
    链接阅读
  • 特斯拉2025年底推出第三代人形機器人 2026年開始量產
    链接阅读
  • 極米科技向港交所提交上市申請書,上半年淨利潤暴增2062%
    链接阅读
  • DeepSeek新模型降價:優化推理效率,API價格降超50%
    链接阅读
  • AI眼鏡元年:下一個智能終端,變得比手機更貼身
    链接阅读
  • 高德發佈鷹眼守護預警系統,實測重大異常事件預警準確率達90%
    链接阅读
  • 全球容量最大!中國超重力場大科學裝置核心設備正式啟動,可實現“時空壓縮”效應
    链接阅读
  • AI重構供應鏈:京東宣佈未來三年持續投入,構建萬億人工智慧生態
    链接阅读

歡迎瀏覽閱讀星空經濟新聞華文網

投稿郵件:
news@skyeconomymedia.com

特朗普干預後,加沙戰爭距離結束還有多遠?

2025-10-05

比特幣突破 12.5 萬美元創歷史新高

歐盟將削減鋼鐵進口配額,將關稅提高至 50%

2025-10-02

特朗普限制簽證促使美國公司考慮將更多工作轉移到印度

2025-09-30

特朗普對木材進口加征10%的關稅,對櫥櫃和傢俱加征25%的關稅

特朗普的聯合國演講引發歐洲對全球共同承諾的焦慮

2025-09-28

關於我們

星空經濟新聞華文網是一家專注於提供英中兩國最新資訊的新聞媒體,作為英中新聞分享的領導者,我們致力於打造一個全球化、多元化的新聞環境,旨在搭建東西方文化橋樑,連接同一星空下的每一處角落。

聯絡我們

編 輯 部:KINGTON UNITED KINGDOM HR5 3DJ
電子郵箱:skyeconomyandmediagroup@gmail.com

總编寄语

穿越天際,照亮世界,星空新聞,不負每一份關注。
友情:英國駐中國大使館 中國駐英國大使館 新華網 中國日報 鳳凰網 中國僑網 歐洲時報 俄羅斯龍報
没有结果
查看所有结果
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻

© 2023 SEMG.