太平洋新聞網
  PACIFIC DAILY NEWS 2026, 5. 7 AM 06:34 Thursday  臺灣‧台北
首頁新聞版面焦點新聞北台新聞綜合新聞府院新聞綜合外電
 
您現在位於 - 綜合外電

  2026, 4. 16  Edit this Page


國際最新研究AI沾染人類缺點
在訓練數據中清除原始特徵後 這些如同人類“夾帶私貨”的特徵仍可能持續存在


【記者林璟坤/外電報導】國際學術期刊《自然》最新發表一篇人工智能研究論文稱,隨著人工智能(AI)大語言模型(LLM)越來越廣泛的應用,其沾染人類缺點的一面也更多顯現出來。

一項研究顯示,人工智能大語言模型可能會將某些不需要的特徵傳授給其他算法,即使在訓練數據中清除原始特徵後,這些如同人類“夾帶私貨”的特徵仍可能持續存在。

在此次一個研究案例中,一個大語言模型似乎通過數據中的隱含信號,將對貓頭鷹的偏好傳遞給了其他模型,這項研究結果表明,在開發大語言模型時,需要進行更徹底的安全檢查。

該論文介紹,大語言模型可通過一種名為“蒸餾”的過程生成用於訓練其他模型的數據集,該過程旨在讓“學生”模型學會模仿“老師”模型的輸出,雖然此過程可用於生成成本更低的大語言模型,但目前尚不清楚“老師”模型的哪些特性會被傳遞給“學生”模型。

研究人員發現,這種潛意識學習主要發生在老師和學生均為同一模型(例如GPT-4.1老師與GPT-4.1學生)的情況下,他們指出,數據傳遞的具體機制尚不明確,需要進一步研究。

論文作者表示,這項研究的局限性在於所選特徵(例如最喜歡的動物和樹木)過於簡單,需要進一步研究以確定更複雜的特徵如何被潛意識地學習,他們得出結論認為,為了確保先進人工智能系統的安全性,需要進行更嚴格的安全測試,例如監控大語言模型的內部機制。


↑圖說:本項研究的相關示意圖(圖片來自論文)施普林格·自然供圖。









 

 
  綜合新聞


營造溫馨有愛生活環境 高雄榮家樂齡保健課 扇動活力傳遞感恩溫情

攜手高慈總等單位 高雄市榮服處 辦理「行動食力店」助弱勢

雲林縣榮服處親賀榮民眷屬當選模範母親

中彰榮家攜手中山國小 舉辦「感恩孝道音樂會」老幼共融溫馨歡慶母親節

讓長輩們感受社會溫暖與敬意 中華佛教善緣慈善會攜手臺北市榮服處關懷百歲榮民

打造有感母親節!
南市家教中心用愛陪伴多元活動讓家庭更靠近


世界公民日論壇籲政府落實國家保障人權的義務

藝文天地一玫瑰傳說語言學-作者鄧芸

台南擴大再生水建設
兼顧AI半導體產業與水資源循環









 


 
社址:台北市內湖區瑞光路八號六樓之一  總機:(02)87911588(代表號)
太平洋新聞網版權所有 © 2002 pacificnews.com.tw All Rights Reserved.

伺服器架設與程式設計