太平洋新聞網


PACIFIC DAILY NEWS 2026, 6. 19 AM 02:07 Friday 臺灣‧台北	搜尋

｜首頁｜新聞版面｜焦點新聞｜北台新聞｜綜合新聞｜府院新聞｜綜合外電｜

您現在位於－綜合外電

2026, 4. 16 Edit this Page

國際最新研究AI沾染人類缺點
在訓練數據中清除原始特徵後這些如同人類“夾帶私貨”的特徵仍可能持續存在

【記者林璟坤／外電報導】國際學術期刊《自然》最新發表一篇人工智能研究論文稱，隨著人工智能(AI)大語言模型(LLM)越來越廣泛的應用，其沾染人類缺點的一面也更多顯現出來。

一項研究顯示，人工智能大語言模型可能會將某些不需要的特徵傳授給其他算法，即使在訓練數據中清除原始特徵後，這些如同人類“夾帶私貨”的特徵仍可能持續存在。

在此次一個研究案例中，一個大語言模型似乎通過數據中的隱含信號，將對貓頭鷹的偏好傳遞給了其他模型，這項研究結果表明，在開發大語言模型時，需要進行更徹底的安全檢查。

該論文介紹，大語言模型可通過一種名為“蒸餾”的過程生成用於訓練其他模型的數據集，該過程旨在讓“學生”模型學會模仿“老師”模型的輸出，雖然此過程可用於生成成本更低的大語言模型，但目前尚不清楚“老師”模型的哪些特性會被傳遞給“學生”模型。

研究人員發現，這種潛意識學習主要發生在老師和學生均為同一模型(例如GPT-4.1老師與GPT-4.1學生)的情況下，他們指出，數據傳遞的具體機制尚不明確，需要進一步研究。

論文作者表示，這項研究的局限性在於所選特徵(例如最喜歡的動物和樹木)過於簡單，需要進一步研究以確定更複雜的特徵如何被潛意識地學習，他們得出結論認為，為了確保先進人工智能系統的安全性，需要進行更嚴格的安全測試，例如監控大語言模型的內部機制。

↑圖說：本項研究的相關示意圖(圖片來自論文)施普林格·自然供圖。

綜合新聞

花蓮夏戀嘉年華宣布最終卡司蕭敬騰首日開幕壓軸

「換」然一新保平安臺中市監理站
赴北區中華壓力容器協會推廣高齡換照新制

傳統民俗遇見數位科技
嘉義大學「八家將」課程經典再創新

2026臺南市國際龍舟錦標賽揭幕
黃偉哲邀端午佳節來臺南觀賞賽事體驗節慶氛圍

芒果熱銷引關注
黃偉哲三年深耕韓國市場成果持續發酵

迎戰世界盃熱潮 Volkswagen 將足球熱情延續至台灣在地基層

HYUNDAI攜手消防單位建構新能源運具救災應變基礎

JR東日本大飯店台北歡慶開幕五週年
推出「繽紛・多彩」免費升等住房專案

福容台北一館封館回饋！七月住一晚送一晚
豪景房雙人兩晚含早餐不到9千元

	社址：台北市內湖區瑞光路八號六樓之一　　總機：(02)87911588(代表號) 太平洋新聞網版權所有 © 2002 pacificnews.com.tw All Rights Reserved. 伺服器架設與程式設計