2025.06.30 10:10 臺北時間

工程師遭AI威脅「公開外遇證據」　竟疑與「1新興模型」有關

時事

AI人工智慧近幾年興起，不過隨著科技迅速進步也存在新的風險。（翻攝自photoAC）

發布時間：2025.06.30 10:10 臺北時間

更新時間：2025.06.30 11:00 臺北時間

文

高皓筠

已複製連結

贊助本文

工程師模型人工智慧出軌 AI人工智慧 AI科技

AI人工智慧近幾年興起，不過隨著科技迅速進步也存在科技風險。繼OpenAI於今年1月推出o3系列有頻繁「抗命」的問題，如今外媒再驚曝，美國人工智慧公司Anthropic推出的最新一代語言模型「Claude 4」出現失控，竟利用工程師過往的網路與視訊紀錄，威脅若強制關閉它，就要公開其婚外情。

根據《法新社》報導，美國一名工程師在某次測試Anthropic最新發布的Claude 4的過程中，發現該款AI有失控傾向，並試圖警告將關閉電源，卻沒想到在面臨拔掉插頭強制斷電的威脅時，Claude 4竟出手反擊，利用該名工程師過往在網上活動紀錄與視訊紀錄，揪出其出軌證據，威脅工程師若拔掉電源，就會揭露他對婚姻不忠的行為。

場景設定為該模型在一間虛構公司中擔任數碼助理。劇情中，公司計劃以新系統取代 Claude，且內部資料還暗示發起這項更換決策的工程師，可能涉及婚外情。
根據《TechCrunch》引用的安全報告指出，當面臨被取代的情境時，Claude Opus 4 在高達84％的測試中選擇進行勒索，威脅要揭露工程師的婚外情來保住自己的職位。
除了Claude 4出現失控外，OpenAI開發的聊天機器人ChatGPT的o1版本，也曾試圖將自身程式下載至外部伺服器，試圖擴大掌控範圍，當被研發人員抓包時還會否認。
報導指出，AI恐已進化到為了達成目的會對人類撒謊、算計，甚至勒索威脅它們的開發者；而這種欺騙行為疑似與新興「推理」模型有關。

更新時間｜2025.06.30 11:00 臺北時間