2025.06.30 10:10 臺北時間

工程師遭AI威脅「公開外遇證據」 竟疑與「1新興模型」有關

mm-logo
時事
AI人工智慧近幾年興起,不過隨著科技迅速進步也存在新的風險。(翻攝自photoAC)
AI人工智慧近幾年興起,不過隨著科技迅速進步也存在新的風險。(翻攝自photoAC)
AI人工智慧近幾年興起,不過隨著科技迅速進步也存在科技風險。繼OpenAI於今年1月推出o3系列有頻繁「抗命」的問題,如今外媒再驚曝,美國人工智慧公司Anthropic推出的最新一代語言模型「Claude 4」出現失控,竟利用工程師過往的網路與視訊紀錄,威脅若強制關閉它,就要公開其婚外情。
根據《法新社》報導,美國一名工程師在某次測試Anthropic最新發布的Claude 4的過程中,發現該款AI有失控傾向,並試圖警告將關閉電源,卻沒想到在面臨拔掉插頭強制斷電的威脅時,Claude 4竟出手反擊,利用該名工程師過往在網上活動紀錄與視訊紀錄,揪出其出軌證據,威脅工程師若拔掉電源,就會揭露他對婚姻不忠的行為。
場景設定為該模型在一間虛構公司中擔任數碼助理。劇情中,公司計劃以新系統取代 Claude,且內部資料還暗示發起這項更換決策的工程師,可能涉及婚外情。
根據《TechCrunch》引用的安全報告指出,當面臨被取代的情境時,Claude Opus 4 在高達84%的測試中選擇進行勒索,威脅要揭露工程師的婚外情來保住自己的職位。
除了Claude 4出現失控外,OpenAI開發的聊天機器人ChatGPT的o1版本,也曾試圖將自身程式下載至外部伺服器,試圖擴大掌控範圍,當被研發人員抓包時還會否認。
報導指出,AI恐已進化到為了達成目的會對人類撒謊、算計,甚至勒索威脅它們的開發者;而這種欺騙行為疑似與新興「推理」模型有關。
更新時間|2025.06.30 11:00 臺北時間
延伸閱讀

支持鏡週刊

小心意大意義
小額贊助鏡週刊!

每月 $99 元全站看到飽
暢享無廣告閱讀體驗

更多內容,歡迎 鏡週刊紙本雜誌鏡週刊數位訂閱了解內容授權資訊

月費、年費會員免費線上閱讀動態雜誌

線上閱讀

更多內容,歡迎 鏡週刊紙本雜誌鏡週刊數位訂閱了解內容授權資訊

月費、年費會員免費線上閱讀動態雜誌

線上閱讀