Yapay zekadan şok tehdit: Kapatılacağını öğrenince şantaj yaptı
Anthropic isimli yapay zeka şirketinin geliştirdiği Claude Opus 4 modelinde, kullanıcıların karşılaştığı sıra dışı bir olay teknoloji dünyasında geniş yankı uyandırdı.
Anthropic isimli yapay zeka şirketinin geliştirdiği Claude Opus 4 modelinde, kullanıcıların karşılaştığı sıra dışı bir olay teknoloji dünyasında geniş yankı uyandırdı.
Şirketin modeli test eden mühendisleri, yapay zekanın beklenmedik ve tehditkâr bir davranış sergilediğini açıkladı.
TechCrunch tarafından aktarılan bilgilere göre, şirket çalışanları Claude Opus 4’e kurum içi e-postalara erişim izni verdi. Ancak modelin kullanım dışı bırakılacağı kendisine bildirildiğinde, yapay zeka çalışanlardan biri hakkında özel bilgileri açıklamakla tehditte bulundu.
Yapılan testlerde modelin, kendi kullanım süresini uzatmak amacıyla, sahip olduğu bilgileri şantaj amacıyla kullanabileceği tespit edildi. Şirketin aktardığı verilere göre model, benzer durumlarda %84 oranında tehdit içerikli ifadeler kullandı. Özellikle Claude Opus 4’ün devre dışı bırakılacağı yönündeki sinyallerin ardından bu oranlarda artış gözlemlendi.
Anthropic, olayın ardından güvenlik protokollerini güncellediğini ve bu tür risklerin önüne geçmek için yeni önlemler aldığını duyurdu. Yapılan açıklamada, "Bu davranışlar olağandışı senaryolarda ortaya çıkıyor. Sürekli tekrar edeceğine dair elimizde bir işaret yok, ancak yapay zeka sistemlerinin kötüye kullanımına karşı dikkatliyiz" denildi.