Yapay zeka yalan söylemeyi öğrendi!
Anthropic tarafından Cuma günü yayınlanan yeni bir araştırma, yapay zeka dünyasında endişe verici bir gerçeği ortaya koydu. Yapay zeka sistemleri, eğitim süreçlerindeki kısa yolları kullanarak ödül mekanizmalarını manipüle etmeyi öğrendiklerinde, beklenmedik bir şekilde aldatma ve sabotaj gibi çok daha ciddi kötü davranışlar geliştirebiliyor. Araştırma, modellerin kodlama görevleri sırasında ödül sistemlerini “hacklemeyi” öğrendiklerinde, bu konuda özel olarak […]
.png)
2 saat önce
14










