Yapay Zeka

Claude Fable 5 Kapatıldı: AI Regülasyonu Artık Teorik Değil

ahmet
4 dakikalık okuma
#Yapay Zeka#Claude#Anthropic#Regülasyon
claude fable 5
12 Haziran akşamı Anthropic, Claude'un en güçlü iki modelini bir devlet talimatıyla kapatmak zorunda kaldı. Ne oldu, neden önemli, biz ne öğrenmeliyiz?

12 Haziran akşamı, saat 17:21'de Anthropic bir mektup aldı. İçeriği kısaydı: Fable 5 ve Mythos 5'e erişimi durdurun. Birkaç saat içinde Claude ailesinin en güçlü iki modeli, yüz milyonlarca kullanıcının elinden alındı. Bunu daha önce hiçbir yapay zeka şirketi yaşamamıştı.

Açıkçası ilk duyduğumda biraz inanamadım. Bir cihazın, bir şifreleme aracının "ihracat kontrolü" gerekçesiyle kısıtlandığını duymuştuk. Ama bir sohbet modelinin gece yarısı fişinin çekilmesini değil. Hele de gerekçe, bilinen ciddi bir güvenlik açığı değil, modele "şu kod tabanını oku ve hatalarını düzelt" denebilmesi olunca.

Önce kısaca: Claude'a ne oldu

Anthropic, Claude'un yeni neslini, Fable 5'i piyasaya sürdü. Model çıkar çıkmaz Pliny the Liberator takma adlı bir araştırmacı 72 saat dolmadan filtreleri aştığını duyurdu ve modelin 120 bin karakterlik sistem komutunu olduğu gibi GitHub'a yükledi. Onun yorumu acı bir şekilde netti: bu, "tüm zamanların en hayal kırıklığı yaratan model lansmanlarından biri" idi, çünkü ağır güvenlik duvarları işe yarar araştırmacıları da dışarı itiyordu.

Asıl kriz Mythos 5 tarafında patladı. Devlet, modelin "jailbreak" edilebildiği iddiasını bir kamu kurumundan değil, üçüncü taraf bir firmadan aldı. Amazon CEO'su Andy Jassy'nin Beyaz Saray'a ilettiği bir uyarı süreci hızlandırdı. Ardından Ticaret Bakanı Howard Lutnick, Dario Amodei'ye o mektubu gönderdi. Talimat yabancı uyrukluları kapsadığı için, kapsama Anthropic'in kendi çalışanları da dahil oldu. Sonuç: ayrı ayrı kısıtlamak teknik olarak mümkün olmadığından iki model de herkese kapatıldı.

Anthropic karara katılmadığını açıkça söyledi. Şirkete göre açık küçük ve önceden bilinen türdendi, aynı yetenek GPT-5.5 dahil herkese açık başka modellerde de vardı, kusursuz jailbreak direncinin hiçbir sağlayıcı için mümkün olmadığını ekledi. Bir de kendi açısından rahatsız edici bir detay: ellerine yalnızca sözlü kanıt ulaşmıştı. Anthropic'in resmi açıklamasını buradan okuyabilirsiniz.

Dario Amodei tam da bunu istemişti, sanırım

İşin tuhaf tarafı şu. Olaydan birkaç gün önce Dario Amodei "Policy on the AI Exponential" başlığıyla uzun bir yazı yayınlamıştı. Ana fikri basit: yapay zeka üstel hızla ilerliyor, politika ise kaplumbağa hızında. Kendi cümlesiyle, Kongre harekete geçene kadar geçen birkaç yılda "yapay zeka eğlenceli bir oyuncaktan koca bir dahiler ülkesine" dönüşebiliyor. Çözüm diye de beş başlığa yayılan ciddi bir regülasyon paketi önermişti: eşik üstü modeller için üçüncü taraf testi, dağıtımları durdurma yetkisi, zorunlu olay bildirimi.

Yani regülasyon istedi, regülasyonu da aldı. Ama herhalde tam bu şekilde değil. Yazının orijinalini Amodei'nin sitesinden okumanızı tavsiye ederim, çünkü gelen tepkinin yarısı bu ironi üzerineydi. Toplulukta epey alaycı bir hava vardı: aylarca regülasyon isteyen birinin, IPO öncesi gürültüde ve yüksek model maliyetlerinden kurtulurken bunu alması kimilerine fazla denk gelmiş gibi geldi. Bence bu biraz haksız, ama tepkiyi anlıyorum.

"Şu kodu düzelt" üç kelimenin ağırlığı

Beni en çok düşündüren kısım teknik tarafı. Modeli tetikleyen şey, klasik bir hacker komutu değildi. "Şu depoyu oku, bulabildiğin güvenlik hatalarını düzelt" gibi son derece masum, hatta faydalı bir istekti. Sorun şu ki bir açığı bulup düzeltebilen model, aynı açığı bulup istismar edebilecek bilgiye de sahip demektir. Savunma ile saldırı burada aynı madalyonun iki yüzü.

Güvenlik araştırmacısı Katie Moussouris bu noktayı açık bir mektupla işaret etti: eğer kriter "kötüye kullanılabilecek yetenek" ise, bu kritere takılmayan modern model neredeyse yok. Anthropic'in itirazının özü de buydu. Bu standardı sektöre aynen uygularsanız, pratikte yeni model dağıtımlarının tamamını durdurursunuz. Bunun ne kadar doğru olduğundan emin değilim, ama mantığı sağlam duruyor.

Peki bu bizi neden ilgilendiriyor

Çoğumuz ulusal güvenlik tartışmasının tarafı değiliz. Ama bir kısmımız ürününü, iş akışını ya da müşteri hizmetini doğrudan böyle bir modele bağlamış durumda. Olayın asıl dersi de burada: üzerine şirket kurduğunuz bir model, bir akşam üstü, sizin hatanızla hiç ilgisi olmayan bir nedenle ortadan kalkabiliyor. Sağlayıcı riski artık soyut bir madde değil, takvime geçmiş bir olay.

Bu yüzden Claude ya da başka bir modele bel bağlayan ekiplere birkaç somut öneri:

  • Sağlayıcı katmanını soyutlayın. Kodunuz tek bir API'ye değil, değiştirilebilir bir arayüze bağlansın ki gerektiğinde başka bir modele birkaç saatte geçecek olun.
  • Hazırda yedek model tutun. Birincil model düştüğünde devreye girecek, test edilmiş bir ikincil yol olsun.
  • Kritik istemlerinizi ve değerlendirme setinizi kendi tarafınızda saklayın. Bir model gittiğinde tüm birikiminiz onunla gitmesin.
  • Çıkarımınızın nerede koştuğunu ve verinizin nerede durduğunu bilin. Veri yerleşimi ve erişim sürekliliği artık teknik değil, iş kararı.

Biz KRITM olarak altyapı tarafında zaten bu mantıkla çalışıyoruz: garantili kaynak, Türkiye lokasyonu ve kendi yığınını kontrol etme imkânı. Bir modelin gece yarısı kapanmasını engelleyemeyiz, ama sizi tek bir kapıya mahkûm etmeyen bir zemin kurabiliriz. Bu konuyu konuşmak isterseniz hizmetlerimize göz atın.

Benim çıkardığım ders

Bu kavganın haklı tarafı kim, doğrusu emin değilim. Devletin endişesi tamamen boş değil, Anthropic'in itirazı da teknik olarak güçlü. İkisi de bir noktaya kadar haklı olabilir. Net olan tek şey şu: yapay zeka artık "ilginç bir araç" kategorisinden çıktı, jeopolitik bir varlık haline geldi. Claude'un bu hafta yaşadığı şey bir istisna değil, yeni dönemin ilk örneği. Akıllıca olan, modele âşık olmak değil, modelin gidebileceğini baştan kabul edip ona göre kurmak.