İçeriğe geç

Claude Code'un Dynamic Workflows'u: 750 bin satır 11 günde taşındı

Anthropic, Claude Code'a Dynamic Workflows orkestrasyon katmanı ekledi. Öne çıkan örnek: 750 bin satırlık Bun kod tabanı 11 günde Zig'den Rust'a taşındı.

Kaynak doğrulandı
  1. [01] Anthropic — Claude updates (Releasebot digest)
  2. [02] Anthropic — Introducing Claude Opus 4.8
  3. [03] Anthropic — Agentic coding and persistent returns to expertise

Anthropic, Claude Code'a "Dynamic Workflows" adında yeni bir orkestrasyon katmanı ekledi. Tek satırlık özeti şu: ajan artık tek bir görevi değil, kod tabanı ölçeğinde çok adımlı bir göçü baştan sona yürütebiliyor — testleri kendi başarı çıtası olarak kullanarak.

Bu, "bana şu fonksiyonu yaz" ile "şu 750 bin satırlık projeyi başka bir dile taşı" arasındaki farktır. İkincisi yıllardır insan ekiplerinin işiydi.

Ne açıklandı

Dynamic Workflows, Claude Code'un Opus 4.8 ile birlikte çalışan bir orkestrasyon yeteneği. Fikir şu: büyük bir hedef veriyorsun (örneğin "bu modülü migrate et"), ajan işi alt görevlere bölüyor, sırayla yürütüyor ve her adımda mevcut test paketini geçip geçmediğine bakarak ilerliyor. Yani başarı kriterini insan her adımda elle tanımlamıyor; kriter projenin kendi testleri oluyor.

Anthropic'in öne çıkardığı örnek dikkat çekici: Jarred Sumner, Bun runtime'ının yaklaşık 750.000 satırlık kod tabanını Zig'den Rust'a taşımak için Dynamic Workflows kullandı. Sonuç 11 günde merge edildi ve testlerin %99,8'i geçti. Anthropic'e göre bu, adanmış bir ekiple 6-12 ay sürebilecek bir işti.

Ne değişti

Daha önce Claude Code güçlü ama esas olarak "oturum bazlı" bir araçtı: sen yönlendiriyordun, o adım adım yardım ediyordu. Opus 4.8'in ne getirdiğini yazarken hız ve maliyet tarafındaki sıçramayı anlatmıştım; Dynamic Workflows bunun üstüne "süre" boyutunu ekliyor.

• Kod tabanı ölçeği: yüz binlerce satırlık göçleri kickoff'tan merge'e tek akışta yürütüyor.

• Test-odaklı durma noktası: ajan ne zaman "bitti" diyeceğini test paketinden öğreniyor, insandan değil.

• Kurumsal sınır: Claude Managed Agents artık senin kontrol ettiğin bir sandbox'ta çalışıp özel MCP sunucularına bağlanabiliyor. Hem ajanın araç çalıştırdığı ortam hem ulaştığı servisler kurumsal sınır içinde kalıyor.

• Merkezi yetki: Okta ile başlayan kurumsal-yönetimli MCP konnektör erişimi geldi; yöneticiler konnektörü bir kez tanımlayıp Claude chat, Claude Code ve Cowork genelinde merkezî yetkilendirme yapabiliyor.

Benim ilk izlenimim

Dürüst olayım: 750 bin satırlık bir göçü kendi makinemde test edecek bir projem yok, dolayısıyla bu rakamı kendi gözümle doğrulamadım. Ama solo geliştirici olarak hangi kodlama ajanını seçtiğimi yazarken altını çizdiğim nokta tam da buydu: ajanların değeri tek prompt'ta değil, uzun-soluklu güvenilirlikte ölçülüyor.

Beni asıl ilgilendiren "11 gün" değil, "%99,8 test geçişi" ifadesi. Çünkü bir migrasyonun zor kısmı kodu çevirmek değil, çevirirken davranışı bozmamak. Test paketini başarı çıtası yapma fikri, ajanın halüsinasyonunu bir korkuluğa bağlıyor. Kendi projelerimde önce küçük bir modülde, gerçek bir test paketiyle deneyip sonucu ölçmeden büyük bir göçe güvenmem.

Pratik etkisi

Solo maker tarafı için somut çıkarım: dil/framework göçü artık "asla sıra gelmeyen backlog item" olmaktan çıkıp planlanabilir bir işe dönüşebilir. Yıllardır ertelediğim "şu eski modülü modern stack'e taşı" türü işler, iyi bir test paketi varsa erişilebilir hale geliyor.

Ama şart net: test paketin zayıfsa bu özellik senin için tehlikelidir. Ajan testi geçtiği an "bitti" diyecek; testin kapsamadığı davranış sessizce kırılabilir. Yani bu, test yazmayı daha da değerli kılan bir özellik — onu ikame eden değil.

Sınırlar / kaygılar

Anthropic'in paylaştığı örnek tek bir başarı vakası; ortalama sonucu değil. Bun göçü iyi test edilmiş, olgun bir kod tabanıydı. Tipik bir kurumsal monolitte test kapsamı bu kadar yüksek olmayabilir ve o durumda %99,8 gibi sayılar görmek zor.

Maliyet tarafı da açık bir soru: kod tabanı ölçeğinde, çok adımlı bir akış ciddi token tüketir. Fast mode hız avantajı sağlasa da, bu tür uzun görevlerin faturasını önceden kestirmek kolay değil. Küçük bir pilotla başlayıp birim maliyeti ölçmeden büyük göçlere girmek riskli.

Benden bir not

Bu duyuru bana sektörün sessiz yön değişimini hatırlattı: yarış artık "en akıllı tek cevap"tan "en güvenilir uzun görev"e kayıyor. Bir modelin tek prompt'ta ne kadar parladığı değil, saatlerce süren bir işi kaç kez bozmadan bitirdiği önemli olmaya başladı.

Benim için heyecan verici kısım, korkutucu kısımla aynı: test disiplini olan ekiplerin önü açılıyor, olmayanlar ise kırılganlığı otomatikleştiriyor. Aracı değil, alışkanlığı önemsiyorum — ve bu özellik tam da o alışkanlığı ödüllendiriyor.