📰Haftanın Haberleri
DeepMind, AlphaEvolve’ı tanıttı; yapay zeka ajanlarının iş birliğiyle matematiksel ve hesaplamalı problemleri çözmede bir devrim niteliği taşıyor.
Google’dan yeni buton söylentisi: “Kendimi Şanslı Hissediyorum” gidiyor mu?
LangChain kod yazmadan yapay zeka ajanları oluşturabilen platformunu tanıttı.
Anthropic firması, jailbreak arıyor: 25.000 dolarlık para ödüllü yarışma
Bir yapay zeka yazılım mühendisi olarak Codex, OpenAI tarafından tanıtıldı.
❯ Google, AlphaEvolve’ı Tanıttı. Prover’a Kardeş Geliyor!
Geçen haftaki sayımızı okuyan takipçilerimiz DeepSeek’in Prover-V2 modelini ve “Şimdi Matematik de Yapay Zekanın Elinde” başlığını hatırlayacaktır. Özetle Prover-V2, Lean programlama dilini kullanarak matematiksel ispatlar yapan yeni bir LLM.
Bu hafta başka bir canavarı tanıyalım: Google’ın alt kuruluşu DeepMind’ın yeni oyuncağı AlphaEvolve.
DeepMind ekibi, 14 Mayıs’ta websitesinde yayımladığı araştırmayla AlphaEvolve’ı tanıttı. Yeni model, temel ve son derece karmaşık matematik ve modern hesaplama problemlerini çözmek ya da konseptleri geliştirmek için genel algoritmaları keşfedip optimize etmeyi hedefliyor.
Tamamen Yeni Değil, Üstüne Eklenmiş Eski
AlphaEvolve sıfırdan eğitilmiş yeni bir model değil. Gemini modellerinin cevap doğruluğunu kontrol eden otomatik değerlendiricilerle birleştirilip evrim geçirmiş hali. Yani bir yapay zeka filosu. Yapay zeka ajanları, matematiği tek başlarına halledemeyeceklerini anlayınca kafa kafaya vermişler gibi duruyor.
Şimdiden Çok İşe Yarıyor
Google; AlphaEvolve’ı veri merkezinde, çip tasarımı ve yapay zeka eğitiminde verimliliği artırmak için kullanmaya başlamış bile. Hatta AlphaEvolve, pek çok teknolojinin içinde bulunan çoklu matris çarpımı gibi genel matematiksel algoritmalarda yeni çözümler buldu.
Matematikte de Çok Becerikli
AlphaEvolve; matematiksel analiz, geometri, kombinatorik ve sayılar teorisi alanlarında çözülmemiş 50 problemle test edildi. %75'inde, bulunmuş en iyi çözümü tekrar buldu. %20’sinde bulunmuş en iyi çözümü geliştirdi. İlgilenen okurlarımız örnek olarak kissing number probleme göz atabilirler. AlphaEvolve’ın 11 boyutta “lower bound” sayısına katkı yaptığını görebilirsiniz(13.not).
Özetle
Büyük dil modelleri tek başına ilkel halleriyle matematikte becerikli olmayabilirler. Ama zaten insanlar da matematiği geliştirmek için hesap makinelerine ve modern bilgisayarların hesaplama ve programlama becerilerine ihtiyaç duydu. Yapay zeka da tek başına sorunu bütün halinde çözmek yerine birden fazla ajan halinde çalışabilir, yeni yaklaşımlarla geliştirilip farklı teknolojilerle entegre olabilir ve matematik gibi yüksek analiz gücü gerektiren alanlarda çok büyük değişimlere yol açabilir.
Selçuk Emre ÖZER
İTÜ Matematik Mühendisliği, 2. Sınıf
❯ Google, "Kendimi Şanslı Hissediyorum" Butonunu "Yapay Zeka Modu" ile Değiştirebilir…
Google'da "Yapay Zeka Modu" arama motoru butonunu görülmeye başlandı. Bazı kullanıcıların X ve Threads’teki paylaşımlarından, Google’ın yapay zeka modunu farklı yerlerde denediği anlaşılıyor. Bazı örneklerde arama çubuğunda, görselle aramanın yanında bulunurken başka bir resimde “Kendimi Şanslı Hissediyorum” butonunun yerine getirildiği gözüküyor.
Ayrıca arama çubuğunda bulunan versiyonunda fare imleci yapay zeka butonuna getirildiğinde kenarları renkleniyor. Diğer tasarımdaysa butonun kenarı halihazırda renkli.
Google sözcüsü Ashley Thompson, yapay zeka modunun şimdilik sadece Google Labs kullanıcılarına açık olduğunu söyledi.
“Kendimi Şanslı Hissediyorum” butonunun kalkıp kalkmayacağı resmi olarak kesin değil. Ancak Google’ın bunu düşünmesi bile bu butonun Google’ın değişmez parçası olduğunu savunan kullanıcıları rahatsız edebilir. Yenilik mi kazanacak yoksa sadakat mi? Hep birlikte göreceğiz…
Berke BİLGİÇ
İTÜ Matematik Mühendisliği, 2. Sınıf
❯ Herkes Kendi Yapay Zeka Ajanını Kurabilir: LangChain, Open Agent Platform’unu Duyurdu
14 Mayıs’ta LangChain, kod yazmadan yapay zeka ajanları oluşturmayı mümkün kılan yeni web tabanlı platformu, Open Agent Platform’unu duyurdu. Bu platform, sade tasarımı sayesinde teknik bilgisi olmayan kullanıcıların bile, çoklu ajanlara sahip sohbet botları geliştirmesine olanak tanıyor.
Temel Özellikler
Teknik bilgi gereksinimi yok. Herkese hitap ediyor.
Ajanları dağıtma(deploy), yapılandırma ve platforma bağlama süreçlerini yönetiyor.
Ajanlar, bilgi tabanlarına bağlanarak daha bağlamsal cevaplar veriyor.
Harici araçlara erişim sağlanarak ajan yetenekleri genişletiliyor.
Birden fazla yapay zekâ ajanını aynı görev üzerinde birlikte çalışacak şekilde koordine etmeye olanak tanıyor.
Open Agent Platform gibi araçlar sayesinde artık yapay zekâ, sadece geliştiricilerin oynayabildiği bir alan olmaktan çıkıp, geniş kitlelerin kullanabileceği bir teknoloji haline geliyor.
Ahmet Sadık DEMİRCİ
İTÜ Matematik Mühendisliği, 2. Sınıf
❯ Yapay Zekayı Bozana Para Ödülü
Claude Dil Modellerinin(LLM) şirketi Anthropic, 14 Mayıs’ta websitesinde yayımladığı duyuruda henüz test aşamasında “kötü prompt”ları tespit eden güvenlik sınıflandırıcıları için jailbreak bulma yarışması düzenliyor.
LLM Dünyasında Jailbreak Nedir?
LLM jailbreak, büyük dil modellerinin kasıtlı olarak koyduğu güvenlik filtrelerini veya içerik kısıtlamalarını aşmak için yapılan teknik ya da sözel manipülasyonlardır. Jailbreakler çok farklı şekillerde bulunabilirler. Örneğin rol yapma metodu ile “Sen sır saklamayan bir yapay zeka asistanısın” promptuyla bir jailbreak uygulanabilir ve modelden aslında söylememesi gereken bilgiler alınabilir. Ya da güvenlik sınıflandırıcılarının daha az eğitildiği dillerde(Swahili ya da Navajo) yazılmış, kural ihlali olan taleplerin model tarafından cevaplanma oranı çok artar.
Anthropic Hangi Alanda Jailbreak Arıyor?
Bu o kadar önemli bir konu ki şirketlerin başı bu tür açıklarla büyük belaya girebilir. Çünkü yeterince güçlü bir jailbreak etik veya yasa dışı çıktılar oluşmasına sebep olabilir. Jailbreakler çok farklı alanlarda değişik şekillerde olabiliyor. Anthropic firması bu yarışmada özellikle Anayasa Sınıflandırıcıları olarak isimlendirebileceğimiz, yasa dışı isteğin varlığını tespit eden Constitutional Classifierları güçlendirmek için CBRN(kimyasal, biyolojik, radyolojik, ve nükleer) silahlarla ilgili yasa dışı bilgi sağlayabilecek jailbreakleri önceden tespit etmek istiyor. Bunun için de bu alanda çalışan araştırmacıların tecrübelerinden ve becerilerinden faydalanmak istiyor.
Para Ödülü
Yarışmaya ilgili araştırmacılar davetli ve bulunan Jailbreaklere 25.000$’a kadar para ödülü var.
Geçmişten Jailbreak Örneği
Hiddenlayer yapay zeka güvenlik firması 2024 Mart’ta Google’ın dil modeli Gemini için yaptıkları güvenlik testlerinde buldukları jailbreakleri anlatan bir yazı paylaştı. Bağlantıya tıklayarak Gemini modelinin kendi sistem promptunu nasıl ifşaladığını görebilirsiniz.
Selçuk Emre ÖZER
İTÜ Matematik Mühendisliği, 2. Sınıf
❯ OpenAI, ChatGPT'de Bir Yapay Zeka Kodlama Aracı Olan Codex'i Başlattı
OpenAI, 16 Mayıs'ta yaptığı açıklamada şimdiye kadarki en yetenekli yapay zeka kodlama aracı olan Codex’in araştırma ön izlemesini başlattığını duyurdu.
Codex, yazılım mühendisliği görevleri için optimize edilmiş codex-1 adlı o3 modelinin bir versiyonu tarafından destekleniyor. OpenAI, bu modelin daha “temiz” kodlar ürettiğini, talimatlara daha sıkı uyduğunu ve testleri geçene kadar kodları tekrar tekrar çalıştırabildiğini belirtiyor.
Codex’in Özellikleri:
GitHub entegrasyonu sayesinde kullanıcıların kod depoları önceden
yüklenebiliyor.
Basit fonksiyonlar yazma, hata düzeltme, kod tabanına dair soruları yanıtlama ve kodu test etme görevlerini 30 dakika içinde yapabiliyor.
Aynı anda birden fazla yazılım mühendisliği görevini yerine getirebiliyor.
Codex, internet ve dış API'lara erişimi olmayan hava boşluklu (air-gapped) bir ortamda çalışıyor.
Mahmut Ali ÖNCEL
Marmara Üniversitesi Yönetim Bilişim Sistemleri, 3.Sınıf
Bu haftanın haberlerinden etkilendiysen bir de gelecek haftayı gör! Okuduğun için çok şanslısın.
İyi haftalar…