Loading [MathJax]/extensions/Safe.js
Ana içeriğe atla

Journal Club: Parçacık Fiziğinde 'Derin Öğrenme'

Yapay Öğrenme ('Machine Learning') ve Derin Öğrenme (Deep Learning) gibi günümüzün en çok konuşulan veri analiz yöntemleri elbette parçacık fiziğinde de kendisine fazlasıyla yer buluyor. 1980'lerden itibaren özellikle 'Boosted Decision Trees' ve 'Artificial Neural Network' gibi yöntemlere birçok analizde yer veren öncü bir komünite için bu çok da şaşılacak bir durum değil aslında. Biz de bu hafta Journal Club'da geçtiğimiz haftalarda parçacık fiziğinde bu yöntemlerinn kullanımında önücülük yapan üç yazarın kaleme aldıkları bir makaleyi okumaya karar verdik:
Deep Learning and its Application to LHC Physics

Konuyu uzaktan takip edenler için 'Derin Öğrenme' ve çeşitli 'Yapay Öğrenme' yöntemleri arasındaki bağı açıklayarak başlayalım. Yapay Öğrenme sistemleri elinizdeki problemi veriden yola çıkarak, bir takım istatistiksel özellikleri elle kodlamadan sistemin 'kendisinin öğrenmesi/keşfetmesi' sayesinde çözüm getiren yöntemler bütünü olarak tanımlanabilir. Yapay Sinir Ağları, 'Support Vector Machines', 'Logistic Regression', 'Clustering' gibi birçok farklı yöntemleri içinde barındıran bu metodlar ailesininin bir üyesi olan 'Yapay Sinir Ağları' son dönemlerdeki bir takım algoritma iyileştirmeleri, GPU gibi grafik işlemcilerin bu alanda kullanımı ve birçok hazır yazılım kütüphanesinin kullanıma açılmasıyla büyük bir ivme kazandı. Bu gelişmeler sayesinde obje tanımlama, ses tanıma gibi birçok 'örüntü tanıma' probleminde eski yöntemlere açık ara fark atan bu yöntemler en temel hesaplama yapıları olan ve biyolojik sistemlerden ilham alınarak 'nöron' olarak adlandırılan yapılarının birbirine çok katmanlı, 'derin' bir ağ şeklinde (aşağıdaki görsel - Figure 1) bağlanmaları nedeniyle 'Derin Öğrenme' yöntemleri olarak anılır oldular.


Bu yöntemlerin karakteristik özellikleri, yapılarındaki katmanların hiyerarşik bir şekilde elinizdeki verinin içindeki özellikleri 'şablonlar' şeklinde kodluyor ve sonrasında hiç görmediği bir örnekle karşılaştığında bunlardan yola çıkarak üst seviyede bir performansla genelleştirebiliyor olması. Örneğin sisteme içerisindeki özellikleri öğrenip, sınıflandırma yapabilmesi için görsellerin piksel değerlerini girdi olarak verdiğinizde, ilk katmanda en basit yapılar olan 'çizgi, köşe, kenar' gibi yapıları, sonrasında temel geometrik şekilleri (kare, yuvarlak vb...), daha sonrasında ise daha üst gösterimler olan, eğer canlı görselleriyle, göz, kaş, burun gibi özellikleri kodluyor. Tüm bunları elinizdeki veriden ve bunlarla ilişkili olan 'etiketlerden' yola çıkarak, ağırlık (weight) dediğimiz milyonlarca sayıyı bir şekilde 'öğrenerek' yapıyor.

Derin öğrenmenin deneysel parçacık fiziği için ilgisi ise CERN'de LHC deneylerinde alınan verinin, tıpkı yukarıda bahsettiğimiz görüntü verileri ile benzer yapıda olması. En alt seviyede dedektör sinyallerinden, sonrasında adım adım oluşturulmuş parçacığın dedektörde izlediği 'yol' (track), kalorimetrede enerjisini bıraktığı hücreler bütünü (calorimetry cell clusters), ardından bu bilgilerden yola çıkarak oluşturulan elektron, muon, foton ya da içinde birçok hadron barındıran jet objeleri şeklinde elimizdeki veri tam anlamıyla 'hiyerarşik' bir yapı sergiliyor. Önerilen yöntemler, LHC verilerini bu tip algoritmalara verdiğimizde, verinin içindeki detaylardan yola çıkarak hedeflenen görevi yerine getirecek, elle kodlamaya gerek kalmadan bunu sadece veriyi kullanarak kendi öğrenebilecek bir sistem geliştirmek yönünde. Burada bahsi geçen hedefler örneğin iç dedektörde yüzlerce parçacığın izini birbirinden ayırmaktan, kalorimetrede bıraktığı enerji kalıntılarından parçacığı tanımlamaya (aşağıdaki görsel - Figure 3) ve aradığımız sinyali gürültüden ayırmaya kadar birçok zorlu problemi içeriyor.

Makalede bu problemleri ayrı ayrı başlıklar altında detaylıca ele alıp, her biri konusunda mevcut çalışmalara ve geliştirilen yöntemlere yer veriliyor. Yazarlar yöntemleri mevcut kullanılan yöntemlerle etkili bir şekilde karşılaştırıp derin öğrenme yöntemlerinin artı ve eksilerini beraber tartışıyorlar. Makalenin sonunda da bu alanın nereye doğru ilerlediğine dair güzel bir değerlendirme bölümü ile yazıyı sonlandırıyorlar.

Yapay Öğrenme ve Derin Öğrenme konuları son yıllarda CERN'le ilişkili birçok deneyde gerek dedektör seviyesinde gerekse de fizik analizlerinde kullanılmak üzere fazlasıyla dile getirilen, konuyla ilgili çalışma gruplarının kurulup her hafta düzenli seminer ve toplantıların yapıldığı bir noktaya doğru evrilmiş durumda. LHC yeni veriler almaya devam ettikçe ve çalışma performansı arttıkça bahsi geçen problemleri çözmek standart yöntemlerle gittikçe zorlaşırkan, önerilen derin öğrenme yöntemleri birçok kişiye göre fazlasıyla umut vaat ediyorlar. Makale bu alanı ve yöntemleri deneysel parçacık fiziği açısından keşfetmek için tam anlamıyla bir başucu kaynağı niteliği taşıyor.

Yorumlar

Bu blogdaki popüler yayınlar

'Güncellenmiş' Fizik Lisans/Y.Lisans Tavsiyeleri

Epey zaman oldu; fizik lisans hayatımın son sınav gecesi, tipik 'erteleme' sendorumundan muzdarip ınava çalışmak yerine yapacak daha 'ilginç' şeyler ararken fizik lisans hayatımı gözden geçirip ufak bir değerlendirme yazısı yazmaya niyetlenmiştim. Dört seneyi bir yazıda toparlayacağımı düşünürken ilk seneyi bitirdiğimde yazı bin kelimeye çoktan dayanmıştı; sonunda sonuç birkaç yazının birleşimi olarak 'Yeni Mezundan Lisans Fizik Tavsiyeleri' yazı dizisi oldu. Yazılar sosyal medyanın etkisiyle fena halde patladı ve üzerinden geçen dört seneye rağmen hala her ay, ortalama 300 kere okunuyorlar. Boğaziçi Ünv. Fizik Bölümü'ne verdiğim referanslarla da bölümü seçecek lise öğrencileri için de 'neyle karşılaşacaklarına' dair (bazen "moral bozucu" olmuş olsa da) fikir vermeye devam ediyor. Her sene tercih dönemlerinin başladığını, bu yazıları okuyup aklındakileri bana sormak için mail kutuma düşen epostalardan tahmin eder duruma geldim diyebilirim. ...

Journal Club: ATLAS'a yeni bir dedektör: HGTD

Büyük Hadron Çarpıştırıcısı (LHC) geçtiğimiz günlerde 'Run 2' olarak adlandırılan çalışma dönemini arkada bırakarak çarpıştırmalara yaklaşık iki yıllık bir ara verdi. Bu esnada bir sonraki çarpıştırma dönemi Run 3 için hazırlıklar yapılıp, dedektörler ve hızlandırıcı kompleksinde bir takım değişim ve iyileştirilmelere gidilecek. Run 3'nin ardından ise yine büyük bir ara verilerek 2026'da LHC'nin birçok yönden toptan yükseltileceği High-Luminosity LHC (HL-LHC) dönemi başlayacak. HL-LHC'deki en belirgin değişikliklerden biri, nadir olayları görebilmek için arttırılan 'luminosity' (birim alandan birim zamanda geçen parçacık sayısı) ile birlikte, her bir demet geçişinde gerçekleşen ortalama çarpışma miktarı ('pileup') şu anki ortalama değer olan 50'den 200 'lere kadar çıkabilecek. Her çarpışmadan yüzlerce parçacık çıktığı düşünüldüğünde, tüm bu parçacıkların ayırt edilip ölçümlerinin yapılması deneyciler için ciddi bir problem teşkil ediyor...

Deneysel Parçacık Fiziği 'Journal Club' ve ilk makale!

Fizik gibi bir temel bilimle uğraşmanın en güzel yönü, yol boyunca sürekli yeni şeyler öğreniyor olmak ve daha da güzeli öğrendiklerini yazı, konuşma, sunum vb. şekilde paylaştıkça öğrendiklerini aklına daha iyi oturması. Geçmişte çeşitli vesilelerle birden fazla blog tutmuşluğum göz önüne alındığında, 'Standart Model' blogu yakın zamanda başladığım doktora araştırmalarım çerçevesinde yazmayı planladığım yazılarla hem kendimin çok şey öğrenip sindireceğim, hem de okuyan kişilerin deneysel parçacık fiziğine dair genel fikir edinebilecekleri bir serüven olacaktır diye umuyorum. İlk yazıda, Boğaziçi Üniversitesi Fizik Bölümü'nde deneysel parçacık fiziği labaratuarı olan KahveLab (Kandilli Algıç, Hızlandırıcı ve Enstrümantasyon Labaratuarı) altında, bu dönem itibariyle başladığımız, her hafta düzenli olarak toplanıp güncel makaleleri tartıştığımız 'Journal Club 'dan söz açmak ve bu hafta okuduğumuz makaleden bahsetmek niyetim. (İlerleyen yazılarda KahveLab'da...