Temat: Implementacja algorytmu Bayesowskich Sieci Neuronowych w pakiecie TMVA i jego wykorzystanie w fizyce leptonów tau w eksperymencie ATLAS
(Implementation of the Bayesian Neural Networks algorithm in the TMVA framework and it's application in tau lepton physics at ATLAS experiment)

Opiekun: dr Marcin Wolter, tel.: 12 662 80 24
e-mail: Marcin.Wolter@ifj.edu.pl


Opis:

1. Typowo stosowane algorytmy analizy wielu zmiennych oparte są na podejściu, w którym wybierana jest jedna funkcja zapewniająca najlepszą separację sygnału od tła. Błąd aproksymacji pozostaje nieokreślony. W algorytmie Bayesowskich Sieci Neuronowych stosowany jest szereg sieci neuronowych, z których każdej przypisywana jest waga w zależności od stopnia dopasowania do danych treningowych. Zbiór takich sieci umożliwia określenie rozkładu prawdopodobieństwa klasyfikatora, a zatem i błędu aproksymacji.

Celem pracy jest implementacja algorytmu Bayesowskich Sieci Neuronowych w pakiecie TMVA (tmva.sf.net) używanym powszechnie przez fizyków wysokich energii oraz przetestowanie go na przykładach z zakresu fizyki tau w eksperymencie ATLAS.

2. Metody analizy wielu zmiennych są coraz powszechniej stosowane w fizyce cząstek elementarnych, jak również w innych dziedzinach nauki. Zapewniają one wyższą skuteczność klasyfikacji niż w przypadku metod używających poszczególnych zmiennych sekwencyjnie, np. serii cięć na pojedynczych zmiennych. Mają one wiele zastosowań w analizie danych, służą zarówno do klasyfikacji (np. oddzielenie sygnału od tła), ale także do estymacji wartości funkcji (regresja) oraz do selekcji zmiennych i porównywania modeli.

Zdecydowana większość danych spotykanych w fizyce jest wielowymiarowa. Obecnie trudno jest znaleźć przykład eksperymentu fizyki cząstek, gdzie pojedyncza zmienna może być podstawą ciekawej analizy, stąd też coraz powszechniejsze użycie algorytmów analizy wielu zmiennych. Mają one wiele zastosowań, oprócz separacji sygnału ot tła mogą być także użyte do modelowania wielowymiarowych funkcji, np. rozkładów prawdopodobieństwa. Ich zaletą jest optymalne wykorzystanie całej dostępnej informacji oraz możliwość uczenia się na przykładach.

Większość powszechnie stosowanych algorytmów uczących się, jak np. wzmocnione drzewa decyzyjne BDT czy sieci neuronowe, oparta jest na tzw. uczeniu maszynowym. Wybieramy w nim pojedynczą funkcję klasyfikującą, którą uważamy za najlepiej pasującą do danych. Alternatywnie możemy zastosować podejście bayesowskie polegające na znalezieniu rozkładu prawdopodobieństwa w przestrzeni wszystkich możliwych funkcji. Podejście to prowadzi do bayesowskich sieci neuronowych (ang. Bayesian Neural Networks, BNN), gdzie zamiast pojedynczej sieci neuronowej stosowany jest szereg różnych sieci, z których każda ma przypisaną wagę. Dzięki temu uzyskany wynik jest bardziej stabilny oraz daje oszacowania błędu aproksymacji. W fizyce wysokich energii bayesowskie sieci neuronowe były używane przez eksperyment D0 w ośrodku badawczym Fermilab pod Chicago.

Pakiet TMVA (tmva.sf.net) wchodzi w skład dystrybucji powszechnie używanego przez fizyków cząstek elementarnych pakietu ROOT (root.cern.ch) służącego do analizy i wizualizacji danych. Pakiet TMVA zawierający szereg metod analizy wielu zmiennych (drzewa decyzyjne, sieci neuronowe itd.) jest, podobnie jak ROOT, rozwijany przez grupę naukowców związanych z ośrodkiem badawczym CERN w Genewie. Celem proponowanej pracy jest implementacja algorytmu bayesowskich sieci neuronowych w ramach pakietu TMVA, a tym samym udostępnienie go szerokiej rzeszy naukowców na całym świecie.

Metody wielu zmiennych, BDT oraz metoda rzutowanych prawdopodobieństw, jest używana do identyfikacji hadronowych rozpadów leptonów tau w eksperymencie ATLAS na Wielkim Zderzaczu Hadronów LHC w CERNie pod Genewą. Integralną częścią pracy powinno być sprawdzenie działania algorytmu bayesowskich sieci neuronowych na danych eksperymentu ATLAS oraz porównanie go ze standardowo używanymi metodami.

3. W trakcie realizacji projektu Magistrant będzie miał okazję zaznajomić się z najczęściej współcześnie stosowanymi metodami analizy wielu zmiennych zaimplementowanych w pakiecie TMVA a także zaznajomić się z budową pakietów TMVA oraz ROOT. Projekt wymaga stosowania zaawansowanych metod programowania w języku C++ oraz stosowania standardów przyjętych przez zespół pakietu TMVA. Zadaniem Magistranta jest stworzenie oprogramowania, które będzie używane przez wielu użytkowników, a sama implementacja powinna być przejrzysta i łatwa w dalszym utrzymaniu. Magistrant będzie miał też możliwość uczestniczyć w pracach grupy krakowskiej zajmującej się analizą fizyczną danych eksperymentu ATLAS, a także samodzielnie przeprowadzić identyfikację leptonów tau w danych zebranych przez eksperyment. Poprzez wideokonferencje będzie miał możliwość kontaktu zarówno z innymi grupami roboczymi eksperymentu ATLAS jak i deweloperami pakietu TMVA.

4. Praca będzie realizowana w ramach współpracy zarówno z grupą deweloperów pakietu TMVA oraz pozwoli uczestniczyć w pracach kolaboracji ATLAS. Stanowić będzie możliwość nawiązywania międzynarodowych kontaktów z ekspertami z różnych dziedzin.

5. Pakiet TMVA jest zintegrowany z pakietem ROOT narzędziem programistycznym najczęściej używanym przez fizyków wysokich energii na całym świecie. Stanowi on nowatorskie wyzwanie udostępniając w jednym pakiecie szereg metod analizy wielu zmiennych. Także praca w grupie eksperymentu ATLAS.