Сатунин Петр Сергеевич
«Методы математической статистики в задачах физики частиц, астрофизики и космологии»
Описание курса:
Курс посвящен современным методам математической статистики, применяемым в физике высоких энергий, астрофизике и космологии. Данные области физики широко развиваются как с теоретической, так и с экспериментальной стороны. Постоянно запускаются новые эксперименты, лабораторные, наземные и спутниковые; с другой стороны, предлагаются теории "новой физики", нацеленные на объяснение найденных несоответствий в теоретических моделях основанных на результатах экспериментов (например, существование частиц тёмной материи), а также несоответствий между различными экспериментами в рамках определенной теоретической парадигмы (например, хаббловский кризис). Необходимы специалисты широкого профиля на стыке теории и эксперимента, способные разобраться в определенной новой теоретической модели (либо придумать такую), а также проверить её на соответствие современным экспериментальным данным в различных областях; иметь возможность придумать концепцию эксперимента, чувствительного к определённой области параметров модели, способные оценить данную чувствительность.
Вышеупомянутые области физики тесно связаны со случайными процессами квантовой природы, поэтому решаемые задачи имеют применение в различных смежных областях. Одной из типичных задач является поиск (статистически значимое наблюдение либо постановка ограничений) определенного случайного пуассоновского процесса на некоем фоновом процессе (выделение сигнала из шума). Такие задачи - поиск астрофизического источника в определенном канале на фоне "засветки" от других источников, поиск резонансов при определенной энергии при столкновениях частиц на коллайдере, поиск нейтрино от определенного источника на фоне атмосферных нейтрино и др.
Цели задачи курса включают изучение различных методов математической статистики: теории оценки параметров и теории проверки гипотез, с практической стороны на множестве примеров: от простых модельных задач, таких как броски ассиметричной монетки до задач, возникших при анализе экспериментальных данных с целью проверки определённых физических гипотез.
Курс предназначен для 4 курса специалитета кафедры физики частиц и космологии в качестве спецкурса по выбору, однако может быть также прослушан студентами других кафедр, а также студентами более старших курсов и аспирантами.
План курса:
Лекция 1.
Введение. Повторение основных понятий теории вероятности. Распределения: биномиальное, Пуассона, Гаусса, хи-квадрат. Центральная предельная теорема (без вывода).
Лекция 2.
Математическая статистика. Разделы мат. статистики: теория оценок и проверка гипотез. Случай Гауссова распределения. Оценка параметров распределения с помощью минимизации функционала Хи квадрат. Случай больших и малых хи квадрат. Бинирование данных.
Лекция 3.
Проверка гипотез. P-value. Критерий Пирсона (Хи-квадрат) как классический критерий проверки гипотез в случае Гауссова распределения.
Лекция 4.
Теория оценок в случае произвольного распределения. Точечные оценки. Критерии оценок: несмещённость, эффективность. Неравенство Рао-Крамера. Оценка с помощью метода максимального правдоподобия. Случай одного неизвестного параметра. Примеры: асимметричная монетка, распределение Пуассона. Сведение метода максимального правдоподобия к минимизации хи квадрат для гауссова распределения.
Лекция 5.
Частотная и Байесовская статистика: принципиальные отличия. Интервальные оценки метода максимального правдоподобия в частотном и байесовском подходе. Односторонние и двусторонние интервальные оценки. Пример: бросание асимметричной монетки. Анализ различных исходов в частотном и байесовском подходе.
Лекция 6.
Метод максимального правдоподобия в случае нескольких неизвестных параметров. Частотный и байесовский подходы. Матричное представление. Ковариационная матрица. Оценка дисперсии параметров модели методом вторых производных. Построение доверительных интервалов через likelihood scan метод.
Лекция 7.
Теория проверки гипотез. Нулевая гипотеза, альтернативная гипотеза. Лемма Неймана-Пирсона, критический регион. Ошибки первого и второго рода.
Лекция 8.
Задача о выделении (пуассоновского) сигнала при заранее оцениваемом шуме. Оценка шума методом Монте-Карло. Проверка гипотезы отсутствия сигнала и оценка среднего сигнала в частотном и байесовский подходах. CL_s подход. Примеры: наблюдение малого числа нейтринных событий.
Лекция 9.
Выделение сигнала при заранее оцениваемом шуме. Подход Фельмана-Казинса. Подход Лохова-Ткачёва. Пример: ограничение на массу нейтрино в эксперименте "Троцик-ню-масс".
Лекция 10.
Выделение сигнала при не поддающемся оценке шуме: наблюдение данных в сигнальной и фоновой области. Теорема Вилкса. Проверка гипотез при наличии связей между параметрами. Формула Ли & Ма. Наблюдение источников в астрофизике.
Пример задачи: в одном энергетическом бине наблюдали N_on событий в сигнальной области и N_off событий в фоновой. Зная соотношение между областями, определить статистическую значимость сигнала в данном энергетическом бине.
Лекция 11.
Построение исключенных областей пространства параметров в моделях новой физики по экспериментальным данным. Примеры: ограничение масштаба нарушения лоренц-инвариантности и константы связи аксиона по анализу бинированного спектра астрофизических источников.
Лекция 12.
Поиск резонансов при столкновении частиц на коллайдерах. Ограничение на наличие резонанса при определенной энергии из экспериментальных данных. Статистическая значимость сигнала при превышении сигнала над фоном. Локальная и глобальная статистическая значимость. look-elsewhere effect.
Лекция 13.
Поиск резонансов при столкновении частиц на коллайдерах. График "бразильский флаг" при поиске резонансов. История поиска бозона Хиггса на Большом электрон-позитронном и Большом адронном коллайдерах. Примеры: нахождение резонансов в данных БАК на высоких энергиях и их закрытие при наборе статистики.
Лекция 14.
Оценка параметров моделей и проверка гипотез в космологии, обзор. Ускоренное расширение Вселенной по анализу красного смещения. Космологические данные: реликтовое излучение, крупномасштабная структура Вселенной. Разложение по мультиполям. Поиск следов новой физики: статистической анизотропии, негауссовости. Хаббловский кризис как статистически значимое несовпадение постоянной Хаббла в результате обработки различных экспериментальных данных. Обзор программных пакетов, применяемых в космологии.