06/01/2022
W dziedzinie analizy danych i statystyki matematycznej, szczególnie w kontekście teorii macierzy losowych, empiryczna funkcja rozkładu widmowego (EDF) odgrywa kluczową rolę. Jest to narzędzie, które pozwala na badanie rozkładu wartości własnych macierzy, dostarczając cennych informacji o strukturze danych i właściwościach macierzy. W tym artykule przyjrzymy się bliżej definicji EDF, jej zastosowaniom oraz wzorom matematycznym, które opisują jej zachowanie.

Czym jest Empiryczny Rozkład Widmowy (ESD)?
Zanim przejdziemy do samej EDF, warto zrozumieć pojęcie empirycznego rozkładu widmowego (ESD). Wyobraźmy sobie macierz N × N, na przykład macierz losową, której wartości własne oznaczamy jako λ1, λ2, …, λN. Empiryczny rozkład widmowy, często skracany do ESD (z angielskiego Empirical Spectral Distribution), jest funkcją, która opisuje rozkład tych wartości własnych. Formalnie, ESD definiuje się jako:
FX(x) = (1/N) ∑Ni=1 δλi
gdzie δy oznacza miarę Diraca skupioną w punkcie y. W przypadku macierzy hermitowskich, gdzie wartości własne są rzeczywiste, empiryczna funkcja rozkładu jest zdefiniowana jako:
FX(x) = (1/N) ∑Nj=11{λj ≤ x}
dla x ∈ ℝ, gdzie 1{warunek} jest funkcją indykatorową, równą 1, gdy warunek jest spełniony, a 0 w przeciwnym wypadku.
ESD jest kluczowe w teorii macierzy losowych (RMT), ponieważ wiele statystyk związanych z macierzą losową X można wyrazić jako funkcjonał liniowy jej ESD. Przykładem może być logarytm wyznacznika macierzy kowariancji próbki, który jest ważny w komunikacji bezprzewodowej. Można go wyrazić jako sumę logarytmów wartości własnych, a co za tym idzie, jako całkę względem ESD.
Empiryczna Funkcja Rozkładu (EDF)
Empiryczna funkcja rozkładu (EDF) jest ściśle związana z ESD, szczególnie w kontekście macierzy hermitowskich, gdzie wartości własne są rzeczywiste. EDF, w tym kontekście, jest po prostu funkcją dystrybuanty odpowiadającą ESD. Zatem, dla macierzy hermitowskiej X, EDF jest zdefiniowana jako:
EDFX(x) = FX(x) = (1/N) ∑Nj=1 1{λj ≤ x}
Wzór ten, choć prosty, jest fundamentalny. Mówi nam, że wartość EDF w punkcie x to po prostu procent wartości własnych macierzy X, które są mniejsze lub równe x. Innymi słowy, sumujemy jedynki dla każdej wartości własnej λj, która spełnia warunek λj ≤ x, a następnie dzielimy przez całkowitą liczbę wartości własnych N.
Zachowanie Widma Zbiorowego i Prawa Graniczne
Jednym z podstawowych pytań w teorii macierzy losowych jest to, czy ESD, po odpowiedniej normalizacji macierzy, zbiega się do pewnego rozkładu prawdopodobieństwa, gdy wymiar macierzy rośnie. Odpowiedzi na to pytanie dostarczają prawa graniczne, takie jak prawo półkola Wignera i prawo Marczenki-Pastura.

Prawo Półkola Wignera
Prawo półkola Wignera opisuje graniczną ESD dla macierzy Wignera. Macierz Wignera to kwadratowa macierz hermitowska, której elementy na i nad diagonalą są niezależne, mają średnią zero i wariancję jednostkową. Wigner pokazał, że oczekiwana ESD macierzy Wignera n × n z elementami gaussowskimi, pomnożona przez 1/n, zbiega się do prawa półkola, którego funkcja gęstości prawdopodobieństwa (p.d.f.) jest dana wzorem:
f(x) = (1/(2π)) √(4 - x2) 1[-2, 2](x)
dla x ∈ [-2, 2] i 0 poza tym przedziałem. Twierdzenie 3.1 w tekście źródłowym formalizuje to stwierdzenie, podając warunki zbieżności ESD znormalizowanej macierzy Wignera do prawa półkola, nawet przy minimalnych założeniach dotyczących momentów elementów macierzy.
Prawo Marczenki-Pastura
Analogiczne prawo graniczne, prawo Marczenki-Pastura, zostało wyprowadzone dla macierzy kowariancji próby. Twierdzenie 3.2 w tekście źródłowym opisuje to prawo. Załóżmy, że X jest macierzą p × n z niezależnymi i identycznie rozłożonymi elementami o średniej 0 i wariancji 1. Niech γ = limn→∞p/n. Wtedy, gdy n → ∞, ESD macierzy S = (1/n) XX* zbiega się prawie na pewno do rozkładu Marczenki-Pastura Fγ. Funkcja gęstości prawdopodobieństwa Fγ dla γ ∈ (0, 1] jest dana wzorem:
fγ(x) = (√(b+(γ) - x) √(x - b-(γ))) / (2πγx) 1[b-(γ), b+(γ)](x)
gdzie b±(γ) = (1 ± √γ)2. Dla γ ∈ (1, ∞), Fγ jest mieszaniną masy punktowej w 0 i p.d.f. f1/γ.
Prawo Marczenki-Pastura jest niezwykle ważne w analizie danych wysokowymiarowych, ponieważ opisuje rozkład wartości własnych macierzy kowariancji próby, które są powszechnie stosowane w statystyce.
Metody Badania EDF
W teorii macierzy losowych stosuje się dwie główne metody do badania zachowania EDF: metodę momentów i metodę transformaty Stieltjesa.
Metoda Momentów
Metoda momentów polega na badaniu momentów rozkładu widmowego. k-ty moment ESD macierzy X jest równy (1/N) tr(Xk). Zgodnie z Lematem 3.2, ciąg rozkładów prawdopodobieństwa {Fn} zbiega się do rozkładu F, jeśli momenty k-tego rzędu Fn zbiegają się do momentów k-tego rzędu F, a momenty graniczne spełniają warunek Carlemana (Lemat 3.1), który zapewnia unikalność rozkładu na podstawie sekwencji momentów.

Transformata Stieltjesa
Transformata Stieltjesa jest potężnym narzędziem w RMT, podobnym do transformaty Fouriera w klasycznej teorii prawdopodobieństwa. Transformata Stieltjesa miary μ na prostej rzeczywistej jest zdefiniowana jako:
Sμ(z) = ∫ (1/(x - z)) μ(dx), z ∈ ℂ+
gdzie ℂ+ = {x + iy: x ∈ ℝ, y > 0}. Lemat 3.3 (wzór inwersyjny) pozwala na rekonstrukcję funkcji dystrybuanty z jej transformaty Stieltjesa. Lemat 3.4 daje warunki konieczne i wystarczające na to, aby granica transformat Stieltjesa ciągu miar prawdopodobieństwa była transformatą Stieltjesa miary prawdopodobieństwa.
Transformata Stieltjesa ESD macierzy WN jest dana przez:
sN(z) = (1/N) tr((WN - zIN)-1)
gdzie IN jest macierzą identycznościową N × N. Badanie granicy transformaty Stieltjesa sN(z) pozwala na określenie granicznego rozkładu ESD.
Zastosowania i Rozszerzenia EDF
EDF i związane z nią prawa graniczne, takie jak prawo półkola Wignera i prawo Marczenki-Pastura, mają szerokie zastosowanie w różnych dziedzinach, w tym:
- Statystyka wysokowymiarowa: EDF jest kluczowe w analizie danych, gdzie liczba zmiennych jest porównywalna lub większa od liczby obserwacji. Pomaga zrozumieć strukturę macierzy kowariancji i macierzy korelacji w takich scenariuszach.
- Komunikacja bezprzewodowa: Rozkład widma macierzy losowych jest istotny w analizie systemów MIMO (Multiple-Input Multiple-Output) i innych technologii komunikacyjnych.
- Fizyka statystyczna: Teoria macierzy losowych i EDF mają zastosowanie w modelowaniu układów fizycznych, takich jak szkła spinowe i układy chaotyczne.
- Finanse matematyczne: EDF może być użyteczne w analizie portfeli inwestycyjnych i modelowaniu ryzyka finansowego.
Badania nad EDF stale się rozwijają, obejmując rozszerzenia na macierze o bardziej złożonej strukturze, macierze niespełniające założenia niezależności elementów, oraz badanie statystyk widmowych wyższego rzędu. Twierdzenie 3.3 i 3.4 w tekście źródłowym prezentują przykłady takich rozszerzeń, dotyczące macierzy z elementami niespełniającymi założenia i.i.d. oraz macierzy o strukturze kowariancji oddzielnej.
Pytania i Odpowiedzi (FAQ)
- Co to jest Empiryczna Funkcja Rozkładu Widmowego (EDF)?
- EDF to funkcja dystrybuanty opisująca rozkład wartości własnych macierzy. Mówi, jaki procent wartości własnych jest mniejszy lub równy danej wartości.
- Dlaczego EDF jest ważne w teorii macierzy losowych?
- EDF jest kluczowe, ponieważ wiele statystyk macierzy losowych można wyrazić za pomocą jej funkcjonałów. Prawa graniczne dla EDF, takie jak prawo półkola Wignera i prawo Marczenki-Pastura, opisują asymptotyczne zachowanie widma macierzy losowych.
- Jakie metody stosuje się do badania EDF?
- Głównymi metodami są metoda momentów i metoda transformaty Stieltjesa. Metoda momentów bada momenty rozkładu widmowego, a metoda transformaty Stieltjesa wykorzystuje transformatę Stieltjesa ESD.
- Jakie są zastosowania EDF?
- EDF ma zastosowania w statystyce wysokowymiarowej, komunikacji bezprzewodowej, fizyce statystycznej i finansach matematycznych, pomagając w analizie danych, modelowaniu systemów i zrozumieniu rozkładu wartości własnych macierzy.
Podsumowanie
Empiryczna funkcja rozkładu widmowego (EDF) jest fundamentalnym narzędziem w teorii macierzy losowych i analizie danych. Jej definicja, choć prosta, otwiera drzwi do zrozumienia skomplikowanego zachowania widm macierzy losowych. Prawa graniczne, takie jak prawo półkola Wignera i prawo Marczenki-Pastura, opisują asymptotyczne zachowanie EDF, co ma kluczowe znaczenie w wielu dziedzinach nauki i technologii. Metody momentów i transformaty Stieltjesa stanowią podstawowe narzędzia do badania EDF i jej właściwości. Zrozumienie EDF i jej wzorów jest niezbędne dla każdego, kto zajmuje się analizą danych wysokowymiarowych i teorią macierzy losowych.
Jeśli chcesz poznać inne artykuły podobne do Empiryczna funkcja rozkładu widmowego (EDF), możesz odwiedzić kategorię Rachunkowość.
