Empiryczna funkcja rozkładu widmowego (EDF)

06/01/2022

★★★★★Rating: 4.79 (7414 votes)

W dziedzinie analizy danych i statystyki matematycznej, szczególnie w kontekście teorii macierzy losowych, empiryczna funkcja rozkładu widmowego (EDF) odgrywa kluczową rolę. Jest to narzędzie, które pozwala na badanie rozkładu wartości własnych macierzy, dostarczając cennych informacji o strukturze danych i właściwościach macierzy. W tym artykule przyjrzymy się bliżej definicji EDF, jej zastosowaniom oraz wzorom matematycznym, które opisują jej zachowanie.

Jaka jest różnica pomiędzy EDF i RMS? — Według RM, zadaniom przypisuje się stałe priorytety, które są proporcjonalne do ich tempa, więc zadanie o najmniejszym okresie otrzymuje najwyższy priorytet. Według EDF priorytety są przypisywane dynamicznie i są odwrotnie proporcjonalne do bezwzględnych terminów aktywnych zadań.

Spis treści

Czym jest Empiryczny Rozkład Widmowy (ESD)?
Empiryczna Funkcja Rozkładu (EDF)
Zachowanie Widma Zbiorowego i Prawa Graniczne
- Prawo Półkola Wignera
- Prawo Marczenki-Pastura
Metody Badania EDF
- Metoda Momentów
- Transformata Stieltjesa
Zastosowania i Rozszerzenia EDF
Pytania i Odpowiedzi (FAQ)
Podsumowanie

Czym jest Empiryczny Rozkład Widmowy (ESD)?

Zanim przejdziemy do samej EDF, warto zrozumieć pojęcie empirycznego rozkładu widmowego (ESD). Wyobraźmy sobie macierz N × N, na przykład macierz losową, której wartości własne oznaczamy jako λ₁, λ₂, …, λ_N. Empiryczny rozkład widmowy, często skracany do ESD (z angielskiego Empirical Spectral Distribution), jest funkcją, która opisuje rozkład tych wartości własnych. Formalnie, ESD definiuje się jako:

F_X(x) = (1/N) ∑^N_i=1 δ_{λ_i}

gdzie δ_y oznacza miarę Diraca skupioną w punkcie y. W przypadku macierzy hermitowskich, gdzie wartości własne są rzeczywiste, empiryczna funkcja rozkładu jest zdefiniowana jako:

F_X(x) = (1/N) ∑^N_j=11{λ_j ≤ x}

dla x ∈ ℝ, gdzie 1{warunek} jest funkcją indykatorową, równą 1, gdy warunek jest spełniony, a 0 w przeciwnym wypadku.

ESD jest kluczowe w teorii macierzy losowych (RMT), ponieważ wiele statystyk związanych z macierzą losową X można wyrazić jako funkcjonał liniowy jej ESD. Przykładem może być logarytm wyznacznika macierzy kowariancji próbki, który jest ważny w komunikacji bezprzewodowej. Można go wyrazić jako sumę logarytmów wartości własnych, a co za tym idzie, jako całkę względem ESD.

Empiryczna Funkcja Rozkładu (EDF)

Empiryczna funkcja rozkładu (EDF) jest ściśle związana z ESD, szczególnie w kontekście macierzy hermitowskich, gdzie wartości własne są rzeczywiste. EDF, w tym kontekście, jest po prostu funkcją dystrybuanty odpowiadającą ESD. Zatem, dla macierzy hermitowskiej X, EDF jest zdefiniowana jako:

EDF_X(x) = F_X(x) = (1/N) ∑^N_j=1 1{λ_j ≤ x}

Wzór ten, choć prosty, jest fundamentalny. Mówi nam, że wartość EDF w punkcie x to po prostu procent wartości własnych macierzy X, które są mniejsze lub równe x. Innymi słowy, sumujemy jedynki dla każdej wartości własnej λ_j, która spełnia warunek λ_j ≤ x, a następnie dzielimy przez całkowitą liczbę wartości własnych N.

Zachowanie Widma Zbiorowego i Prawa Graniczne

Jednym z podstawowych pytań w teorii macierzy losowych jest to, czy ESD, po odpowiedniej normalizacji macierzy, zbiega się do pewnego rozkładu prawdopodobieństwa, gdy wymiar macierzy rośnie. Odpowiedzi na to pytanie dostarczają prawa graniczne, takie jak prawo półkola Wignera i prawo Marczenki-Pastura.

Czy uzgodnienie jest wiążące? — W praktyce uzgodnienie to jest wiążące dla organu wydającego decyzję środowiskową i w dużym zakresie determinuje jej treść. Ponadto postanowienie wydane przez organ uzgadniający jest niezaskarżalne, tj. nie przysługuje na nie ani zażalenie, ani skarga do sądu administracyjnego.

Prawo Półkola Wignera

Prawo półkola Wignera opisuje graniczną ESD dla macierzy Wignera. Macierz Wignera to kwadratowa macierz hermitowska, której elementy na i nad diagonalą są niezależne, mają średnią zero i wariancję jednostkową. Wigner pokazał, że oczekiwana ESD macierzy Wignera n × n z elementami gaussowskimi, pomnożona przez 1/n, zbiega się do prawa półkola, którego funkcja gęstości prawdopodobieństwa (p.d.f.) jest dana wzorem:

f(x) = (1/(2π)) √(4 - x²) 1_{[-2, 2]}(x)

dla x ∈ [-2, 2] i 0 poza tym przedziałem. Twierdzenie 3.1 w tekście źródłowym formalizuje to stwierdzenie, podając warunki zbieżności ESD znormalizowanej macierzy Wignera do prawa półkola, nawet przy minimalnych założeniach dotyczących momentów elementów macierzy.

Prawo Marczenki-Pastura

Analogiczne prawo graniczne, prawo Marczenki-Pastura, zostało wyprowadzone dla macierzy kowariancji próby. Twierdzenie 3.2 w tekście źródłowym opisuje to prawo. Załóżmy, że X jest macierzą p × n z niezależnymi i identycznie rozłożonymi elementami o średniej 0 i wariancji 1. Niech γ = lim_n→∞p/n. Wtedy, gdy n → ∞, ESD macierzy S = (1/n) XX* zbiega się prawie na pewno do rozkładu Marczenki-Pastura F_γ. Funkcja gęstości prawdopodobieństwa F_γ dla γ ∈ (0, 1] jest dana wzorem:

f_γ(x) = (√(b₊(γ) - x) √(x - b_-(γ))) / (2πγx) 1_{[b_-(γ), b₊(γ)]}(x)

gdzie b_±(γ) = (1 ± √γ)². Dla γ ∈ (1, ∞), F_γ jest mieszaniną masy punktowej w 0 i p.d.f. f_1/γ.

Prawo Marczenki-Pastura jest niezwykle ważne w analizie danych wysokowymiarowych, ponieważ opisuje rozkład wartości własnych macierzy kowariancji próby, które są powszechnie stosowane w statystyce.

Metody Badania EDF

W teorii macierzy losowych stosuje się dwie główne metody do badania zachowania EDF: metodę momentów i metodę transformaty Stieltjesa.

Metoda Momentów

Metoda momentów polega na badaniu momentów rozkładu widmowego. k-ty moment ESD macierzy X jest równy (1/N) tr(X^k). Zgodnie z Lematem 3.2, ciąg rozkładów prawdopodobieństwa {F_n} zbiega się do rozkładu F, jeśli momenty k-tego rzędu F_n zbiegają się do momentów k-tego rzędu F, a momenty graniczne spełniają warunek Carlemana (Lemat 3.1), który zapewnia unikalność rozkładu na podstawie sekwencji momentów.

Jak uzgodnić projekt? — 1) papierowej – potwierdza się przez opatrzenie go pieczęcią i podpisem; 2) elektronicznej – potwierdza się przez opatrzenie go kwalifikowanym podpisem elektronicznym oraz wydaniem dla niego karty uzgodnienia opatrzonej tym podpisem, która stanowi załącznik do projektu.

Transformata Stieltjesa

Transformata Stieltjesa jest potężnym narzędziem w RMT, podobnym do transformaty Fouriera w klasycznej teorii prawdopodobieństwa. Transformata Stieltjesa miary μ na prostej rzeczywistej jest zdefiniowana jako:

S_μ(z) = ∫ (1/(x - z)) μ(dx), z ∈ ℂ⁺

gdzie ℂ⁺ = {x + iy: x ∈ ℝ, y > 0}. Lemat 3.3 (wzór inwersyjny) pozwala na rekonstrukcję funkcji dystrybuanty z jej transformaty Stieltjesa. Lemat 3.4 daje warunki konieczne i wystarczające na to, aby granica transformat Stieltjesa ciągu miar prawdopodobieństwa była transformatą Stieltjesa miary prawdopodobieństwa.

Transformata Stieltjesa ESD macierzy W_N jest dana przez:

s_N(z) = (1/N) tr((W_N - zI_N)^-1)

gdzie I_N jest macierzą identycznościową N × N. Badanie granicy transformaty Stieltjesa s_N(z) pozwala na określenie granicznego rozkładu ESD.

Zastosowania i Rozszerzenia EDF

EDF i związane z nią prawa graniczne, takie jak prawo półkola Wignera i prawo Marczenki-Pastura, mają szerokie zastosowanie w różnych dziedzinach, w tym:

Statystyka wysokowymiarowa: EDF jest kluczowe w analizie danych, gdzie liczba zmiennych jest porównywalna lub większa od liczby obserwacji. Pomaga zrozumieć strukturę macierzy kowariancji i macierzy korelacji w takich scenariuszach.
Komunikacja bezprzewodowa: Rozkład widma macierzy losowych jest istotny w analizie systemów MIMO (Multiple-Input Multiple-Output) i innych technologii komunikacyjnych.
Fizyka statystyczna: Teoria macierzy losowych i EDF mają zastosowanie w modelowaniu układów fizycznych, takich jak szkła spinowe i układy chaotyczne.
Finanse matematyczne: EDF może być użyteczne w analizie portfeli inwestycyjnych i modelowaniu ryzyka finansowego.

Badania nad EDF stale się rozwijają, obejmując rozszerzenia na macierze o bardziej złożonej strukturze, macierze niespełniające założenia niezależności elementów, oraz badanie statystyk widmowych wyższego rzędu. Twierdzenie 3.3 i 3.4 w tekście źródłowym prezentują przykłady takich rozszerzeń, dotyczące macierzy z elementami niespełniającymi założenia i.i.d. oraz macierzy o strukturze kowariancji oddzielnej.

Pytania i Odpowiedzi (FAQ)

Co to jest Empiryczna Funkcja Rozkładu Widmowego (EDF)?: EDF to funkcja dystrybuanty opisująca rozkład wartości własnych macierzy. Mówi, jaki procent wartości własnych jest mniejszy lub równy danej wartości.
Dlaczego EDF jest ważne w teorii macierzy losowych?: EDF jest kluczowe, ponieważ wiele statystyk macierzy losowych można wyrazić za pomocą jej funkcjonałów. Prawa graniczne dla EDF, takie jak prawo półkola Wignera i prawo Marczenki-Pastura, opisują asymptotyczne zachowanie widma macierzy losowych.
Jakie metody stosuje się do badania EDF?: Głównymi metodami są metoda momentów i metoda transformaty Stieltjesa. Metoda momentów bada momenty rozkładu widmowego, a metoda transformaty Stieltjesa wykorzystuje transformatę Stieltjesa ESD.
Jakie są zastosowania EDF?: EDF ma zastosowania w statystyce wysokowymiarowej, komunikacji bezprzewodowej, fizyce statystycznej i finansach matematycznych, pomagając w analizie danych, modelowaniu systemów i zrozumieniu rozkładu wartości własnych macierzy.

Podsumowanie

Empiryczna funkcja rozkładu widmowego (EDF) jest fundamentalnym narzędziem w teorii macierzy losowych i analizie danych. Jej definicja, choć prosta, otwiera drzwi do zrozumienia skomplikowanego zachowania widm macierzy losowych. Prawa graniczne, takie jak prawo półkola Wignera i prawo Marczenki-Pastura, opisują asymptotyczne zachowanie EDF, co ma kluczowe znaczenie w wielu dziedzinach nauki i technologii. Metody momentów i transformaty Stieltjesa stanowią podstawowe narzędzia do badania EDF i jej właściwości. Zrozumienie EDF i jej wzorów jest niezbędne dla każdego, kto zajmuje się analizą danych wysokowymiarowych i teorią macierzy losowych.

Jeśli chcesz poznać inne artykuły podobne do Empiryczna funkcja rozkładu widmowego (EDF), możesz odwiedzić kategorię Rachunkowość.