Autoregresywne ruchome średnie błędy (błędy ARMA) i inne modele, w których występują opóźnienia w błędach, można oszacować przy użyciu instrukcji FIT, symulowanych lub prognozowanych przy użyciu instrukcji SOLVE. Modele ARMA dla procesu błędów są często stosowane w modelach z autokorelacjami resztkowymi. Makro AR może być używane do określania modeli z procesami błędów autoregresji. Makro MA można używać do określania modeli z ruchomymi średnimi błędami. Błędy autoregresyjne Model z błędami autoregresyjnymi pierwszego rzędu, AR (1), ma postać, podczas gdy proces usterki AR (2) ma postać i tak dalej dla procesów wyższego rzędu. Zauważmy, że s są niezależne i identyczne, a ich oczekiwana wartość wynosi 0. Przykład modelu z elementem AR (2) jest dla tak zwanych procesów wyższego rzędu. Na przykład można napisać prosty model regresji liniowej z błędami średnie MA (2), ponieważ MA1 i MA2 są parametrami średniej ruchomej. Zauważ, że funkcja RESID. Y jest automatycznie definiowana przez PROC MODEL, ponieważ w modelach MA używana jest funkcja ZLAG do obcinania rekursji opóźnień. Zapewnia to, że opóźnione błędy zaczynają się od zera w fazie zalegania i nie propagują brakujących wartości, gdy brakuje zmiennych z okresu lagowania, i zapewnia, że przyszłe błędy są zerowe, a nie zagubione podczas symulacji lub prognozowania. Szczegółowe informacje na temat funkcji opóźnienia można znaleźć w sekcji Lag Logic. Model ARMA (p, q) może mieć następującą postać: Model ARMA (p, q) można określić w następujący sposób: gdzie ARi i MA j reprezentują parametry autoregresji i ruchome-średnie dla różnych opóźnień. Możesz użyć dowolnych nazw dla tych zmiennych i istnieje wiele równoważnych sposobów, w jaki może być napisana specyfikacja. Procesy ARMA wektora można również oszacować za pomocą modelu PROC MODEL. Na przykład dwa zmienne procedury AR (1) dotyczące błędów dwóch zmiennych endogennych Y1 i Y2 można określić w następujący sposób: Problemy z konwergencją z modelami ARiMR Modele ARMA mogą być trudne do oszacowania. Jeśli szacunkowe parametry nie znajdują się w odpowiednim zakresie, wzrastające wykładniczo wzory ruchome średnioroczne wzrastają. Obliczone reszty dla późniejszych obserwacji mogą być bardzo duże lub mogą przepełnić. Może się tak zdarzyć, ponieważ użyto niewłaściwych wartości początkowych lub dlatego, że iteracje oddalały się od rozsądnych wartości. Należy zachować ostrożność przy wybieraniu wartości początkowych dla parametrów ARMA. Wartości wyjściowe równe 0,001 dla parametrów ARMA zazwyczaj działają, jeśli model pasuje dobrze do danych, a problem jest dobrze przygotowany. Zauważ, że model MA można często przybliżyć za pomocą modelu wysokiej klasy AR i vice versa. Może to powodować wysoką współliniowość w mieszanych modelach ARMA, co z kolei może powodować poważne złe warunki w obliczeniach i niestabilność szacunków parametrów. Jeśli występują problemy z konwergencją podczas szacowania modelu przy błędach ARMA, spróbuj oszacować w krokach. Po pierwsze, użyj instrukcji FIT, aby oszacować tylko parametry strukturalne z zachowaniem parametrów ARMA na zero (lub do rozsądnych wcześniejszych szacunków, jeśli są dostępne). Następnie użyj innej instrukcji FIT, aby oszacować tylko parametry ARMA, używając wartości parametrów strukturalnych z pierwszego uruchomienia. Ponieważ wartości parametrów strukturalnych prawdopodobnie zbliżą się do ich ostatecznych szacunków, szacunkowy parametr ARMA może się teraz zbiegać. Na koniec użyj innej instrukcji FIT w celu uzyskania równoczesnych oszacowań wszystkich parametrów. Ponieważ początkowe wartości parametrów mogą być dość zbliżone do ich ostatecznych wspólnych szacunków, szacunki powinny się szybko zbiegać, jeśli model jest odpowiedni dla danych. Warunki początkowe AR Początkowy okres opóźnienia błędów w modelach AR (p) można modelować na różne sposoby. Metody autoregresywnego uruchamiania błędów obsługiwane przez procedury SASETS są następujące: procedury najmniejszych kwadratów warunkowych (procedury ARIMA i MODEL) bezwarunkowe najmniejsze kwadraty (procedury AUTOREG, ARIMA i MODEL) maksymalne prawdopodobieństwo (procedury AUTOREG, ARIMA i MODEL) Yule-Walker (AUTOREG tylko procedura) Hildreth-Lu, która usuwa pierwsze obserwacje (tylko procedura MODEL) Zobacz rozdział 8, procedura AUTOREG, aby wyjaśnić i omówić zalety różnych metod uruchamiania AR (p). Inicjacje CLS, ULS, ML i HL mogą być wykonywane przez PROC MODEL. W przypadku błędów AR (1) te inicjalizacje można wyprodukować, jak pokazano w tabeli 18.2. Metody te są równoważne w dużych próbkach. Tabela 18.2 Inicjalizacja przeprowadzona przez PROC MODEL: AR (1) BŁĘDY Początkowe opóźnienia w błędach modeli MA (q) można również modelować na różne sposoby. Poniższe paradygmaty uruchamiania błędów ruchomych średnich są obsługiwane przez procedury ARIMA i MODEL: bezwarunkowe najmniejsze kwadraciki warunkowe najmniejszych kwadratów Metoda najmniejszych kwadratów warunku najmniejszych kwadratów jest nie optymalna, ponieważ ignoruje problem uruchamiania. Zmniejsza to wydajność szacunków, chociaż pozostają one bezstronne. Początkowa zalegająca reszta, rozciągająca się przed rozpoczęciem danych, przyjmuje się jako 0, ich bezwarunkową oczekiwaną wartość. Wprowadza to różnicę pomiędzy tymi resztami a uogólnionymi resztami najmniejszych kwadratów dla ruchomą średnią kowariancją, która w przeciwieństwie do modelu autoregresywnego utrzymuje się przez zestaw danych. Zwykle ta różnica szybko się zbieżna z wartością 0, ale w przypadku niemal niezmiennych ruchomej średniej procesów konwergencja jest dość powolna. Aby zminimalizować ten problem, powinieneś mieć mnóstwo danych, a szacunkowe średnie ruchome parametry powinny być dobrze w zakresie odwrócenia. Ten problem można rozwiązać kosztem napisania bardziej złożonego programu. Można bezwzględnie określić najmniejsze kwadraty dla procesu MA (1), określając następujący model: Ruchome średnie błędy mogą być trudne do oszacowania. Powinieneś rozważyć zastosowanie aproksymacji AR (p) do średniej ruchomości. Ruchome przeciętne proces może być dobrze przybliżone procesem autoregresji, jeśli dane nie zostały wygładzone lub zróżnicowane. AR Makro SAS makro AR generuje instrukcje programowania dla modelu PROC MODEL dla modeli autoregresji. Makro AR jest częścią oprogramowania SASETS i nie trzeba ustawiać specjalnych opcji, aby używać makra. Proces autoregresji może być zastosowany do błędów równań strukturalnych lub samej serii endogennych. Makro AR może być użyte do następujących typów autoregresji: nieograniczona autoregresja wektorowa autoregresja wektorowa Jednorodna autoregresja Aby obliczyć wynik błędu równania jako proces autoregresji, użyj następującej instrukcji po równaniu: Na przykład załóżmy, że Y jest liniową funkcję X1, X2 i błąd AR (2). Piszesz ten model w następujący sposób: Połączenia z AR muszą pochodzić po wszystkich równaniach stosowanych w procesie. Poprzednia makra wywołania, AR (y, 2), generuje instrukcje pokazane na wyjściu LIST na rysunku 18.58. Rysunek 18.58 Wyjście opcji LIST dla modelu AR (2) Zmienne prefiksowane PRED są zmiennymi tymczasowymi programu, tak że zwłoki pozostałości są prawidłowymi resztami, a nie tymi, które zostały ponownie zdefiniowane przez to równanie. Należy zauważyć, że jest to równoważne oświadczeniach wyraźnie napisanych w sekcji Ogólne formularze dla modeli ARiMR. Można również ograniczyć parametry autoregresji do zera przy wybranych opóźnieniach. Na przykład, jeśli chcesz, aby parametry autoregresji były opóźnione w wersjach 1, 12 i 13, możesz użyć następujących stwierdzeń: Te instrukcje generują dane wyjściowe pokazane na rysunku 18.59. Rysunek 18.59 Wyjście opcji LIST dla modelu AR z opóźnieniami 1, 12 i 13 WZÓR PROCEDURY ZAKOŃCZENIOWANIA OPISU Złożonego Kodu Z Programu jako Parsed PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y Istnieją wariantów warunkowej metody najmniejszych kwadratów, w zależności od tego, czy obserwacje na początku serii są wykorzystywane do nagrzewania procesu AR. Domyślnie metoda warunku najmniejszych kwadratów AR wykorzystuje wszystkie obserwacje i przyjmuje zera dla początkowych opóźnień w terminach autoregresji. Korzystając z opcji M, możesz zażądać, aby AR używała bezwarunkowej metody najmniejszych kwadratów (ULS) lub maksymalnego prawdopodobieństwa (ML). Na przykład omówienie tych metod znajduje się w części AR Warunki początkowe. Korzystając z opcji MCLS n, możesz poprosić o użycie pierwszych n obserwacji do obliczania szacunków początkowych opóźnień autoregresji. W tym przypadku analiza rozpoczyna się od obserwacji n 1. Na przykład: za pomocą makra AR można zastosować model autoregresji do zmiennej endogennej zamiast do terminu błędów, używając opcji TYPEV. Na przykład, jeśli chcesz dodać pięć ostatnich zwyczajów Y do równania z poprzedniego przykładu, możesz użyć AR, aby wygenerować parametry i opóźnienia, używając następujących oświadczeń: Powyższe oświadczenia wygenerują wynik pokazany na rysunku 18.60. Rysunek 18.60 Wyjście opcji LIST dla modelu AR Y Model ten przewiduje Y jako kombinację liniową X1, X2, przecięcia i wartości Y w ostatnich pięciu okresach. Nieobciążone autoregresją wektora Aby wyliczyć warunki błędów zestawu równań jako procesu autoregresji wektora, użyj następującej postaci makra AR po równaniach: wartość parametru procesu jest dowolną nazwą podawaną przez AR w celu utworzenia nazw dla autoregresji parametrów. Możesz używać makra AR do modelowania kilku różnych procesów AR dla różnych zestawów równań przy użyciu różnych nazw procesów dla każdego zestawu. Nazwa procesu zapewnia, że użyte nazwy zmiennych są unikatowe. Użyj krótkiej wartości procesu dla procesu, jeśli szacunki parametrów mają zostać zapisane w zestawie danych wyjściowych. Makra AR próbują skonstruować nazwy parametrów mniej niż lub równe ośmiu znaków, ale jest to ograniczone długością nazwy procesu. który jest używany jako prefiks dla nazw parametrów AR. Wartością variablelist jest lista zmiennych endogennych dla równań. Załóżmy na przykład, że błędy dla równań Y1, Y2 i Y3 są generowane przez autoregresywny wektor wektora drugiego rzędu. Można użyć następujących stwierdzeń: generujących następujące informacje dla Y1 i podobnego kodu dla Y2 i Y3: W procesach wektorowych można używać tylko metody warunku najmniejszych kwadratów (MCLS lub MCLS n). Możesz również użyć tego samego formatu z ograniczeniami, że współczynnik matrycy wynosi 0 przy wybranych opóźnieniach. Na przykład poniższe instrukcje stosują proces wektora z rzędu trzeciego do błędów równa ze wszystkimi współczynnikami z opóźnieniem 2 ograniczonym do 0, a współczynniki z opóźnieniami 1 i 3 nieograniczone: można modelować trzy serie Y1Y3 jako proces autoregresji wektorowej w zmiennych zamiast w błędach przy użyciu opcji TYPEV. Jeśli chcesz modelować Y1Y3 w funkcji wcześniejszych wartości Y1Y3 i niektórych zewnętrznych zmiennych lub stałych, możesz użyć AR, aby wygenerować instrukcje dotyczące terminów opóźnień. Napisz równanie dla każdej zmiennej dla nonautoregressive części modelu, a następnie wywołaj AR z opcją TYPEV. Na przykład, nonautoreresywna część modelu może być funkcją zmiennych egzogennych lub może być przechwytywanie parametrów. Jeśli nie istnieją egzogenne składniki modelu autoregresji wektora, w tym żadne przechwyty, następnie przypisać zero każdej zmiennej. Przed wywołaniem AR musi być przypisane do każdej zmiennej. Ten przykład ilustruje wektor Y (Y1 Y2 Y3) jako funkcję liniową tylko w dwóch poprzednich okresach i białego szablonu błędu. Model ma 18 (3 3 3 3) parametry. Składnia AR Macro Są dwa przypadki składni makra AR. Gdy ograniczenia dotyczące procesu AR w wektorze nie są potrzebne, składnia makra AR ma ogólną formę określa przedrostek AR dla użycia w konstruowaniu nazw zmiennych potrzebnych do zdefiniowania procesu AR. Jeśli endolista nie zostanie określony, lista dominikańska będzie niewłaściwa. która musi być nazwą równania, do którego ma zostać zastosowany proces błędu AR. Wartość nazwy nie może przekraczać 32 znaków. jest kolejność procesu AR. określa listę równań, do których ma być zastosowany proces AR. Jeśli podano więcej niż jedno imię, tworzony jest nieograniczony proces wektora z resztkami strukturalnymi wszystkich równań włączonych jako regresory w każdym z równań. Jeśli nie określono, endoliczne wartości domyślne dla nazwy. określa listę opóźnień, w których mają być dodawane AR terminy. Współczynniki terminów w przypadku opóźnień nie wymienionych na liście są ustawione na 0. Wszystkie wymienione lagi muszą być mniejsze lub równe nlag. i nie ma duplikatów. Jeśli nie określono, lista opóźnień domyślnie przyjmuje wszystkie opóźnienia od nlag. określa metodę estymacji do wdrożenia. Prawidłowe wartości M to CLS (szacunkowe najmniejsze kwadraty warunkowe), ULS (bezwarunkowe najmniejsze kwadraty) i ML (szacunki maksymalnego prawdopodobieństwa). MCLS jest domyślnym. Dopuszcza się tylko MCLS, jeśli podano więcej niż jedno równanie. Metody ULS i ML nie są obsługiwane przez modele AR AR. określa, że proces AR powinien być zastosowany do samych zmiennych endogennych zamiast do strukturalnych resztek równań. Ograniczenie autoregresji wektora Można kontrolować, które parametry są zawarte w procesie, ograniczając do 0 tych parametrów, których nie uwzględniono. Najpierw użyj AR z opcją DEFER, aby zadeklarować listę zmiennych i zdefiniować wymiar procesu. Następnie użyj dodatkowych wywołań AR, aby wygenerować terminy dla wybranych równań z wybranymi zmiennymi w wybranych opóźnieniach. Na przykład: Otrzymane równania błędów są następujące: model ten stwierdza, że błędy Y1 zależą od błędów zarówno Y1, jak i Y2 (ale nie Y3) w obu przypadkach 1 i 2 oraz że błędy Y2 i Y3 zależą od poprzednie błędy dla wszystkich trzech zmiennych, ale tylko w punkcie opóźnienia 1. AR Makro Syntakty dla Ograniczonej Wektorowej AR Alternatywne użycie AR może mieć na celu nałożenie ograniczeń na proces AR wektora, dzwoniąc do AR kilkakrotnie, aby określić różne terminy i opóźnienia AR dla różnych równania. Pierwsze wywołanie ma postać ogólną określającą przedrostek dla AR do wykorzystania w konstruowaniu nazw zmiennych potrzebnych do zdefiniowania procesu AR wektora. określa kolejność procesu AR. określa listę równań, do których ma być zastosowany proces AR. określa, że AR nie ma generować procesu AR, ale oczekuje na dalsze informacje określone w późniejszych wywołaniach AR dla tej samej wartości. Kolejne połączenia mają ogólny kształt jest taki sam jak w pierwszym wywołaniu. określa listę równań, do których mają być stosowane specyfikacje w tym wywołaniu AR. Tylko nazwy wymienione w wartości endolistycznej pierwszego wywołania wartości nazwy mogą pojawić się na liście równań w eqlist. określa listę równań, których zaległe pozostałości strukturalne mają być włączone jako regresory w równaniach w eqlist. Mogą pojawić się tylko nazwy w endolistze pierwszego wywołania wartości nazwy. Jeśli nie określono, domyślne wartości domyślne dla listy endolistów. określa listę opóźnień, w których mają być dodawane AR terminy. Współczynniki terminów w przypadku opóźnień nie wymienionych na liście są ustawione na 0. Wszystkie wymienione opóźnienia muszą być mniejsze lub równe wartości nlag. i nie ma duplikatów. Jeśli nie podano inaczej, domyślne opóźnienie dla wszystkich opóźnień od 1 do nlag. Macro Makro Makro SAS generuje instrukcje programowania dla PROC MODEL dla modeli średniej wielkości. Makro MA jest częścią oprogramowania SASETS, a nie jest wymagane specjalne zastosowanie makra. Proces przenoszenia średniej błędów może być zastosowany do błędów równań strukturalnych. Składnia makra MA jest taka sama jak makra AR, z wyjątkiem argumentu TYPE. Podczas korzystania z połączonych makr MA i AR makra MA należy postępować zgodnie z makrem AR. Następujące instrukcje SASIML powodują proces błędu ARMA (1, (1 3)) i zapisują go w zestawie danych MADAT2. Następujące instrukcje PROC MODEL są używane do oszacowania parametrów tego modelu przy użyciu struktury maksimum prawdopodobieństwa: Szacunki parametrów generowanych przez ten bieg są pokazane na rysunku 18.61. Rysunek 18.61 Szacunki z ARMA (1, (1 3)) Proces Jest dwa przypadki składni dla makra MA. Gdy nie ma potrzeby ograniczeń w procesie MA wektora, składnia makra MA ma ogólną postać określa przedrostek MA, który ma być użyty do konstruowania nazw zmiennych potrzebnych do zdefiniowania procesu MA i jest domyślnym endolistem. jest kolejność procesu MA. określa równania, do których ma zostać zastosowany proces MA. Jeśli podano więcej niż jedno imię, estymacja CLS jest używana w procesie wektora. określa opóźnienia, po upływie których mają zostać dodane warunki MA. Wszystkie wymienione opóźnienia muszą być mniejsze lub równe nlag. i nie ma duplikatów. Jeśli nie określono, lista opóźnień domyślnie przyjmuje wszystkie opóźnienia od nlag. określa metodę estymacji do wdrożenia. Prawidłowe wartości M to CLS (szacunkowe najmniejsze kwadraty warunkowe), ULS (bezwarunkowe najmniejsze kwadraty) i ML (szacunki maksymalnego prawdopodobieństwa). MCLS jest domyślnym. Dopuszcza się tylko MCLS, jeśli w endolistze podano więcej niż jedno równanie. MA Makro Syntakty dla ograniczonego ruchu wektora średniego Alternatywne użycie MA może nałożyć ograniczenia na proces wektora MA przez kilkakrotne wywołanie MA w celu określenia różnych terminów i opóźnień dla różnych równań. Pierwsze wywołanie ma ogólny formularz określający przedrostek dla MA do wykorzystania w konstruowaniu nazw zmiennych potrzebnych do zdefiniowania procesu MA wektora. określa kolejność procesu MA. określa listę równań, do których ma być zastosowany proces MA. że MA nie ma generować procesu MA, ale oczekuje na dalsze informacje określone w późniejszych wywołaniach MA dla tej samej wartości nazwy. Kolejne połączenia mają ogólny kształt jest taki sam jak w pierwszym wywołaniu. określa listę równań, do których mają być stosowane specyfikacje w tym poddziale MA. określa listę równań, których zaległe pozostałości strukturalne mają być włączone jako regresory w równaniach w eqlist. Określa listę opóźnień, po upływie których mają zostać dodane terminy MA.2.1 Przenoszenie średnich modeli (modeli MA) Modele serii czasowej znane jako modele ARIMA mogą obejmować terminy autoregresji i średnie ruchome. W pierwszym tygodniu dowiedzieliśmy się, że termin autoregresji w modelu szeregów czasowych dla zmiennej x t jest opóźnioną wartością x t. Na przykład terminem autoregresji 1 opóźnienia jest x t-1 (pomnożony przez współczynnik). Ta lekcja definiuje ruchome średnie terminy. Ruchoma średnia wersja w modelu szeregów czasowych jest błędem w przeszłości pomnożonym przez współczynnik. Niech (przewyższa N (0, sigma2w)), co oznacza, że w t są identycznie, niezależnie rozdzielane, każdy z normalnym rozkładem mającym średnią 0 i tę samą wariancję. Średni model średniej ruchomej, oznaczony symbolem MA (1) to (xt mu wt atta1w) Średni model ruchu średniego rzędu, oznaczony symbolem MA (2) to (xt mu wt atta1w theta2w) , oznaczone literą MA (q) jest (xt mu wt theta2w kropka thetaqw) Uwaga. Wiele podręczników i programów definiuje model z negatywnymi znakami przed terminami. To nie zmienia ogólnych teoretycznych właściwości modelu, chociaż odwraca znaki algebraiczne oszacowanych wartości współczynników i (niezakłóconych) w formułach ACF i wariancji. Musisz sprawdzić oprogramowanie w celu sprawdzenia, czy użyto negatywnych lub pozytywnych oznaczeń w celu poprawnego zapisania szacowanego modelu. R używa pozytywnych oznaczeń w swoim modelu bazowym, tak jak tutaj. Właściwości teoretyczne serii czasowej z modelem MA (1) Należy pamiętać, że jedyną niższą wartością w teoretycznym ACF jest opóźnienie 1. Wszystkie inne autokorelacje wynoszą 0. Tak więc próbka ACF o znacznej autokorelacji tylko w punkcie 1 jest wskaźnikiem możliwego modelu MA (1). Dla zainteresowanych studentów, dowody dotyczące tych właściwości stanowią załącznik do niniejszego materiału informacyjnego. Przykład 1 Załóżmy, że model MA (1) wynosi x t 10 w t .7 w t-1. gdzie (nadwrażliwość N (0,1)). Współczynnik 1 0,7. Teoretyczny ACF podano w poniższym wykresie ACF. Przedstawiona fabuła jest teoretycznym ACF dla MA (1) z 1 0,7. W praktyce próbka zazwyczaj nie dostarcza tak wyraźnego wzorca. Używając R, symulujemy 100 wartości próbek przy użyciu modelu x t 10 w t .7 w t-1, gdzie w t iid N (0,1). W tej symulacji powstaje ciąg szeregowy danych przykładowych. Nie możemy wiele powiedzieć z tej fabuły. Poniżej znajduje się próbka ACF dla danych symulowanych. Widzimy skok w punkcie 1, a następnie ogólnie wartości nieistotne dla opóźnień 1. Pamiętaj, że próbka ACF nie jest zgodna z teoretycznym wzorem MA (1) leżącego u podstawy, co oznacza, że wszystkie autokorelacje w przypadku opóźnień 1 będą 0 Inna próbka miałaby nieco inną próbkę ACF pokazaną poniżej, ale najprawdopodobniej miałyby takie same cechy. Właściwości terapeutyczne serii czasowej z modelem MA (2) Dla modelu MA (2), właściwości teoretyczne są następujące: Należy zauważyć, że jedynymi wartościami niezonarnymi w teoretycznym ACF są opóźnienia 1 i 2. Autokorelacje dla wyższych opóźnień to 0 Więc próba ACF o znacznych autokorelacjach w przypadku opóźnień 1 i 2, ale nieistotne autokorelacje dla wyższych opóźnień wskazują na możliwy model MA (2). iid N (0,1). Współczynniki wynoszą 1 0,5 i 2 0,3. Ponieważ jest to MA (2), teoretyczny ACF będzie miał wartości inne niż z opóźnieniami 1 i 2. Wartości dwóch niezerowych autokorelacji to wykres A teoretycznej ACF. Jak prawie zawsze jest tak, dane próbki nie zachowują się tak doskonale jak teoria. Symulujemy n 150 wartości próbek dla modelu x t 10 w t .5 w t-1 .3 w t-2. gdzie w t iid N (0,1). Sporządza się szeregowy szereg danych. Podobnie jak w przypadku szeregów czasowych dla danych próbki MA (1), niewiele można powiedzieć o tym. Poniżej znajduje się próbka ACF dla danych symulowanych. Wzór jest typowy dla sytuacji, gdy model MA (2) może być użyteczny. Istnieją dwa statystycznie istotne skoki przy opóźnieniach 1 i 2, po których następują nieistotne wartości dla innych opóźnień. Zauważ, że z powodu błędu pobierania próbek próbka ACF nie pasowała dokładnie do teoretycznego wzoru. ACF dla modeli MA (q) Modeli Ogólną cechą modeli MA (q) jest to, że dla wszystkich pierwszych opóźnień q i autokorelacji 0 dla wszystkich luków gtq istnieją autokorelacje nie zerowe. Niepowtarzalność połączenia pomiędzy wartościami 1 i (rho1) w modelu MA (1). W modelu MA (1) dla dowolnej wartości 1. odwrotny 1 1 daje taką samą wartość jak dla przykładu, użyj 0,5 dla 1. a następnie użyj 1 (0.5) 2 dla 1. Otrzymasz (rho1) 0,4 w obu przypadkach. Aby zaspokoić teoretyczne ograniczenie zwane "invertibility". ograniczamy modele MA (1) do wartości z wartością bezwzględną mniejszą niż 1. W podanym przykładzie, 1 0,5 będzie dopuszczalną wartością parametru, podczas gdy 1 10,5 2 nie będzie. Odwrotność modeli MA Model macierzowy jest odwracalny, jeśli jest on algebraiczny, odpowiadający modelowi zbiegającemu się z nieskończonym modelem AR. Zbiegając się, rozumiemy, że współczynniki AR spadają do 0, gdy wracamy w czasie. Inwersja to ograniczenie zaprogramowane w oprogramowanie serii czasowej służące do oszacowania współczynników modeli z hasłami. To nie coś, co sprawdzamy w analizie danych. Dodatkowe informacje o ograniczeniu inwersji dla modeli MA (1) podano w dodatku. Uwagi dotyczące teorii zaawansowanej. W modelu MA (q) z określonym ACF jest tylko jeden model odwracalny. Warunkiem koniecznym do odwrócenia jest fakt, że współczynniki mają takie wartości, że równanie 1- 1 y-. - q y q 0 ma rozwiązania dla y, które leżą poza okręgiem jednostkowym. R dla przykładów W przykładzie 1 wykreślono teoretyczny ACF modelu x t 10 w t. 7w t-1. a następnie symulowane n 150 wartości z tego modelu i wykreślono szereg próbkowania i próbkę ACF dla danych symulowanych. Polecenia R służące do sporządzenia teoretycznej ACF to: acfma1ARMAacf (mac (0.7), lag. max10) 10 opóźnień ACF dla MA (1) z theta1 0,7 lags0: 10 tworzy zmienną o nazwie opóźnienia w zakresie od 0 do 10 (h0) dodaje osi poziomej do wykresu Pierwsze polecenie określa ACF i zapisuje je w obiekcie (np. o nazwie acfma1 (nasz wybór nazwy). Polecenie wydruku (trzecie polecenie) powoduje błędy w porównaniu do wartości ACF dla opóźnień 1 do 10. Parametr ylab etykietuje na osi y, a główny parametr umieszcza tytuł na wykresie. Aby zobaczyć wartości liczbowe ACF, użyj komendy acfma1. Symulacje i wykresy zostały wykonane za pomocą następujących poleceń. xcarc. sim (n150, lista (mac (0.7))) Symuluje n 150 wartości z MA (1) xxc10 dodaje 10 do średniej 10. Domyślnie domyślne symulacje to 0. wykres (x, typeb, mainSimulated MA (1) data) acf (x, xlimc (1,10), mainACF dla symulowanych danych próbki) W przykładzie 2 wymyśliliśmy teoretyczny ACF modelu xt 10 wt5 w t-1 .3 w t-2. a następnie symulowane n 150 wartości z tego modelu i wykreślono szereg próbkowania i próbkę ACF dla danych symulowanych. Stosowane komendy R to acfma2ARMAacf (mac (0.5.0.3), lag. max10) acfma2 lags0: 10 (lags, acfma2, xlimc (1,10), ylabr, typh, główny ACF dla MA (2) z theta1 0,5, (x, x, x, x, x, x, x, x, x, x, x, x, y) mainACF dla symulowanych danych MA (2)) Dodatek: Dowód właściwości MA (1) Dla zainteresowanych studentów są dowody na teoretyczne właściwości modelu MA (1). Variance: (text (xt) text (mu wt theta1 w) tekst 0 (wt) tekst (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Kiedy h 1, poprzedni wyrażenie 1 w 2. W przypadku dowolnego h2, poprzednie wyrażenie 0 Powodem jest to, że z definicji niezależności wag. E (w k w j) 0 dla dowolnej kj. Ponadto, ponieważ w t oznaczają 0, E (wjwj) E (wj2) w2. W serii czasów Zastosuj ten wynik, aby uzyskać ACF podany powyżej. Inwersyjny model MA to taki, który można zapisać jako model AR nieskończonego zamówienia, który zbiega się tak, że współczynniki AR zbiegają się do 0, gdy poruszamy się nieskończenie wstecz w czasie. Dobrze wykazać inwersję modelu MA (1). Następnie zastępujemy relację (2) dla t-1 w równaniu (1) (3) (zt wt theta1 (z-taleta) wt theta1z-tal2w) W czasie t-2. równanie (2) staje się Następnie zastępujemy związek (4) dla t-2 w równaniu (3) (zt wt theta1 z - theta21w wt theta1z - eta21 (z-taleta) wt theta1z - eta12z theta31w) Gdybyśmy kontynuowali ( nieskończoność) dostaniemy model nieskończonej AR (zt wt theta1 z - theta21z theta31z-theta41z dots) Zauważ jednak, że jeśli 1 1, współczynniki mnożące opóźnienia z będą wzrastać (nieskończenie) w rozmiarze, gdy wracamy z powrotem czas. Aby temu zapobiec, potrzebujemy 1 lt1. Jest to warunek odwracalnego modelu MA (1). Model nieskoordynowanych zamówień MA W trzecim tygodniu widzimy, że model AR (1) można przekształcić w model MA nieskończonego rzędu: (xt - mu wt phi1w phi21w kropki phik1 w kropkach sumy fij1w) To sumowanie wcześniejszych białych szumów jest znane jako przyczynę reprezentacji AR (1). Innymi słowy, x t jest specjalnym rodzajem magistra z nieskończoną liczbą terminów z czasem. Nazywa się to nieskończoną kolejnością MA lub MA (). Kończy się rozkazem MA jest nieskończona kolejność AR, a dowolny porządek AR jest rzędem nieskończonym rzędu. Przypomnijmy sobie w tygodniu 1, zauważyliśmy, że wymóg stacjonarnego AR (1) polega na tym, że 1 lt1. Pozwala obliczyć Var (xt) używając reprezentacji przyczynowej. W ostatnim kroku używa się podstawowych faktów dotyczących serii geometrycznych, które wymagają (phi1lt1), w przeciwnym razie serie rozbieżności. Nawigacja w przypisie do Pankratz (1983). na stronie 48, mówi: Średnia średnica ruchoma etykiety jest technicznie nieprawidłowa, ponieważ współczynniki MA mogą być ujemne i nie mogą sumować się do jedności. Ta etykieta jest używana zgodnie z konwencją. Box i Jenkins (1976) również mówi coś podobnego. Na stronie 10: średnia ruchoma nazwy jest nieco myląca, ponieważ ciężary 1, - theta, - theta, ldots, - theta, które mnożą się jako, nie potrzebują całkowitej jedności ani nie potrzebują dodatniego. Ta nomenklatura jest jednak w powszechnym użyciu, dlatego też ją wykorzystujemy. Mam nadzieję, że to pomoże. Jeśli spojrzymy na proces zerowej średniej matematyki, to możesz uznać prawą rękę za zbliżoną do ważonej średniej ruchomej warunków wiruksylonu, ale gdzie masy nie sumują się do 1. Zauważ, że każda wartość yt może być traktowana jako ważona średnia ruchoma ostatnich kilku błędów prognozy. Podobne wyjaśnienia tego terminu można znaleźć w wielu innych miejscach. (Pomimo popularności tego wyjaśnienia, nie wiem na pewno, że jest to początek terminu, choć na przykład był to prawdopodobnie jakiś związek między modelem a przeciętnym wygładzaniem). Uwaga: Graeme Walsh wskazuje na to, komentarze powyżej, że może to pochodzić z Slutsky (1927) Sumy losowych przyczyn jako źródła procesów cyklicznych 1 Hyndman, RJ i Athanasopoulos, G. (2017) Prognozowanie: zasady i praktyka. Sekcja 84. otextsfpp84. Dostęp do 22 września 2017 r. Mając średnie i gładkie modele wygładzania Pierwszym krokiem w wychodzeniu poza średnie modele, modele chodzenia bez końca i modele trendów liniowych, nieuzasadnione wzorce i trendy można ekstrapolować za pomocą modelu ruchomego średniego lub wygładzającego. Podstawowym założeniem za modelami uśredniania i wygładzania jest to, że szereg czasowy jest lokalnie stacjonarny, a powoli zmienia się średnio. W związku z tym bierzemy ruchomą (lokalną) średnią w celu oszacowania bieżącej wartości średniej, a następnie użyć jej jako prognozy na najbliższą przyszłość. Można to uznać za kompromis między średnim modelem a modelem losowego chodzenia bez dryfu. Ta sama strategia może być wykorzystana do oszacowania i ekstrapolacji lokalnego trendu. Średnia ruchoma jest często określana jako quotsmoothedquot wersja pierwotnej serii, ponieważ uśrednianie krótkotrwałe ma efekt wygładzania uderzeń w oryginalnej serii. Dostosowując stopień wygładzania (szerokość średniej ruchomej), możemy mieć nadzieję na osiągnięcie jakiegoś optymalnego balansu między osiągnięciem modelu średniej i losowej. Najprostszym modelem uśredniania jest. Prosta (równoważona wagą) Średnia ruchoma: Prognoza dla wartości Y w czasie t1, która jest wykonana w czasie t równa się zwykłej średniej z ostatnich obserwacji m: (Tutaj i gdzie indziej będę używać symbolu 8220Y-hat8221 dla prognozowania serii czasowej Y dokonanej najwcześniej w poprzednim terminie przez dany model). Ta średnia jest wyśrodkowana w okresie t - (m1) 2, co oznacza, że oszacowanie lokalnej średniej będzie miało tendencję do opóźnienia w stosunku do prawdziwych wartość lokalnej średniej o około (m1) 2 okresów. Tak więc mówimy, że średni wiek danych w prostej średniej ruchomej wynosi (m1) 2 w stosunku do okresu, na który obliczana jest prognoza: jest to ilość czasu, w jakim prognozy będą się spóźniały za punktami zwrotnymi w danych . Na przykład, jeśli uśrednimy ostatnie 5 wartości, prognozy będą wynosić około 3 okresy późne w odpowiedzi na punkty zwrotne. Zauważ, że jeśli m1, model prostego ruchu średniego (SMA) odpowiada modelowi losowego chodzenia (bez wzrostu). Jeśli m jest bardzo duża (porównywalna z długością okresu szacowania), model SMA jest równoważny średniemu modelowi. Podobnie jak w przypadku dowolnego parametru modelu prognozowania, zwykle dostosowywana jest wartość k w celu uzyskania najlepszej jakości danych, tzn. Najmniejszych średnich błędów prognozy. Oto przykład serii, która wydaje się wykazywać losowe fluktuacje wokół średniej wolno zmieniającej. Po pierwsze, spróbuj dopasować go do modelu przypadkowego spaceru, co odpowiada prostej średniej ruchomej z jednej kadencji: model losowego spaceru reaguje bardzo szybko na zmiany w serii, ale w ten sposób robi to znacznie pobudzając kwintesencję dane (losowe fluktuacje), jak również kwotsignalquot (lokalna średnia). Jeśli weźmiemy pod uwagę prostą średnią ruchomą wynoszącą 5 terminów, otrzymamy gładszy zestaw prognoz: 5-letnia prosta średnia ruchoma daje w tym przypadku znacznie mniejsze błędy niż model losowego chodu. Przeciętny wiek danych w tej prognozie wynosi 3 ((51) 2), co oznacza, że ma tendencję do pozostawania za punktami zwrotnymi przez około trzy okresy. (Na przykład spadek koniunktury wydaje się występować w okresie 21, ale prognozy nie odwracają się do kilku okresów później). Zauważ, że długoterminowe prognozy modelu SMA to poziome linie proste, podobnie jak w przypadku losowego spaceru Model. Tak więc, model SMA zakłada, że nie ma tendencji w danych. Jednakże, mając na uwadze, że prognozy z modelu losowego spaceru są po prostu równoważne ostatniej obserwowanej wartości, prognozy z modelu SMA są równe średniej ważonej ostatnich wartości. Ograniczenia ufności obliczone przez Statgraphics w odniesieniu do długoterminowych prognoz dotyczących prostej średniej ruchomej nie są szersze, gdy horyzont prognoz wzrasta. To oczywiście nie jest poprawne Niestety, nie ma podstawowej teorii statystycznej, która mówi nam, w jaki sposób przedziały ufności powinny poszerzać się w tym modelu. Nie jest jednak zbyt trudno obliczyć empirycznych szacunków dopuszczalnych granic dla prognoz długoterminowych. Na przykład można utworzyć arkusz kalkulacyjny, w którym model SMA byłby wykorzystywany do prognozowania 2 kroków naprzód, 3 kroków naprzód itp. W ramach historycznej próbki danych. Następnie można obliczyć próbkowe odchylenia standardowe błędów w każdym horyzoncie prognozy, a następnie skonstruować interwały zaufania dla prognoz długoterminowych przez dodawanie i odejmowanie wielokrotności odpowiedniego odchylenia standardowego. Jeśli będziemy próbować 9-letniej prostej średniej ruchomej, otrzymamy jeszcze gładsze prognozy i bardziej opóźniamy: średni wiek wynosi teraz 5 okresów ((91) 2). Jeśli weźmiemy 19-letnią średnią ruchliwą, średni wiek wzrośnie do 10: Zauważ, że prognozy są już za punktami zwrotnymi o około 10 okresów. Która suma wygładzania jest najlepsza dla tej serii Poniżej znajduje się tabela porównująca ich statystykę błędów, w tym również średnia 3-letnia: Model C, 5-letnia średnia ruchoma, daje najniższą wartość RMSE przez mały margines w ciągu 3 średnie i średnie 9-dniowe oraz inne statystyki są niemal identyczne. Wśród modeli o bardzo podobnych statystykach błędów możemy wybrać, czy wolelibyśmy nieco lepiej reagować lub trochę bardziej sprawnie. (Powtórz początek strony). Browns Simple Exponential Smoothing (średnia wykładana ważona średnią ruchoma) Opisany wyżej prosty model średniej średniej ma niepożądaną właściwość, która traktuje ostatnie obserwacje równomiernie i całkowicie ignoruje wszystkie poprzednie obserwacje. Intuicyjnie dane z przeszłości powinny być dyskontowane w sposób bardziej stopniowy - na przykład ostatnie obserwacje powinny mieć nieco więcej niż druga ostatnia, a druga ostatnia powinna być nieco większa niż ostatnia z trzech, a wkrótce. Dokonuje tego prostokątny wygładzający (SES). Niech 945 oznacza stałą kwotową konsystencji (liczba między 0 a 1). Jednym ze sposobów zapisania modelu jest zdefiniowanie serii L, która reprezentuje aktualny poziom (tzn. Średnia wartość lokalna) szeregu szacowana na podstawie danych do dnia dzisiejszego. Wartość L w czasie t obliczana jest rekurencyjnie z własnej poprzedniej wartości: W ten sposób bieżąca wygładzona wartość jest interpolacją pomiędzy poprzednią wygładzoną wartością a bieżącą obserwacją, gdzie 945 kontroluje bliskość interpolowanej wartości do najnowszej obserwacja. Prognoza na następny okres jest po prostu aktualną wygładzoną wartością: równoważnie możemy wyrazić następną prognozę bezpośrednio w odniesieniu do poprzednich prognoz i wcześniejszych obserwacji w dowolnej z następujących równoważnych wersji. W pierwszej wersji prognoza jest interpolacją między poprzednią prognozą a poprzednią obserwacją: w drugiej wersji następna prognoza uzyskuje się przez dostosowanie poprzedniej prognozy w kierunku poprzedniego błędu w ułamkowej wartości 945. jest błędem dokonanym w czas t. W trzecim projekcie prognoza jest średnią ruchoma ważoną wykładnicą (tzn. Zdyskontowaną) z współczynnikiem dyskontowania 1 - 945: wersja interpolacyjna formuły prognozowania jest najprostszym sposobem użycia, jeśli model implementuje model w arkuszu kalkulacyjnym: jest on dopasowany do pojedynczą komórkę i zawiera odwołania do komórek wskazujące na poprzednią prognozę, poprzednią obserwację oraz komórkę, w której zapisana jest wartość 945. Zauważ, że jeśli 945 1, model SES jest równoważny modelowi losowego spaceru (bez wzrostu). Jeśli 945 0, model SES jest odpowiednikiem średniego modelu, zakładając, że pierwsza wygładzona wartość jest równa średniej. (Powrót na górę strony.) Przeciętny wiek danych w prognozie wygładzania według wykładników prostych i wykładniczych wynosi 1 945 w stosunku do okresu, w którym obliczana jest prognoza. (Nie powinno to być oczywiste, ale można to łatwo wykazać przez ocenę nieskończonej serii). W związku z tym, prosta średnia ruchoma przebiega za punktami zwrotnymi przez około 1 945 okresów. Na przykład, gdy 945 0,5 opóźnienie wynosi 2 okresy, gdy 945 0,2 opóźnienie wynosi 5 okresów, gdy 945 0,1 opóźnienie wynosi 10 okresów itp. Dla pewnego przeciętnego wieku (czyli ilości opóźnień), prosta prognoza wygładzania wykładniczego (SES) jest nieco lepsza od prognozy SMA (Simple moving average), ponieważ w ostatniej obserwacji obserwuje się relatywnie większą wagę. jest nieco bardziej odpowiadający na zmiany zachodzące w niedawnej przeszłości. Na przykład model SMA z 9 terminami i model SES z 945 0.2 mają średni wiek 5 lat dla danych w swoich prognozach, ale model SES daje większą wagę w stosunku do ostatnich 3 wartości niż model SMA i na poziomie w tym samym czasie nie robi nic 8220forget8221 o wartościach powyżej 9 okresów, jak pokazano na poniższym wykresie: Inną ważną zaletą modelu SES w modelu SMA jest to, że model SES wykorzystuje parametr wygładzania, który jest ciągle zmienny, dzięki czemu można z łatwością zoptymalizować za pomocą algorytmu quotsolverquot w celu zminimalizowania średniego kwadratu. Optymalna wartość 945 w modelu SES dla tej serii okazała się wynosić 0.2961, jak pokazano poniżej: średni wiek danych w tej prognozie to 10.2961 3.4 okresy, które są podobne do średniej 6-letniej prostej średniej ruchomej. Długoterminowe prognozy z modelu SES są poziomej prostej. jak w modelu SMA i modelu przypadkowego spacerowania bez wzrostu. Należy jednak pamiętać, że przedziały ufności obliczane przez Statgraphics różnią się w rozsądny sposób i że są one znacznie węższe niż przedziały ufności dla modelu losowego spaceru. Model SES zakłada, że seria jest nieco bardziej przewidywalna niż model losowego chodu. Model SES jest faktycznie szczególnym przypadkiem modelu ARIMA. tak więc statystyczna teoria modeli ARIMA stanowi solidną podstawę do obliczania przedziałów ufności dla modelu SES. W szczególności model SES jest modelem ARIMA z odmienną różnicą, terminem MA (1), a nie określonym terminem. inaczej znany jako model quotARIMA (0,1,1) bez stałej ilości. Współczynnik MA (1) w modelu ARIMA odpowiada ilościowi 1- 945 w modelu SES. Na przykład, jeśli dopasujesz model ARIMA (0,1,1) bez stałej do analizowanej serii, szacowany współczynnik MA (1) okazuje się wynosić 0.7029, czyli prawie dokładnie minus minus 0.2961. Możliwe jest dodanie założenia niezerowej stałej tendencji liniowej do modelu SES. W tym celu wystarczy podać model ARIMA z jedną różniczkową różnicą i terminem MA (1) ze stałą, tj. Model ARIMA (0,1,1) ze stałą. Prognozy długoterminowe będą wtedy miały tendencję, która jest równa średniej tendencji obserwowanej w całym okresie szacunkowym. Nie można tego zrobić w połączeniu z dostosowaniem sezonowym, ponieważ opcje dostosowania sezonowego są wyłączone, gdy typ modelu jest ustawiony na ARIMA. Można jednak dodać stałą długoterminową tendencję wykładniczą do prostego modelu wygładzania wykładniczego (z korektą sezonową lub bez), korzystając z opcji regulacji inflacji w procedurze prognozowania. Odpowiednia szybkość wzrostu kwotowania (stopa wzrostu procentowego) w danym okresie może być oszacowana jako współczynnik nachylenia w modelu liniowego tendencji dopasowany do danych w połączeniu z naturalną transformacją logarytmiczną lub może opierać się na innych, niezależnych informacjach dotyczących długoterminowych perspektyw wzrostu . (Powrót na początek strony). Browns Linear (tj. Podwójne) Wyrównywanie wykładnicze Modele SMA i modele SES zakładają, że w danych nie ma żadnego trendu (co zwykle jest OK lub przynajmniej nie jest zbyt złe dla 1- prognozy stopniowe, gdy dane są stosunkowo hałaśliwe) i można je zmodyfikować, aby uwzględnić stały trend liniowy, jak pokazano powyżej. Co z trendami krótkoterminowymi Jeśli seria wykazuje zróżnicowaną stopę wzrostu lub cykliczny wzór wyraźnie wyróżniający się w stosunku do hałasu, a jeśli istnieje potrzeba prognozowania więcej niż jednego okresu, szacunek lokalnej tendencji może być również problem. Prosty model wygładzania wykładniczego można uogólnić w celu uzyskania liniowego modelu wygładzania wykładniczego (LES), który oblicza lokalne szacunki zarówno poziomu, jak i tendencji. Najprostszym modelem trendów jest Browns liniowy model wygładzania wykładniczego, który wykorzystuje dwie różne wygładzone serie, które są wyśrodkowane w różnych punktach w czasie. Formuła prognozy opiera się na ekstrapolacji linii przez dwa centra. (Poniżej omówiono bardziej wyrafinowaną wersję tego modelu, Holt8217). Algorytm liniowy linearyzacji Brown8217s, podobny do prostokątnego modelu wygładzania, może być wyrażony w wielu różnych, ale równoważnych formach. Niewątpliwą formą tego modelu jest zwykle wyrażona w następujący sposób: Niech S oznacza pojedynczo wygładzoną serię otrzymaną przez zastosowanie prostego wygładzania wykładniczego do serii Y. Oznacza to, że wartość S w okresie t jest wyrażona przez: (Przypomnijmy, że według prostego wyrównywanie wykładnicze, to byłaby prognoza dla Y w okresie t1). Pozwólmy Squot oznaczać podwójnie wygładzoną serię otrzymaną przez zastosowanie prostego wygładzania wykładniczego (przy użyciu tego samego 945) do serii S: Wreszcie prognoza dla Y tk. dla każdego kgt1, podaje: Otrzymuje e 1 0 (to znaczy trochę oszukiwać, a pierwsza prognoza jest równa faktycznej pierwszej obserwacji) i e 2 Y 2 8211 Y 1. po których generowane są prognozy przy użyciu powyższego wzoru. Daje to takie same wartości, jak wzór na podstawie S i S, jeśli te ostatnie zostały uruchomione przy użyciu S 1 S 1 Y 1. Ta wersja modelu jest używana na następnej stronie, która ilustruje kombinację wygładzania wykładniczego z dostosowaniem sezonowym. Model LES firmy Holt8217s oblicza lokalny szacunek poziomu i trendu, wygładając ostatnie dane, ale fakt, że wykonuje to za pomocą pojedynczego parametru wygładzania, ogranicza wzorce danych, które można dopasować: poziom i trend nie mogą zmieniać się w niezależnych stawkach. Model LES firmy Holt8217s rozwiązuje ten problem przez uwzględnienie dwóch stałych wygładzania, po jednym dla poziomu i jednego dla tego trendu. W dowolnym momencie t, podobnie jak w modelu Brown8217s, szacuje się, że na poziomie lokalnym jest szacunkowa t t lokalnego trendu. Tu są obliczane rekurencyjnie z wartości Y obserwowanej w czasie t oraz poprzednich szacunków poziomu i tendencji przez dwa równania, które nakładają na siebie wyrównywanie wykładnicze. Jeśli szacowany poziom i tendencja w czasie t-1 to L t82091 i T t-1. odpowiednio, wówczas prognoza dla Y tshy, która została dokonana w czasie t-1, jest równa L t-1 T t-1. Gdy rzeczywista wartość jest zaobserwowana, zaktualizowany szacunek poziomu jest obliczany rekurencyjnie przez interpolowanie pomiędzy Y tshy a jego prognozą, L t-1 T t-1, przy użyciu odważników 945 i 1 945. Zmiana szacowanego poziomu, mianowicie L t 8209 L t82091. można interpretować jako hałasujący pomiar tendencji w czasie t. Zaktualizowane oszacowanie trendu jest następnie obliczane rekurencyjnie przez interpolowanie pomiędzy L t 8209 L t82091 a poprzednim oszacowaniem tendencji T t-1. przy użyciu odważników 946 i 1-946: Interpretacja stałej 946 wyrównania tendencji jest analogiczna do stałej stymulacji 945. Modele o małych wartościach 946 zakładają, że tendencja zmienia się bardzo powoli w czasie, podczas gdy modele z większy rozmiar 946 zakłada, że zmienia się szybciej. Model z dużą liczbą 946 uważa, że dalsza przyszłość jest bardzo niepewna, ponieważ błędy w oszacowaniu tendencji stają się bardzo ważne, gdy prognozuje się więcej niż jeden rok. (Powrót na początek strony). Stałe wygładzania 945 i 946 można oszacować w zwykły sposób minimalizując średnie kwadratowe błędy prognoz na jeden etap. Gdy to nastąpi w Statgraphics, szacunki wyniosły 945 0,3048 i 946 0,008. Bardzo mała wartość 946 oznacza, że model zakłada bardzo niewielką zmianę tendencji z jednego okresu do następnego, więc w zasadzie ten model próbuje oszacować długoterminowy trend. Przez analogię do pojęcia średniego wieku danych używanych do oszacowania lokalnego poziomu szeregu, średni wiek danych wykorzystywanych do oszacowania tendencji lokalnej jest proporcjonalny do 1 946, chociaż nie jest dokładnie taki sam . W tym przypadku okazuje się, że jest to 10.006 125. Jest to bardzo dokładna liczba, ponieważ dokładność szacowania 946 isn8217t rzeczywiście wynosi 3 miejsca po przecinku, ale ma ten sam ogólny porządek wielkości co rozmiar próbki 100, więc ten model uśrednia wiele historii w szacowaniu tendencji. Poniższa wykres prognozuje, że model LES szacuje nieco większą tendencję lokalną na końcu serii niż stała tendencja szacowana w modelu SEStrend. Ponadto szacowana wartość 945 jest niemal identyczna z uzyskaną przez dopasowanie modelu SES do trendu lub bez, więc jest to prawie ten sam model. Teraz wyglądają jak rozsądne prognozy modelu, które ma oszacować trend lokalny Jeśli wygląda to na wykresie, wygląda na to, że lokalny trend spadł na koniec serii Co się stało Parametry tego modelu zostały oszacowane przez zminimalizowanie kwadratu błędów prognoz na jeden etap, a nie prognoz długoterminowych, w których to przypadku tendencja ta ma wiele różnic. Jeśli wszystko, na co patrzysz, to błędy z jednopodstawowym wyprzedzeniem, nie widzisz większego obrazu trendów w ciągu 10 lub 20 okresów (powiedzmy). Aby uzyskać ten model bardziej zgodny z naszą ekstrapolacją danych oczu, możemy ręcznie dostosować stałą wygładzania trendu, tak aby używała krótszej linii odniesienia dla szacowania tendencji. Na przykład, jeśli zdecydujemy się ustawić 946 0.1, średni wiek danych wykorzystywanych do oszacowania tendencji lokalnej wynosi 10 okresów, co oznacza, że uśrednimy tendencję w ciągu ostatnich 20 okresów. Here8217s jak wygląda prognoza wykresu, jeśli ustawimy 946 0.1 przy zachowaniu 945 0.3. To wydaje się intuicyjnie rozsądne w tej serii, chociaż najprawdopodobniej jest to niebezpieczne, aby wyliczyć tę tendencję w przyszłości o więcej niż 10 okresów. Co ze statystykami o błędach Oto porównanie modelu dwóch modeli przedstawionych powyżej oraz trzech modeli SES. Optymalna wartość 945 dla modelu SES wynosi około 0,3, ale uzyskuje się podobne wyniki (z nieco większą lub mniejszą reakcją) przy 0,5 i 0,2. (A) Holts liniowy exp. wygładzanie z alfa 0,3048 i beta 0,008 (B) liniowe liniowe exp. wygładzanie za pomocą alfa 0.3 i beta 0.1 (C) proste wyrównywanie wykładnicze z alfa 0.5 (D) proste wyrównywanie wykładnicze z alfa 0.3 (E) proste wyrównywanie wykładnicze z alfa 0.2 ich statystyka jest prawie identyczna, więc naprawdę możemy8217t dokonać wyboru na podstawie Błędy prognozy dotyczące etapu wyprzedzania w ramach próbki danych. Musimy pogodzić się z innymi względami. Jeśli uważamy, że sensowne jest oparcie bieżącej tendencji szacunkowej na to, co wydarzyło się w ciągu ostatnich 20 okresów, możemy zrobić przypadek modelu LES z 945 0,3 i 946 0,1. Jeśli chcemy być agnostyczni, czy istnieje tendencja lokalna, jeden z modeli SES może być łatwiejszy do wyjaśnienia, a także dałby więcej prognoz średniej wielkości na najbliższe 5 lub 10 okresów. (Powrót na początek strony.) Który typ ekstrapolacji tendencji jest najlepszy: poziomy lub liniowy Dane empiryczne sugerują, że jeśli dane zostały już skorygowane (jeśli to konieczne) dla inflacji, może to być nieostrożne, jeśli chodzi o ekstrapolację krótkoterminowych liniowych trendy bardzo daleko w przyszłość. Trendy widoczne dziś mogą się spowolnić w przyszłości ze względu na różne przyczyny, takie jak nieaktualność produktu, zwiększona konkurencja i cykliczne spowolnienie gospodarcze lub wzrost w przemyśle. Z tego powodu prosty wygładzanie wykładnicze często wykonuje lepszą próbę poza próbą niż oczekiwano inaczej, pomimo ekstrapolacji tendencji poziomej. Często w praktyce często stosuje się modyfikacje trendu tłumiącego liniowego modelu wygładzania wykładniczego, aby w praktyce wprowadzić do konserwacji swój zapis konserwatyzmu. Model "LES" z tendencjami tłumionymi może być realizowany jako szczególny przypadek modelu ARIMA, w szczególności modelu ARIMA (1,1,2). Możliwe jest obliczanie przedziałów ufności wokół prognoz długoterminowych wytworzonych przez wykładnicze modele wygładzania, biorąc pod uwagę je jako szczególne przypadki modeli ARIMA. (Uwaga: nie wszystkie programy obliczają prawidłowe przedziały ufności dla tych modeli.) Szerokość przedziałów ufności zależy od (i) błędu RMS modelu, (ii) rodzaju wygładzania (prostego lub liniowego) (iii) wartości (-ów) wygładzania (a) i (iv) liczbę prognozowanych okresów. Ogólnie rzecz biorąc, odstępy czasowe rozciągają się szybciej, gdy 945 staje się większe w modelu SES i rozciągają się znacznie szybciej, gdy stosuje się linearne, a nie proste wygładzanie. Ten temat jest omówiony w dalszej części sekcji ARIMA w uwagach. (Powrót na początek strony.)
Comments
Post a Comment