Trénovací množina


Trénovací množinu vytvoříme přímo z časové řady jednoduše tak, že jako vstupy vezmeme určitý počet naměřených hodnot a jako požadovaný výstup hodnotu (případně hodnoty) v určité vzdálenosti od vstupních hodnot. Vstupní část časové řady se nazývá okno, výstupní část je predikovaná hodnota. Posunem tohoto okna po časové řadě vytváříme položky trénovací množiny (viz obrázek 3). Je vhodné ponechat část naměřené řady pro testování, tzn. nepředkládat tuto část časové řady při učení, ale použít jí pro testování naučenosti sítě.

Takto získanou trénovací množinu je ještě třeba upravit dle konkrétní použité sítě, například přepočítat získané hodnoty do určitého intervalu.

Vytváření trénovací množiny

Obrázek 4 - Vytváření trénovací množiny

Data, která máme k dispozici, se často rozdělují na učící řadu, validační řadu a testovací řadu. Tyto tři řady se mohou vzájemně částečně překrývat (viz obrázek 5) a nemusí být souvislé. Učící řada je posloupnost, kterou předkláme síti, a dle které síť upravujeme. Odchylku v odpovědích na validační řadu používáme jako kritérium pro ukončení učení sítě. Testovací řadu pak použijeme na test naučenosti sítě pro hodnoty v budoucnosti, které síť během učení "neviděla".

Učící řada tedy slouží na hledání modelu, validační řada na ověřování modelu a testovací řada na test použitelnosti modelu.

Rozvržení dat

Obrázek 5 - Příklad rozvržení validační, učící a testovací řady

Důležité je též předzpracování dat. Je například vhodné z časové řady odstranit trend a jiné složky (např. sezónní), pokud jsme ovšem tyto složky schopni identifikovat.

Zvláště pro neuronové sítě (které mají výstupy v určitém intervalu) platí, že nelze úspěšně předpovídat hodnoty mimo předem daný interval. Přehled o dekompozici časových řad lze získat z literatury.



Předchozí - Učení neuronové sítě           Další - Příklad - hodnota funkce


(c) Marek Obitko, 1999 - Terms of use