Zaloguj się Wypróbuj za darmo

Technologia

Wyszukiwanie danych według zadanych warunków

Narzędzia związane z eksploracją baz danych umożliwiają efektywne i szybkie znalezienie konkretnych interesujących użytkownika danych spośród setek tysięcy dostępnych w zintegrowanych bazach danych.

Parametry wyszukiwania dotyczące na przykład nazwy lub okresu czasowego dla którego zmienne są dostępne w bazie, wprowadza się elastycznie w zależności od potrzeb i stopnia skomplikowania procesu wyszukiwania.

Przekształcanie i czyszczenie danych

Przekształcanie i czyszczenie danych ma na celu uzyskanie takiej postaci , która najlepiej nadają się do budowy i optymalizacji modeli analizowanych zjawisk.

Funkcje realizowane w ramach czyszczenia i przekształcania danych:

  • Automatyczne przekształcanie interwałów czasowych danych – stosowane w zależności od tego, czy użytkownik buduje swoje analizy i modele na danych dziennych, miesięcznych kwartalnych i innych
  • Uzupełnianie brakujących danych
  • Weryfikacja poprawności danych
  • Przekształcenia funkcyjne danych – tak aby dane były jak najłatwiej przyswajane przez modele matematyczne

Analiza pojedynczych szeregów czasowych

Funkcje realizowane w ramach analizy pojedynczych szeregów czasowych:

  • Obliczanie statystyk , histogramów i rozkładów szeregu czasowego
  • Analiza widma szeregu czasowego – umożliwia uzyskanie informacji o cyklach czasowych związanych z szeregiem czasowym
  • Dekompozycja szeregu na:
    • Składnik trendowy – odpowiedzialny za długoterminowe zmiany szeregu czasowego
    • Składnik sezonowy – odpowiedzialny za krótko lub średniookresowe zmiany cykliczne

Analiza współzależności między danymi

Analiza współzależności ma zwykle na celu wyselekcjonowanie grupy danych mających wpływ na analizowane zjawisko czy proces. Na ich podstawie budowany jest model matematyczny opisujący to zjawisko.

Jeżeli model ma charakter prognostyczny, to można powiedzieć że prognoza wykonywana jest w oparciu o dane wyselekcjonowane w procesie analizy współzależności

Funkcje realizowane w ramach analizy współzależności między danymi:

  • Wyszukiwania zbioru danych powiązanych z analizowanym zjawiskiem
  • Wyszukiwanie podobieństw na poziomie składników widmowych . Przeszukanie baz pod kątem znalezienia danych podobnie zachowujących się w określonych horyzontach czasowych, czyli na przykład danych powiązanych ze sobą na poziomie zmian miesięcznych dziennych czy innych
  • Optymalizacja pojemności informacyjnej wyselekcjonowanego zbioru. Po procesie optymalizacji zbiór powinien:
    • jak najlepiej opisywać analizowane zjawisko
    • nie zawierać danych nadmiarowych – zbyt do siebie podobnych. Powielanie prawie takich samych danych
    • nie wnosi niczego nowego do zbioru a powoduje niepotrzebny wzrost wielkości modelu matematycznego i wydłużenie czasu jego optymalizacji

Budowa i optymalizacja modeli matematycznych

  1. Podczas budowy i optymalizacji modeli wykorzystywane są zbiory danych uzyskiwanych w procesie analizy współzależności.
  2. Modele mogą mieć tylko charakter opisujący dany proces jak również prowadzić do uzyskania prognoz dotyczących analizowanego zjawiska
  3. Możliwe jest definiowanie różnych funkcji celu procesu optymalizacji . Na przykład użytkownik może chcieć uzyskać model najlepiej dopasowany pod względem minimalizacji błędu prognozy lub maksymalizacji współczynnika korelacji
  4. Zoptymalizowane modele po zasileniu spływającymi na bieżąco danymi służą do uzyskiwania bieżącej wiedzy lub prognoz