BAKK >> Hurtownie danych
Hurtownie danych - insideDlaczego hurtownie danych przynoszą korzyści? Czym się różnią od systemów transakcyjnych? Jak stwierdzić, czy firma potrzebuje hurtowni danych? Na te pytania staramy się znaleźć odpowiedzi w tym artykule.

Hurtownie danych inside: Czemu potrzebuję hurtowni danych, czym się charakteryzuje hurtownia danych, że jej potrzebuję?
Hurtownia danych to najtańszy sposób na uzyskanie pełnego, spójnego obrazu działalności firmy. Dzieje się tak m.in. dlatego, ponieważ dane w firmie są przechowywane w wielu systemach, które na dodatek są budowane w sposób zoptymalizowany i dostosowany do pracy w trybie obsługi działalności. W efekcie, w każdej normalnej firmie są dwie kategorie przeszkód w uzyskaniu spójnego obrazu działalności korzystając bezpośrednio z systemów transakcyjnych: systemów transakcyjnych jest wiele, systemy transakcyjne są zoptymalizowane pod obsługę transakcji.
Na czym to technologicznie polega – m.in. na zastosowaniu odmiennego modelu danych.
Struktura relacyjna znormalizowana
Najbardziej odpowiednim modelem danych do realizacji systemów transakcyjnych są modele releacyjne znormalizowane:
 |
 |

Struktura relacyjna 'gwiazdy'
Podczas, gdy do potrzeb wsparcia raporów i analiz stosuje się odmienne struktury relacyjne. Poniżej opisana struktura ma branżową nazwę 'gwiazdy', która charakteryzuje się tym, iż do jednej tabeli faktów powiązanych jest wiele tabel wymiarów, lecz tabele wymiarów już nie są łączone z dalszymi tabelami wymiarów. W środku diagramu znajduje się tabela faktów, w niej zapisane są dane dotyczące operacji prezentowanych w hurtowni danych. Każda operacja odnosi się do pewnego kontekstu - znajduje się w pewnym wymiarze, tę rolę pełnią tabele wymiarów. Z poniższego przykładu fakt - sprzedaż, dotyczy wymiarów - czasu, klienta, produktu oraz punktu sprzedaży.
 |
 |

Struktura płatka śniegu
Następną stosowaną przy budowie hurtowni danych strukturą relacyjną jest tzw. 'struktura płatka śniegu'. Odróżnia się ona od struktury 'gwiazdy', tym iż występują w niej relacje pomiędzy tabelami wymiarów. Relacje te opisują hierarchie. Z poniżej wymienionego diagramu wynika m.in. iż wymiar produkt ma dwie hierarchie - według producentów i według grup produktów.
Struktury wielowymiarowe
Ostatnia charakterystyczna dla hurtowni danych struktura zapisu danych to struktura wielowymiarowa. Bardzo różni się ona od struktur relacyjnych - ponieważ technologicznie wymaga zupełnie innej platformy. Zaletą wielowymiarowej postaci zapisu jest możliwość przechowywania zapisanych wartości agregatów, podczas gdy opisane wyżej struktury relacyjne wyliczają agregaty na każde zapytanie.Jaką technologię zapisu danych w hurtowni danych wybrać?
Wynika z powyższego, że można oprzeć raportowanie bezpośrednio o systemy transakcyjne, lecz należy to porównać do nabierania zupy z garnka używając łyżki do herbaty – jeśli zupy jest mało, to da się to zrobić i można nie kupować chochli, lecz jeśli zupy jest dużo to zupełnie nieopłacalne jest 'oszczędzanie' na zakupie chochli. (Zawsze można również podejść w sposób 'a po co mam nabierać zupę' – i nie robić raportów wogóle, bądź robić raporty szczątkowe.)
Powracając do pytania zasadniczego - którą technologię zapisu wykorzystać przy budowie hurtowni można wskazać pewne ogólne zasady:
- struktura gwiazdy - proste dane, nie wykorzystujące wielu hierarchii, ani hierarchii wielopoziomowych
- struktura płatka śniegu - dane przedstawiane w wielu hierarchiach
- struktury wielowymiarowe - dane wymagające przedstawiania agregatów wielopoziomowych hierarchii, lecz nie prezentowane w zbyt wielu wymiarach - bariera jest uzależniona od producenta platformy, lecz upraszczając można przyjąć że jest to 8 wymiarów.
Dalsza tematyka hurtowni danych: