Wpis z mikrobloga

Mam pytanie o stosowaną praktykę robienia modelu danych w PowerBi. Spotkałem ostatnio model danych o takiej budowie stąd moje pytanie.
Otóż mam np. tabele z listą placówek banku i m.in. takie kolumny: ulica, miasto, kraj, kod pocztowy, typ banku itp.

Czy jest to powszechna praktyka, aby stworzyć dimension tables jako "reference" do głównej tabeli do prawie każdej kolumny? Wtedy wyjdzie bardzo dużo tabel z jedną kolumną z unikalnymi danymi i jedną jako index.

Czyli np. dimmiasto, dimkraj itpd. Każda taka tabela miałaby tylko 2 kolumny, index i dane np. miasto, kraj itd.

Później tabę faktów również stworzona jako reference zrobić merge po nazwie np. miasta, kraju tak żeby finalnie zamiast nazw miast, kraów, kod u pocztowego itp. był tylko numer indexu z dimension table?

Czy jest to praktyka którą się stosuje? Stworzy to wiele różnych tabel z jedną właściwie kolumną, ale za to tabela faktów powinna być "lżejsza". Ewentualnie kiedy stosuje się taki model danych?

#powerbi #businessintelligence
  • 3
@excelfinance nie ma to najmniejszego sensu, modelu to nie odchudzi, bo takie działanie to symulowanie kompresji którą power bi sam przeprowadza zaocznie.

Tabela o której wspominasz, jesli zawiera tylko jeden rekord per placówka, to raczej sama bardziej spełnia definicje tabeli wymiarów niż faktów i nie ma sensu dalszego jej rozkładania.
Jesli zależałoby Ci na jakiejkolwiek optymalizacji objętości modelu to mógłbyś wywalić kolumne z państwem i zrobic jeden index "geo", na podstawie miasta