#hurtowniedanych

03.07.2023, 18:04:59

0

Cześć Mirasy ( ͡° ͜ʖ ͡°) możecie polecić jakąś praktyczną książkę o projektowaniu hurtowni danych (najlepiej w formacie na #kindle byłoby super gdyby była po polsku) Na podyplomówce z #hurtowniedanych w 2015/16 profesor z #politechnikapoznanska polecał coś podobnego chyba nawet swego autorstwa, ale nie mogę sobie przypomnieć :(
#it #bi #businessintelligence #programista15k #bazydanych

c.....s

konto usunięte 03.07.2023, 18:34:00 via Wykop

2

@michoopro: https://aatinegar.com/wp-content/uploads/2016/05/Kimball_The-Data-Warehouse-Toolkit-3rd-Edition.pdf

siaomilepszy

04.07.2023, 08:09:35 via Wykop

2

@michoopro: jak kolega wyżej podał, jeśli projektowanie hurtowni, to tylko biblia od Kimballa. Generalnie nie polecam się uczyć niczego po polsku w IT, od razu po angielsku. Więcej materiałów, znasz od razu słowa kluczowe, które czasem nie mają dobrego tłumaczenia na polski. Co do samej książki to jest co prawda napisana dość ciężkim językiem i momentami czyta się ją ciężko i nudno ale otwiera głowę w kwestii hurtownii i jak

michoopro

12.10.2022, 21:32:14

2

Cześć, czy znacie jakieś strony, gdzie można się bezpośrednio zatrudnić w IT #bazydanych #hurtowniedanych #sql w kraju, który płaci w #usd - pewnie głównie USA?
Czy kojarzycie firmy działające w Polsce, które nie przeliczają na PLN tylko dają pensję w $ ?
Czy są jakieś problemy np. z US gdy mieszka się w #polska a pracuje dla #usa?
#

smokestack

13.10.2022, 17:38:23 via Wykop Mobilny (Android)

1

@michoopro: często trzeba być wieczorem na callach. A tak to tylko plusy ;)

smokestack

13.10.2022, 17:38:59 via Wykop Mobilny (Android)

1

@michoopro: trochę jest więcej czarowania na jdg z różnicami kursowymi, więc dobra księgowa się przyda

ode45

04.07.2021, 11:07:46

0

Ma ktoś do polecenia jakąś dobrą książkę w tematyce hurtowni danych? Chodzi o jakieś podstawy od zera dotyczące projektowania/ architektury itp. napisane językiem dla świeżaka. Jestem w trakcie książki "Modelowanie tabelaryczne" Russo, Ferrari i jak wspomnieli we wstępie, trochę się do tego odwołują i jednak stwierdzam, że potrzebuję więcej teorii w tym temacie ( ͡° ʖ̯ ͡°)

#businessintelligence #hurtowniedanych #powerbi #bazydanych

matti05

04.07.2021, 14:52:15 via Wykop Mobilny (Android)

1

@ode45: Kimball

norbertkulski

04.07.2021, 20:42:59

0

@ode45: Jeśli zacząłeś od Russo i Ferrari to Kimball będzie absolutną klasyką - jak doradza @matti05 . https://www.kimballgroup.com/data-warehouse-business-intelligence-resources/books/ .
ETL Toolkit trochę się zestarzał ale Dimensional Modelling cały czas daje radę.

Jeśli interesujesz się bardziej unowocześnionym podejściem to Star Schema Adamsona lub Agile Data Warehouse Design Corra przy czym ta druga pozycja skupia się bardziej na metodyce zwinnej dostarczania hurtowni. Tylko one i tak mają korzenie (a nawet i

coldsurgeon25

04.03.2021, 05:55:31

0

Mirki z tagu #programista15k #programowanie od niedawana pracuję w firmie, gdzie tworzymy hurtownie danych dla takiego jednego banku w Polsce ( ͡° ͜ʖ ͡°). Dołączyłem od już do rozwijanego projektu i jako nowy developer zauważyłem kilka problemów jednym z nich jest brak chociaż 1 strony, powiedziałbym nawet brak pół strony dokumentacji jakiejkolwiek. I chciałbym jakoś to mniej więcej zacząć ogarnąć. W poprzednich firmach pisałem

obieq

04.03.2021, 08:08:15

3

@coldsurgeon25: zacznij dokumentacje od podania telefonu do osoby, która robiła hurtownię to zaraz sama się
napisze

JamesikR

04.03.2021, 14:39:47

1

@coldsurgeon25: Taktyk. Jak znajdziesz coś wartościowego, to dawaj znać :)

coldsurgeon25

11.02.2021, 14:49:17

2

Chciałbym się podszkolić pod kątem architektury hurtowni danych i modelowania danych. Mirki spod tagu #programista15k doradźcie co warto przeczytać na początek. Co sądzicie o tych trzech pozycjach, które znalazłem na helion.pl:
- Hurtownie danych. Od przetwarzania analitycznego do raportowania
- Modelowanie danych
- Korporacyjne jezioro danych. Wykorzystaj potencjał big data w swojej organizacji

#hurtowniedanych #bazydanych #sql #it

janek_

11.02.2021, 14:53:05

8

Kimball - data warehouse toolkit

ShortyLookMean

11.02.2021, 18:58:59

0

@coldsurgeon25: Zatrudnij się w restauracji #pdk

inny_89

25.01.2021, 20:07:55 via Android

1

Potrzebuję zrobić #hurtowniedanych w #sqlserver ale jako narzędzie do #etl służy mi #spark, a konkretnie #pyspark

Macie może jakieś dobre materiały albo przykładowe kody, żeby podejrzeć jakieś dobre praktyki?

Jak ogarnąć slow changing dimension? Metadane itp.?

t.....h

konto usunięte 25.01.2021, 21:20:08

1

@inny_89: Z doświadczenia to całe zasilanie powinno się odbywać w dwóch krokach Source - Extract, Extract - Stage. Oczywiście mówię o hurtowni zasilanej raz na dobę nocną porą.

1. Source - Extract - truncate docelowych tabel i zasilenie ze źródła. Tak jest najszybciej. Nawet jak masz tabele do 100 mln rekordów. Z produkcji zasilamy dane tak szybko jak to jest możliwe.

2. Extract - Stage - zasilenie przyrostowe. I tu już można

Ark00

25.01.2021, 21:29:34

1

@inny_89: https://stackoverflow.com/questions/38487667/overwrite-specific-partitions-in-spark-dataframe-write-method

Ustawia się to jedną linijką w configu:

spark.conf.set("spark.sql.sources.partitionOverwriteMode","dynamic")

Wybacz też wysoki poziom abstrakcji przy opisywaniu

inny_89

15.08.2020, 20:11:40

0

Panowie od #bazydanych #datawarehouse #hurtowniedanych
Projektuje sobie design finalnego schematu DWH, który chcemy zbudować.

I teraz tak:
- mamy naprawdę spory zespół. A sam projekt schematu finalnej DWH jest dosyć lekko mówiąc "płynny"
- działania chociaż zmierzają w dobrym kierunku to czasami są nieco nieskoordynowane

m.....i

konto usunięte 16.08.2020, 07:45:42

2

@inny_89: może ty data lake wdrażasz tylko jeszcze tego nie wiesz :D ?

m.....i

konto usunięte 16.08.2020, 08:05:15

1

@inny_89: raczej nie ma tu idealnego toola i zawsze zostanie trochę ręcznej roboty. Ja kiedyś przy pomocy sqldbm.com robiłem docelowy diagram i porównywałem ze stanem faktycznym przy pomocy reverse engineera czyli importowania skryptów ddl. Dla SQL Server nawet dobrze to chodziło. Notatki dodawałem albo tam na diagramie, albo w samym projekcie (komentowanie wersji) no i osobno jeszcze to było kopiowane/komentowane w narzędziu do zarządzania projektami.

batek254

02.05.2020, 13:02:40

0

Mirki, jak uczyliście się o hurtowaniach danych? Ostatnio bardzo zaciekawił mnie temat, a nie wiem jak się za to zabrać dobrze. Wykładowca pokazał nam taką książkę: https://docplayer.pl/14657239-Marcin-gorawski-michal-jan-gorawski-slawomir-bankowski-hurtownie-danych.html. Warto to czytać, czy może znacie bardziej efektowne dane, czy lepsze książki lub kursy ( ͡° ͜ʖ ͡°) Co do narzędzi, to jednak MS SQL Server, gdyż nie chcę za bardzo uciekać z tematem poza syllabus w tym momencie. Jeśli chodzi

matti05

02.05.2020, 13:27:17

1

@batek254: Kimball

mk321

23.10.2019, 17:57:53

0

#bazydanych #sqlserver #oracle #programowanie #java #hurtowniedanych

Mam bazę danych z wieloma tabelami. Jakiego użyć narzędzia, żeby przeanalizować dane w tej bazie?
Chodzi o podgląd tabel, zliczenia, agregacje, jakieś wykresy, porównania itd.

Teoretycznie mógłbym wszystko napisać z palca SQL-em i zrobić wykresy w Javie. Docelowo właśnie tak będę chciał robić raporty i jakieś bardziej skomplikowane rzeczy.

modzelem

23.10.2019, 18:11:33

1

Bazę mam Oracle

@mk321: może apex?

Koliat

23.10.2019, 18:23:48

1

@mk321: W raportach najwięcej czasu przede wszystkim tworzy się na logike i pracę nad przekształceniami danych. Jak będziesz chciał odejść od PowerBI to i tak cały "know-how" raportu masz gotowy, i przeniesienie tego na inny soft to będzie chwila roboty tylko. No i PowerBI wspiera skrypty Python/R ;-)
https://www.datacamp.com/community/tutorials/data-visualisation-powerbi#r_and_python

admin_admin

23.08.2019, 07:28:37

3

Mirki, mam pytanie do specjalistów od architektury hurtowni danych pod PowerBI.
Aktualnie posiadamy w firmie kostki OLAP zasilane pakietami SSIS z ERP do bazy pośredniej (Stage) i następnie po przetworzeniu do hurtowni danych. Kostki OLAP utworzone są w modelu wielowymiarowym, serwer od kostek jest pozostałością po starej wersji Axapta ERP i jest w wersji SQL 2008 Standard, nowszy serwer pod ERP ma wersję SQL 2012 Standard.
Możliwe jest przerobienie wspomnianych kostek na

m.....i

konto usunięte 23.08.2019, 08:34:34

2

@admin_admin: A co chcesz osiągnąć? Chcesz po prostu mieć Dashboardy z Power BI na obecnych strukturach danych (kostkach)? Bo wtedy mógłbyś użyć Live Connection do SSAS ale to niestety wymaga by Analysis Services było Enterprise dla 2012, 2014 lub 2016, 2017 Standard, wiec musielibyście podnieść wersje. Ale wtedy każdy w Power BI Desktop mógłby darmowo łączyć się do kostek i tworzyć z nich dashboardy, a z Power BI Pro miałby

m.....i

konto usunięte 23.08.2019, 08:50:57

4

@madry_i_mieciutki: opiszę ci jeszcze typy wdrożeń pod Power BI z jakimi miałem do czynienia:

1) to pierwsze, czyli hurtownia i kostka OLAP (wielowymiarowa) stoi na Analysis Services (2012, 2014 Enterprise albo 2016, 2017, 2019 Standard). Wtedy możliwe jest Live Connection. Z Power BI Desktop za darmo a jak ktoś chce mieć apkę na telefonie albo PowerBI.com to musi mieć Pro (per user) by korzystać. Uprawnienia są po stronie serwera OLAP.

FishyGuy

24.07.2019, 15:41:40

0

Mirczkami mam pytanie. W pracy "przypadkiem" nauczyłem się #sql i do tego #ssrs - sql server reporting service (pozdrawiam 2 obserwujących :D). Mam doświadczenie pomniejsze w #csharp i #python. Jest jakiś sensowny kierunek komercyjny, który można obrać mając w zanadrzu głównie SQL? Słyszałem o #businessintelligence ale nie wiem czy to sensowny kierunek(przynajmniej przy ssrs który jest mega toporny). Może jakieś #

d.....k

konto usunięte 24.07.2019, 18:01:24

2

@FishyGuy: Jeśli interesuje Cię "prawdziwe programowanie" to BI nie jest takowym, zdarzają się ale mało jest ofert gdzie zajmujesz się tylko i wyłącznie pisaniem kodu. Co Cię czeka w tej branży to tworzenie raportów i kontakt z klientem albo analitykami, raz mniej, raz więcej, zależy od projektu i profilu firmy. Jeśli wystartujesz w firmie, która zajmuje się typowymi wdrożeniami dla innych to spotkasz się też z analizami podczas których będziesz

m.....i

konto usunięte 25.07.2019, 08:25:39

2

@FishyGuy: imho spokojnie mozesz zostać w środowisku SQL Servera. Tu już jest wiele opcji. Na BI najlepiej na początku być fullstackiem czyli liznąć wszystkiego po trochu tj. raportowanie (SSRS, Power BI, Excel, customowe mniej znane rozwiązania), ETL (SQL Server + SSIS, Azure Data Factory, ew. jakiś framework/DWA toole na to), tworzneie kostek OLAPowych (Analysis Services) Sama teoria dotycząca tworzenia hurtownii danych też jest potrzebna o ile nie planujesz zostać zwykłym

inny_89

26.06.2019, 21:02:57

4

Pytanie na serio:
Jaka przyszłość czeka język #scala?
Warto się tego trzymać? Aktualnie coś się bawię w jednym projekcie w firmie na Databricksach i głównie piszemy w Pythonie/pyspark ale przyznam szczerze ciągnie mnie do Scali niemiłosiernie.
Z drugiej strony większość projektów w mojej firmie piszą w #dotnet i jak już skończę ten projekt to w .net bym miał większe pole manewru.

Koncepcja Scali odpowiada mi przez jej wszechstronność. Ogarnę

inny_89

26.06.2019, 21:16:05 via Android

4

@Felonious_Gru czyli mamy na razie 2 co nie wie.

Felonious_Gru

26.06.2019, 21:18:29

9

@inny_89: czyli opinie ekspertów są zgodne

Trent

07.12.2018, 17:46:13

0

Mirki potrzebne wsparcie!
Dostałem zadnie do wykonania jako projekt na studia:
"Pomyśl, jaką hurtownię danych mogłaby stworzyć firma, w której pracujesz?
Czego oczekiwaliby kierownicy i analitycy biznesowi od takiej hurtowni?
Jakiego rodzaju analiz?

Polinik

07.12.2018, 18:16:49

0

@Trent:
No to w czym problem?

Przykładowe raporty i analizy.

Ile średnio/max

Trent

07.12.2018, 18:22:11

0

@Polinik: ooooo. no wlasnie o cos takiego mi chodzilo :) teraz jakość pójdzie( ͡° ͜ʖ ͡°) dzięki Ci

mk321

15.09.2018, 09:25:22

1

#hurtowniedanych #bazydanych #java #oracle #datascience

Mam dużą bazę danych. Jednak czasem oprócz zwykłych operacji potrzebuję generować jakieś raporty czy zestawiania. Oczywiście jest to bardzo obciążające dla bazy danych (trwa to długo, przy generowaniu spowalnia cały system).

Pomyślałem, że chciałbym postawić obok coś w stylu hurtowni danych tylko do tych raportów i zestawień. Co ileś dni dane byłyby przerzucane z operacyjnej bazy do tej

Ark00

15.09.2018, 10:57:12

0

@mk321: Spark jest popularny w światku jvm i rozwijany, teraz cisną bodajże structured streaming, generalnie do etl i ml się nadaje

Zeppelin, hmm... Też jest rozwijany chociaż nie widzę, żeby w jakimś szybkim tempie, wizualizacje, zależnie jak skomplikowanych potrzebujesz, są raczej dosyć proste, nie ma zbyt zaawansowanych opcji tworzenia wykresów, do tego lepiej użyć innych narzędzi, D3, matplotliby, ggploty czy co tam jeszcze jest w data analitycs popularne, ja używałem

Ark00

15.09.2018, 10:57:46

0

Komentarz usunięty przez autora

bekawpracy

19.06.2018, 11:20:48

2

#pracbaza #programowanie #hurtowniedanych #pytanie #pomocy czy ktoś z tu obecnych jest w stanie poratować wiedzą z SYBASE IQ 15.4 ?

Dawidk01

09.06.2018, 19:53:59

2

#sql jako początkujący kolejne pytanie. Czy można zrobić z bazy #hurtowniedanych bez użycia Visual Studio i tak dalej? Mam tylko chyba SSMS zainstalowane. #programowanie

Rokuto

09.06.2018, 21:08:14

2

@Dawidk01: to się dowiedz co masz zrobić, skoro to projekt na studia... Do czego ci ten ETL się przyda, skoro ty nie wiesz co masz zrobić?

inny_89

09.06.2018, 21:48:22

2

@Rokuto: To się SSDT nazywa. Ten dodatek.

L.....r

konto usunięte 15.06.2016, 04:48:06

1

Treść przeznaczona dla osób powyżej 18 roku życia...

peyote1232

15.06.2016, 08:46:04

1

@Lunder: Link Może pomoże.

Darjo

15.06.2016, 10:38:43

1

@Lunder: nie pamiętam z czego dokładnie korzystałem (ale chyba była to więcej niż jedna instrukcja), ale może ten link będzie pomocny: http://pentaho-bi-suite.blogspot.com/2014/01/installation-of-pentaho-501-ce-with.html

aleksander_z

03.06.2016, 17:25:30

1

Może jakiś ogarnięta Mirabelka (ostatecznie może być Mirek) chce ciężko pracować przy #hurtowniedanych (administracyjnie głównie przepychanie ETL, zarządzanie hurtownią + pomniejszymi aplikacjiami) we Wrocławiu w Banku Zachodnim
http://www.pracuj.pl/praca/informatyk-ds-zarzadzania-i-administrowania-systemami-it-wroclaw,oferta,4617723

#praca #teradata #dwh

jarpen1234

25.05.2015, 17:23:56

3

Wiecie może jak w Pentaho wrzucić parametr wejściowy z transformacji do where w zapytaniu? Próbuję czegoś takiego:

SELECT
id
, year
, month

matju

25.05.2015, 18:59:49

0

@jarpen1234: To parametr? WHERE id = $P{timeId}

jarpen1234

25.05.2015, 19:05:31

0

Właśnie udało mi się ogarnąć. Nie zaznaczyłem 'Replace variables in script' przy ładowaniu z tabeli. Zadziałało z samym dolarem, bez 'P'. W każdym razie dzięki za pomoc.

szymciak

23.08.2014, 13:25:26

1

instalacja SQL Server 2014 zakończona niepowodzeniem ... sprzęt za słaby .. nawet virtualka nie dała rady ..

swoją drogą ktoś bawił się już SQL 2014?

#informatyka #sql #hurtowniedanych