#inzynieria #engineer #datascience #data #it #zarzadzanie #management #praca #kariera #pracait #pracazdalna
#holandia #niemcy #expat

Hej Mirki i Mirabelki ( ͡° ͜ʖ ͡°)
Zastanawiam się co zrobić ze swoim życiem... Od momentu ukończenia studiów (mgr inż. na PW), czyli od dwóch lat pracuję i mieszkam w Holandii. Korpo międzynarodowe, inżynier mechanik - konstruktor. Przez kolejne niecałe 3 lata mam przywilej podatkowy - 30% rulling. Chcę przepracować te minimum 5

Co zrobić?

  • Management 18.0% (11)
  • Niemiecki + przeprowadzka do Niemiec 49.2% (30)
  • Data analysis/IT 31.1% (19)
  • Inne (komentarz mile widziany :)) 1.6% (1)

Oddanych głosów: 61

@inny_89: Z doświadczenia to całe zasilanie powinno się odbywać w dwóch krokach Source - Extract, Extract - Stage. Oczywiście mówię o hurtowni zasilanej raz na dobę nocną porą.

1. Source - Extract - truncate docelowych tabel i zasilenie ze źródła. Tak jest najszybciej. Nawet jak masz tabele do 100 mln rekordów. Z produkcji zasilamy dane tak szybko jak to jest możliwe.

2. Extract - Stage - zasilenie przyrostowe. I tu już
@inny_89: https://stackoverflow.com/questions/38487667/overwrite-specific-partitions-in-spark-dataframe-write-method

Ustawia się to jedną linijką w configu:

spark.conf.set("spark.sql.sources.partitionOverwriteMode","dynamic")
Wybacz też wysoki poziom abstrakcji przy opisywaniu założeń. :)


@inny_89: spoko, generalnie nie zajmuję się hurtowniami jako takimi i nie mam generalnie zbyt dużej wiedzy o pracy z nimi, za to coś tam technicznego ze sparka mogę pomóc ( ͡° ͜ʖ ͡°)
Czołem! Ostatnio zacząłem interesować się analizą i wizualizacją danych i wpadłem na pomysł żeby badać rynek nieruchomości w Polsce, gdyż interesuje mnie ten temat. Właśnie stworzyłem pierwszy dashboard z wizualizacją ceny za metr kwadrat w zależności od metrażu i/lub liczby pokoi. Narazie dane są tylko z kilku ostatnich dni z samej Warszawy, więc za mała próba żeby to jakoś sensownie wyglądało, czekam na większą ilość danych (narazie w bazie jest okolo 1800
@policjantpeel: @woz_z_weglem: extra pomysł, spróbuje to zaimplementować, dzięki!

@Bulkas: mogę dodać Kraków osobno, nie ma problemu. Postaram się wrzucić osobny dashboard wraz z powyższymi ulepszeniami

czyli nowa wersja zawierać będzie:
* Filtr po rynku (pierwotny/wtórny)
* Mapa z lokalizacją mieszkań (+ postaram się dać możliwość filtrowania po zaznaczonym terenie jak koledzy wyżej wspomnieli)
* Ogłoszenia z innego serwisu (jakiś morizon, albo olx)
hej wszystkim mam problem z wyborem studiów, zastanawiam sie pomiedzy agh informatyka i systemami inteligentnymi, inzynieria i analiza danych na agh oraz pomiedzy informatyka na UJ.
w przyszlosci chcialbym zostac inzynierem danych i wykorzystywac uczenie maszynowe.
nie przepadam za fizyka i raczej ten przedmiot uwazam za zbedny w mojej edukacji.
Matematyka, wiem ze jest w tym zawodzie bardzo potrzebna wiec jezeli jest jej duzo to super.
ktory z tych kierunkow bedzie najlepszy
Witam Przyjaciele,
Mam do speców z #datascience, #machinelearning, #dataengineering i ogólnie #data prośbę o pokierowanie na to jak rozwiązać poniżej opisany poroblem.

Jak widzicie na załączonym obrazku mam rozpisany mocno ogólny ale oddający główną istotę problemu przykład, z którym się mierzę.

Otóż:
1. Mam dwie tablice (dataset.1 i dataset.2) składające się z kolumn: [*id] [Imię] [Nazwisko] [Adres] [Miasto] [NrTel]
2. W dataset.1 bazując na danych teleadresowych, imieniu i
Pobierz inny_89 - Witam Przyjaciele,
Mam do speców z #datascience, #machinelearning, #dataen...
źródło: comment_1595715799r0qzy4X8hJ1zOMabEOs6K9.jpg
@inny_89: Nigdy nie przyszło mi mierzyć się z takim problemem, ale szybko wygooglałem, że Twój problem może znaleźć rozwiązanie po zagłębieniu tematu "Fuzzy Matching".

Dla przykładu znalazłem artykuł autora biblioteki splink którą możesz użyć w Sparku. Jeśli dobrze zrozumiałem, to działa ona właśnie na podstawie obliczania prawdopodobieństwa dopasowań, co zostało opisane we wspomnianym wpisie pod nagłówkiem "How it works".
Polecam sprawdzić interaktywne demo zbliżone do Twojego problemu (znalezione w
@Pyxelr: Dziękuję! Na pierwszy rzut oka wydaje mi się, że to dobry trop. Jakoś w moich poszukiwaniach w odmętach internetu za bardzo przywiązałem się do hasła: "Proximate Matching". Teraz jak czytam o "Fuzzy matching" to faktycznie jest to bliskie temu co potrzebuję.

W tygodniu postaram się to sprawdzić w robocie. Jeśli coś z tego wyjdzie to będę wołać z podziękowaniami i wrażeniami. :)
via Wykop Mobilny (Android)
  • 1
@killdachill: tmobile jest za 35€/miesiąc (25 jeśli masz jakąś od nich dodatkowa usługę jak inny abonament czy internet domowy) abonament w którym masz zero limitu poza tym ze co 5giga dziennie musisz potwordzic w aplikacji mobilnej jednym kliknięciem dodatkowy darmowy pakiet i możesz tak robić ile chcesz. Nawet 100giga na dzień pobrać. U mnie internet teraz śmiga tak w telefonie 150mbit/s, a od 24 kwietnia wejdzie mi 5G wiec będzie jeszcze
@Bulldogjob: Hej, dzisiaj #pracbaza dla Devopsów!

Wrocław
Site Reliability Engineer, Online Retailer / DataArt / 12-16K PLN / http://bit.ly/2LifNJf

Kraków
Cloud Engineer with AWS / Philip Morris International SCE / http://bit.ly/3318RXl
DevOps Engineer / Philip Morris International SCE / http://bit.ly/2LBHflE
DevOps Engineer - Hadoop / HSBC Service Delivery (Polska) / http://bit.ly/30HKVqP
DevOps Service Manager / HSBC Service Delivery (Polska) / http://bit.ly/31M4KxF
MS Azure Hybrid Cloud Engineer / HSBC Service Delivery /
Pobierz Bulldogjob - @Bulldogjob: Hej, dzisiaj #pracbaza dla Devopsów!


Wrocław
Site Rel...
źródło: comment_DerPUVglm6E9Lw2GrsP1V8qWRzpMqvtj.jpg
Zmiana czasu z zimowego na letni nastąpi w nocy z soboty 30 marca na niedzielę 31 marca. r.. Wskazania zegarów przesuniemy z godziny 2:00 na 3:00 w nocy.

Zapewne wielu posiadaczy G-SHOCKów będzie szukać instrukcji :P

Poniżej, krótki wpis jak zmienić czas w zegarku G-SHOCK?

https://porady.emodi.pl/jak-zmienic-czas-w-zegarku-g-shock/

#zmianaczasu #czas #czasletni #czaszimowy #zegarek #zegarki #zegarkiboners #data #casio #gshock

A tu kilka ciekawych modeli od Casio https://www.emodi.pl/produkty-produkt:shock-casio,producent:casio.html
@JustJoinIT: Czołem programiści, zapraszamy do cotygodniowej prasówki w całości poświęconej ofertom z Trójmiasta!

pon - javascript & Kraków, wt. - php & Wrocław, śr. - java, Scala & C++ / Trójmiasto, czw. - Python & Seniorzy WWA, pt. - Mobile & Ruby, sob. - testing & DevOps, ndz. - .NET & Juniorzy

#java
Java Dev/ Genesis: 9-13K: http://bit.ly/2CB9NHl
Java Dev/ Spartez: 11-16K: http://bit.ly/2BhL3ls
Platform
Pobierz JustJoinIT - @JustJoinIT: Czołem programiści, zapraszamy do cotygodniowej prasówki w ...
źródło: comment_UG43bYXOMq1W3G2m0cr72hOeIe4PlZEO.jpg
@JustJoinIT: Czołem programiści, zapraszamy do cotygodniowej prasówki w całości poświęconej ofertom z Wrocławia!

pon - javascript & Kraków, wt. - php & Wrocław, śr. - java, Scala & C++ / Trójmiasto, czw. - Python & Seniorzy WWA, pt. - Mobile & Ruby, sob. - testing & DevOps, ndz. - .NET & Juniorzy

#javascript
Engineer/ NewVoiceMedia: 12-16K: http://bit.ly/2PqWPnt
Angular Dev/ Sii: 16-19K: http://bit.ly/2Xx11Tj
Front End/
Pobierz JustJoinIT - @JustJoinIT: Czołem programiści, zapraszamy do cotygodniowej prasówki w ...
źródło: comment_2N07zTU5x4bTOn61qh4mlspK5imWicN3.jpg