Czy według Was dobrym pomysłem jest wybranie Data science jako kierunek studiów I stopnia, aby od początku uczyć się w tej dziedzinie, czy rozsądniej będzie pójść na informatykę, a data science wybrać jako kierunek na II stopniu? Martwię się o to, że po tej wielkiej bańce, ludzie studiujący data science mogą zostać na lodzie, a ogólna wiedza z informatyki może się przydać w kształceniu w innym kierunku, jeżeli coś pójdzie nie tak.
  • 11
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Raczkin: Studiowałem informatykę i ekonometrię jako I stopień przez 3 lata (2 lata w Polsce i 1 rok w Anglii), a później Data Science jako II stopień przez rok (w Anglii). Obecnie mija mi drugi rok po studiach i nadal czuję się jak na lodzie. Do tej pory studiuję wiele materiałów według swojej intuicji, gdyż moje projekty nie raz wymagają wiedzy bardziej technicznej czy też biznesowej. Ogólnie powinno się być
  • Odpowiedz
Cześć, mam pytanko do specjalistów od #ekonometria. Napisałam że model nasycony to taki, który jest idealnie dopasowany i zawiera taką samą ilość współczynników co obserwacji, na co profesor odpisał mi czy to oznacza że dodaje się nowe zmienne. I w sumie dotarło do mnie że nie do końca rozumiem pojęcie modelu nasyconego. Jak odpisać mu na to pytanie? Przeszukałam internet ale wszędzie jest napisane tylko to co sama już
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@kadbery: Trochę to ułomna definicja, bo niektóre rzeczy nie są zdefiniowane - skąd są indeksy i, j? Jaka jest relacja między punktami z S, że można określić max i min? Można się domyślać, że te punkty są powiązane w jakieś proste drzewa, a min i max to wierzchołki krańcowe.
Mamy drzewa proporcjonalnych rozmiarów,
Przyjmujemy rozkłady jednostajne (i.e. każdy wierzchołek z przedziału ma takie samo prawdopodobieństwo)
Dzielimy zbiór S na dwa
  • Odpowiedz
Change Data Capture służy do efektywnego śledzenia modyfikacji danych przechowywanych w bazie danych. Sprawdź, jak wykorzystać w PostgreSQL z wykorzystaniem Debezium, żeby mechanizm działał bez zarzutu

https://bulldogjob.pl/articles/1184-mechanizm-change-data-capture-z-wykorzystaniem-debezium

#datascience #datascientist #postgresql #bazydanych
Bulldogjob - Change Data Capture służy do efektywnego śledzenia modyfikacji danych pr...

źródło: comment_1592302924ahyQTbdSjbTyYAUMf6bVMB.jpg

Pobierz
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@boa_dupczyciel @unpocoloco generalnie, to obserwacje odstające trzeba usunąć przed uczniem modelu ponieważ może Ci to zaburzyć model. Często się to robi ekspercko, lecz jak nie masz pomysłu jak to zrobić możesz spróbować metody między kwartylowej- usunięcie wszystkich wartości które są 1.5mniejsze od odległości miedzymwartylowej i usunięcie wszystkich wyższych od 1.5*odleglosc miedykwartylowa (narysuj sobie boxplot(zmienna) i wszystkie kropeczki za wąsami to outliery zgodnie z powyższą metodologią). Metoda coocka z tego co
  • Odpowiedz
Uczyłem się ostatnio trochę webscrapingu. Jakie ciekawe i unikatowe dane mogę ściągnąć żeby poćwiczyć?
Zależy mi, żeby takie dane można było potem w ciekawy sposób analizować, a najlepiej jeszcze zrobić na ich podstawie jakiś model uczenia maszynowego.
Wymyśliłem sobie ściąganie informacji i cen używanych aut oraz mieszkań. Udało mi się już to zrobić, ale takie dane są lekko oklepane. Co jeszcze ciekawego zostało z najlepiej polskich stron internetowych?
#scraping #
  • 7
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@wiecek3: pozbieraj dane z wykopu, np dla każdego znaleziska lub wpisu listę zwartych tagów, datę dodania, liczbę komentarzy i plusów, a potem zrób model szacujący popularność na podstawie takich danych
  • Odpowiedz
@ProfesorBigos: ej, to jest świetny pomysł! Dziękuję serdecznie, czegoś takiego potrzebowałem! Teraz tylko muszę się zabezpieczyć kilkoma proxy zanim zacznę scrapować, bo jak dostanę bana na wykop to nie wiem co zrobię xD
  • Odpowiedz
Hej,

Mam pytania całkowicie początkującego w dziedzinie #machinelearning #sztucznainteligencja #datascience - być może głupie pytania i śmieszne, uczę się sam i ciężko bez oka doświadczonych osób ; >

a) Czy robienie modelu do predykcji to w praktyce może być kilka modeli - a dokładniej tak że wybierany jest na podstawie danych wejściowych odpowiedni model? Tzn. powiedzmy ze mam kategorię "Owoce" i "Warzywa" - mają te same kolumny, ale
  • 6
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

to co opisujesz to się chyba nazywa model ensembling - mi bardziej chodzi o to że na podstawie inputu idzie całkowicie inna scieżka - czyli czytam input, widzę kategorie Owoce i to już idzie swoją owocową scieżką - a warzywa lecą inna scieżką :) - nie chodzi o stackowanie modeli


@PhoenixPneuma: teraz dopiero chyba zrozumiałem o co Ci chodzi, rozpoznajesz N rodzai warzyw i M rodzai owoców.

No to jak
  • Odpowiedz
Wytłumaczy mi ktoś class-weight w scikit-learn, np. w drzewie decyzyjnym? Załóżmy że mam dane uczące z 3 klasami, liczby próbek 100, 10, 10. Jak rozumiem dla drzewa z domyślnymi ustawieniami zostanie wykorzystane wszystkie 120 próbek. A co w przypadku np. class-weight="balanced"? #sklearn #python #datascience #machinelearning
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@psi-nos: class_weight przypisuje wage do tego jak wazna jest klasa do trenowania drzewka, wiec zawsze wszystkie klasy beda wykorzystane.* Jako default jest ze kazda klasa jest rownomiernie wazna z pozostalymi. Balanced daje wage odwrotnie proporcjonalna do czestotliwosci wystepowania klasy.

* chyba ze przypiszesz wage 0, to wtedy klasa bedzie ignorowana
  • Odpowiedz
@n0c0Mpr3h3nD: chodziło mi bardziej szczegółowo. Co to znaczy ważna. Ale już chyba ogarnąłem, że waga jest uwzględniana przy funkcji straty przy tworzeniu węzła drzewa (wyborze najlepszego podziału).
  • Odpowiedz
Mirki i Mirabelki z #programowanie czy macie może godne polecenia materiały (bardzo przydatne byłyby też książki oprócz linków) które skupiają tematykę analizy obrazu i wykrywaniu obiektów najlepiej w #python? Teoria i praktyka, wszystko chętnie zobaczę. Chciałabym zaznajomić się z tematem od podstaw.
#programista15k #analizaobrazu #datascience i chyba trochę też #sztucznainteligencja
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Czwartkowy przegląd ofert pracy kierujemy do tych z Was, którzy poszukują pracy w obszarach takich jak Project Manager, Agile Jobs, Product Management, UX Designer, Support, Business Intelligence, Big Data i Business Analyst!

PROJECT MANAGER JOBS

- [REMOTE] IT Project Manager @ livespace.io 6.0k-9.0k (B2B), 5.0k-7.5k (UoP)
- [REMOTE] Agile Project Manager @ 10clouds.com 7.5k-9.5k (B2B)
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach