Profil: @mrocznapszczola - Wpisy (komentowane) - strona 17 :: Wykop.pl

08.07.2019, 11:29:57

1

Mirki doświadczone w Data Science - czy możecie porównać program kursu bootcampa z Gdańska do podyplomówki z PW i ocenić jaki wybór jest lepszy?

Bootcamp "data science" z Gdańska skupia się na pythonie i jego bibliotekach, machine learning, AI. Więcej godzin warsztatowych, wyższa cena (12k), nie wiadomo kto prowadzi.
https://infoshareacademy.com/kursy/kurs-weekendowy_gdansk_data_science/

A podyplomówka "data science" na PW skupia się na R. Niższa cena (10k), więcej teorii, mniej godzin warsztatowych, poważniejsza kadra merytoryczna.
http://datascience.ii.pw.edu.pl/datascience.html#program

mrocznapszczola

mrocznapszczola 08.07.2019, 20:31:31

0

Stary za 12k to masz 3 kursy na udacity z tematyki ML, AI i jeszcze DevOps przykładowo, jak zrobisz u nich w rok trzy kursy to sami znajdą dla Ciebie pracę. Możesz jeszcze policzyć że 12k to +60 miesięcy kursów na Coursera. Nikt nie zrobi z Ciebie DS w 3 miesiące na to nie licz. Lepiej powoli a wytrwale iść do celu.

05.07.2019, 21:14:29

1

Chciałbym nauczyć się #python w celu #machinelearning, a dokładnie będę probował zrobić apke, która będzie czytała pismo ręczne więc #nlp i chciałbym wybrać do tego jakiś dobry framework, wszędzie piszą o Django ale to chyba dla webu ? Ktoś może mi coś doradzić ? Każda rada będzie dla mnie dobrą radą :) Chyba, że mam sobie soli do dupy nasypać to może jednak nie każda...

mrocznapszczola

mrocznapszczola 07.07.2019, 20:06:02

0

NIe żebym był jakiś super ekstra obeznany w temacie ale połowa chyba nie wie o czym pisze na tym wypoku :D masz tutaj cały silnik do ocr z handwritten digits, tylko wytrenować :) Nie dziękuj bo nie sprawdzałem https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract

05.07.2019, 15:32:19

2

Miał ktoś z was może styczność z TensorFlow, a konkretnie z Estymatorem? Mam taki problem dotyczący uczenia sieci konwolucyjnej, a właściwie zbierania z niej danych. Ale do rzeczy:

Chcę zbierać wartości podczas uczenia modelu sieci co każdą epokę i w tym miejscu są dwie opcje:
1) używam funkcji trainandevaluate(), która uczy szybko jednak nie znalazłem możliwości zbierania danych funkcją evaluate co każdą epokę. Wszelkie źródła mówią o wywoływaniu funkcji co

mrocznapszczola

mrocznapszczola 07.07.2019, 20:03:27

0

Prostymi słowami, chcesz zbierać wagi modelu tak? Jeśli tak to do tego służy taki moduł jak callbacks. Możesz ustawić sobie zapis w dowolnej konfiguracji (tylko po co?) np. modelcnn{0}_{1}.format(epoch, lr)

konto usunięte 05.07.2019, 08:16:50

0

Miraski polecą jakiś dobry darmowy kurs online z #informatica? Żeby się w ogóle zorientować w temacie
#datascience #pytanie

mrocznapszczola

mrocznapszczola 07.07.2019, 19:58:01

0

https://www.edx.org/course/introduction-to-computer-science-and-programming-using-python-2

konto usunięte 28.06.2019, 20:04:54

0

Cześć!
Mam problem dot. zamiany listy tablic 2D (n x n) na numpy array. Gdy to zrobię zużycie RAM drastycznie rośnie. Miał ktoś z tym taki problem?
Zadanie realizuję w CoLab jak i u siebie na PC, lokalnie. Prześlę zużycie RAM w odpowiednich miejscach.
Scenariusz wygląda tak:
- wczytuje obraz

Gen RAM Free: 12.8 GB | Proc size: 447.8 MB

- dziele go na podobrazy o rozdzielczości 13 x 13

- otrzymuję

mrocznapszczola

mrocznapszczola 28.06.2019, 20:46:54

0

Nie wiem po co najpierw robisz listę a później zamieniasz na numpy array. Przejdź odrazu do numpy zrób sobie operację na macierzach i sprawdź jak to będzie działać

mrocznapszczola

mrocznapszczola 28.06.2019, 20:49:00

0

a jak to nie pomoże to nie cebul tylko wykup sobie maszynę wirtualną na 1-2 godziny z dużym ram, zamień co masz zmienić, zapisz jako HDF5 i już.

mrocznapszczola

mrocznapszczola 28.06.2019, 21:28:42

0

Bo nie wiem ile ma być elementów. Da się tworzyć numpy array tak aby jej rozmiar zmieniał się dynamicznie?

@Darkus777: np.concat()

konto usunięte 27.06.2019, 08:14:14 via iOS

2

Gdzie moge znalezc darmowe datasety? Chodzi mi tylko o te powiazane z Polska

#datascience #python #programowanie

mrocznapszczola

mrocznapszczola 27.06.2019, 19:49:48

0

https://toolbox.google.com/datasetsearch

jazmojegopokoju

22.06.2019, 09:29:41 via Android

0

Mam bazę użytkowników ≈50mln i teraz chciałbym z nich wyciągnąć ,,rodzynki". Czy jest możliwe, żeby skrypt na podstawie moich wyborów doszukiwał mi podobne pozycje, a gdy uznam że jest ok, sam się doskonalił jak wskarze mu błędy? Jeśli mam wiele źródeł danych które zmieniają się z godziny na godzinę, jak mogę to ,,ogarnąć"? Czy studenci chętnie pracują za % od zysków? #studbaza #datascience #programowanie

mrocznapszczola

mrocznapszczola 22.06.2019, 11:28:01

0

@define może proponujesz dobrą metodę ale nie wiem czy do końca rozumiesz metody analizy skupień ( ͡° ʖ̯ ͡°).
@jazmojegopokoju trochę słabo wytłumaczyłeś problem, masz te swoje rodzynki i co? jak te rodzynkowe wektory wyglądają? Czy to są bardziej rodzynkowe-wektory ciągłe, dyskretne może trochę tego, trochę tego.
Rodzynkowe wektory dyskretne to takie: [0,1,5,2, ...]
Rodzynkowe wektory ciągłe to takie: [1,44234, 11,13, 66,242, ...]
I teraz tak jak, co

mrocznapszczola

mrocznapszczola 22.06.2019, 12:03:45

0

@jazmojegopokoju okej to masz problem klasyfikacji, sprawdź czy tutaj ktoś nie ma podobnego zbioru danych do Ciebie :)

konto usunięte 20.06.2019, 11:58:15

8

tak się składa, że jutro mam rozmowę z machine learning, sztucznej inteligencji oraz IoT, jednak nic z tego nie umiem (nie wiem, dlaczego zaprosili mnie na rozmowę z tego, skoro w cv tego nie mam :/ ). Jaka wiedza jest must have z tych rzeczy? Jakie materiały polecacie, by mieć mniej więcej rozeznanie w tych rzeczach?

#naukaprogramowania #machinelearning #artificialintelligence #sztucznainteligencja #programowanie #programista15k

mrocznapszczola

mrocznapszczola 20.06.2019, 18:39:14

0

Śmieszne ( ͡° ͜ʖ ͡°) Powiedz że wszystko masz wpisane w CV.

18.06.2019, 13:52:31

0

Miruny spod #analizadanych #datascience itp. Kojarzycie może jakiś algorytm pozwalający liczyć odległość punktu do najbliższego/najdalszego punktu w poligonie? Najlepiej z zastosowaniem QGIS lub #python.

mrocznapszczola

mrocznapszczola 18.06.2019, 14:40:07

0

Co rozumiesz przez najdalszy, najbliższy punkt? Wykorzystujesz normalną metrykę Euklidesową? Jeśli tak to możesz spróbować 'rysować' okrąg i później porównać wszystkie promienie kół. Nie wiem czy ten algorytm jest bardzo efektywny ale wymyśliłem go na poczekaniu.

IsambardKingdomBrunel

16.06.2019, 20:38:59

0

#python
#datascience

Miałem dataset który miał kolumnę jako object z kilkoma różnymi cechami. Zmieniłem, więc to na liczby i kolumna jest jako int i przyporządkowałem liczby do opisów w słowniku. Oczywiście podobnych kolumn było o wiele więcej. Problem powstaje, kiedy muszę zrobić wykresy. Jak sobie rozkodować najlepiej pojedyncze słupki w wykresie?

mrocznapszczola

mrocznapszczola 17.06.2019, 06:59:35

0

Rozumiem że używasz pythona i biblioteki pandas tak? Jeśli tak to możesz to zrobić prostym sposobem (może nie najlepszym ale na ten moment nic lepszego nie przychodzi mi do głowy)
1. Zliczasz sobie ilość kategorii w danej kolumnie df['...'].value_counts() i zapisujesz jako słownik
2. Podmieniasz int na nazwy ze słownika.
3. Generujesz wykres klik

16.06.2019, 12:14:12

0

No elo swiry z #python #machinelearning #tensorflow
Mam takie zadanie do wykonania, jestem newbie i zastanawiam sie nad generalnym podejsciem/architektura:

Generowanie textu na podstawie podprzednio widzianych zdan oraz przekazanego kontekstu (slowa kluczowe).
W pierwszym przypadku jak rozumiem, moge zastosowac jakas rekurencyjna warstwe np LSTM, GRU, zmapowac zdania na chary i jako cel ustawic wybor kolejnej litery - zrobiem pare takich.
Ale w jaki sposob moge przekazac konktekst wypowiedzi? Np. uczenie generowania zdan

mrocznapszczola

mrocznapszczola 17.06.2019, 06:51:22

0

Generowanie tekstu to nie trywialny problem. Nie siedzę w tym temacie ale z tego co się orientuję będzie ciężko zrobić jeden model który generuje tekst wielu autorów opierając się na znaczniku, chyba że będzie to jakiś model łączony. Zobacz czy tutaj nie ma nic co może pomóc:
paperwithcode
OpenML
Github

IsambardKingdomBrunel

12.06.2019, 19:31:22

1

#datascience
#python

Jak najlepiej zabrać się za naprawdę duży dataset?

mrocznapszczola

mrocznapszczola 12.06.2019, 21:40:21

1

https://github.com/modin-project/modin

12.06.2019, 18:06:03

0

Mireczki z #machinelearning #datascience ma ktoś może doświadczenie z jakimś ciekawym biznesowym datasetem z kaggle/innych źródeł? Mam zamiar zrobić sobie jakiś fajny projekcik do CV w związku z rekrutacją do firmy zajmującej się data science i przydałoby się coś żeby im pokazać. Celuję w coś biznesowego ale cholera nie mam totalnie pojęcia o żadnych fajnych business- datasets ( ͡° ʖ̯ ͡°)

mrocznapszczola

mrocznapszczola 12.06.2019, 21:37:21

2

Tak jak @vasper mówi najpierw ustal co robi firma bo ścieżek DS jest bardzo dużo. Od segmentacji klientów przez vision i szeregi czasowe kończąc na robotyce. Sprawdź tego gita https://github.com/firmai/industry-machine-learning albo lepiej znajdź jakiś paper naukowy z dziedziny jaką zajmuje się firma i spróbuj zaimplementować algorytm :) Myślę że takie podejście dużo wyżej może postawić Cię w ocenie. Sprawdź jeszcze czego używają do zbierania danych (spark, postgres itp.) i na czym mogą

konto usunięte 06.06.2019, 08:34:19

0

#kaggle Hej, jestem nowy w temacie ML i chciałbym się czegoś jeszcze poduczyć. Dotarłem do problemu sądzę dość typowego pt. nie mam dobrej karty graficznej i nauka sieci trwa 2h na jeden epoch. Szukam rozwiązań chmurowych, znalazłem opcję, że na Kaggle mogę to zdalnie odpalać mój kod.
Czy jest opcja przeniesienia jakoś tego, co mam lokalnie na kompie bezpośrednio na kaggle, wpisania tam typowej komendy python3 train.py --path /path/?
Bo póki co

mrocznapszczola

mrocznapszczola 07.06.2019, 10:03:40

1

@Mpknw: na kaggle jest chyba 6 godzin GPU, później maszyna się resetuje. To sam jest na google colab. Nie rozumiem tylko jakie Ty parametry chcesz kopiować?