Aktywne Wpisy

wfyokyga +25
Kusi mnie ten barking bread, odbiłem się 2 razy po 1 odcinku i dalej się nie chciało oglądać. Trzeba chyba będzie dać 3 szanse i ostatniom
źródło: temp_file4251944129250244986
Pobierz
PepeSmutnyJest +18
Nie ma na świecie nic gorszego niż szlauf z dzieckiem który szuka faceta xD pokochasz jak swoje xD ciebie szmato, nawet matka własna nie kochała, to jak ma cie facet pokochać i jeszcze twojego bękarta xD kazdy facet który ma godność nie będzie wychowywał cudzego bachora. Szanujmy się panowie. #zwiazki #blackpill





#python
Jak najlepiej zabrać się za naprawdę duży dataset?
Jeśli używasz Pandas do wczytywania danych, to spróbuj importować te jsony w częściach.
np. pd.read_json(r'../input/data.csv', chunksize=1000000)
Niemniej, polecam najpierw zastanowić się, co chcesz zrobić. Potem zrobić to na małej próbce. Następnie oczyszczać dane mnóstwo razy i próbować ponownie.
A jak wyjdzie już coś sensownego, to pandas.
I jeszcze zrzuć to do mniej pamięciożernego formatu. Csv może być, jeśli żadnej bazy danych nie
Przeglądnij jakiś wycinek tego setu i zastanów się, co można by stamtąd wyrzucić, albo zmienić na coś "lżejszego", albo jeszcze inaczej zoptymalizować.
Co to są za dane ?
Komentarz usunięty przez autora