Aktywne Wpisy
D00msday +46
Teksty feministów "relacja 16-stki z facetem w wieku 25 / 30 lat to dosłownie pedofilia!!1111" pokazują, jak mocno w obecnych czasach represjonowana i zwalczana jest normalna, męska seksualność. Nie tylko zresztą męska seksualność, ale generalnie mężczyźni w obecnym systemie społecznym. Nawet tutaj na wykopie są ewenementy, które twierdzą, że macie się zamknąć, pod żadnym pozorem nie umawiać z młodszymi laskami i brać jakieś karyny w swoim wieku po peniso-karuzeli. A wszystko po
olciax555 +2
#python #programowanie
open
jest domyślnie leniwe, możesz zrobić tak żeby czytać linia po linii:for line in open('really_big_file.dat'):
process_data(line)
@less_is_more: Na pewno? Wydaje mi się, że niekoniecznie. Mógłbym przecież pokazywać tylko część wykresu i doczytywać dane jeśli użytkownik chciał zobaczyć inną część danych. Dane wyglądają w ten sposób, gdzie pierwsza wartość to
Inna opcja, jezeli zawsze przerabiasz CSV od 1 do ostatniej linijki to az sie prosi zeby uzyc generatora.
with open('really_big_file.csv', 'r') as f:
f.seek(start_position)
line = f.readline()
while line:
current_position = f.tell()
line = f.readline()
ale czy na pewno jest sens?
Rozumiem, że przeniesienie do bazy danych będzie działać w ten sposób, że pierwsze przepisanie wszystkich danych do bazy zajmie sporo czasu, ale kolejne będą szybsze i
@SpacePotato: No o to chodzi w bazach danych. 20M czystego tekstu to sporo, ale na
To co podałem powinno działać, tylko musiałbyś mieć z góry obliczone offsety każdej porcji 2000 linii.
edit. dla zainteresowanych: pythonowy int w C wygląda mniej więcej tak:
struct _longobject {
Dzięki :)
możesz zapisać bezpośrednio do bazy bez bawienia się w pętle i parsowanie, RAM potrzebny tylko jeden raz:
https://stackoverflow.com/a/28802613
+ numery wierszy:
https://stackoverflow.com/a/49574839
https://stackoverflow.com/questions/17444679/reading-a-huge-csv-file
@SpacePotato: potrzebujesz to ty umiejętności posługiwania się swoim językiem