Wpis z mikrobloga

Skopiuj link

konto usunięte 28.06.2019, 20:04:54

Cześć!
Mam problem dot. zamiany listy tablic 2D (n x n) na numpy array. Gdy to zrobię zużycie RAM drastycznie rośnie. Miał ktoś z tym taki problem?
Zadanie realizuję w CoLab jak i u siebie na PC, lokalnie. Prześlę zużycie RAM w odpowiednich miejscach.
Scenariusz wygląda tak:
- wczytuje obraz

Gen RAM Free: 12.8 GB | Proc size: 447.8 MB

- dziele go na podobrazy o rozdzielczości 13 x 13

- otrzymuję "List of 6859434 images"
Gen RAM Free: 11.9 GB | Proc size: 2.1 GB
**Lista wessała 1.5GB, może być**

- następnie zamieniam listę za pomocą polecenia np.array(lista)
Xtrain = np.asarray(Xtrain,dtype=np.float32)
Xtest= np.asarray(Xtest,dtype=np.float32)

- otrzymuję "Shape of our training data: (6859434, 13, 13, 1)"
Gen RAM Free: 11.9 GB | Proc size: 8.1 GB

Jak widać, 6 GB zostało wessane poprzez zmianę list na array :/ jakieś pomysły? Nie chcę być zmuszony do kupienia 64GB RAM do PC...

#python #machinelearning

skrzacik320

29.06.2019, 15:35:43

@Darkus777: Ale co ci się nie zgadza? Masz np.array, który zajmuje tyle, ile powinien. Jak nie chcesz go całego trzymać w RAM, to zapisz na dysku i wczytuj po kawałku.

D.....7

konto usunięte 29.06.2019, 15:57:26 via iOS

@skrzacik320: Czy to jest prawidłowe zachowanie gdy zamieniasz listę w array i ta druga struktura wazy więcej od listy. Chodzi o szukanie odpowiedzi po prostu xd

skrzacik320

29.06.2019, 16:06:33

@Darkus777: Jeśli lista przechowuje dane w innym formacie, to czemu nie? Jeśli to są zdjęcia, to można je przechowywać w int8, bo wartości są z przedziału [0,255]. Po zamianie na float32 będzie ważyć 4 razy więcej.

D.....7

konto usunięte 30.06.2019, 08:12:48 via iOS

@skrzacik320: Ale w tej liście są elementy (array) które przechowują wartości typu float32, popatrz na zdjęcia to ktore wysłałem w innej wiadomości poprzez imgur. Nie są z tego przedziału bo to zdjęcia medyczne (DICOM) + ja je uprzednio normalizuje.

skrzacik320

30.06.2019, 10:43:04

@Darkus777: No ok, jeśli ta lista, którą pokazałeś, po zamianie na numpy robi się 4 razy większa, to widzę tylko takie wyjaśnienia:
1. Elementy tych list się powtarzają, więc w wielu miejscach trzymane są tylko referencje do tych samych obiektów, które podczas konwersji na jedną array są kopiowane.
2. Numpy ma jakiś sposób przechowywania sparse, więc te wszystkie zera zabierają mniej miejsca, a Ty podczas konwersji to wyłączasz. Ja na

D.....7

konto usunięte 30.06.2019, 11:24:19

@skrzacik320:
Elementy do listy które dodaję są unikalne, iteracyjnie "przelatuję" po całym obrazie na podstawie maski(zbieram wartości z 4 kanałów na raz). Każdy ten element posiada 4 arraye czyli w danym miejscu - obraz[z,y,x] jestem raz.
Kod dla zbierania jednego kanału:
https://paste.ofcode.org/qgQKXW3y9QHXEwkin9my4v
W ten sposób zbieram tą listę, koniec filozofii :P
T2 jest to obraz 3D o wartościach float32

skrzacik320

30.06.2019, 11:40:46

@Darkus777: A no widzisz. Czyli moja pierwsza teoria jest właściwa. Twoja lista trzyma nie osobne tablice, tylko referencje do wycinków (slices) tablicy z obrazem. Ty w linijce val.append(T2[z, ybegin:yend, xbegin:xend]) nie kopiujesz wycinka T2. Zmienna val trzyma wiele referncji do tych samych miejsc w tablicy T2, które później gdy robisz np.asarray(val) są kopiowane pomnażając wielkość tablicy.

D.....7

konto usunięte 30.06.2019, 11:53:02

@skrzacik320: Jaką masz propozycję rozwiązania problemu? :)

skrzacik320

30.06.2019, 12:05:01

@Darkus777: Nie zamieniaj tej całej listy na np.array ;-P

D.....7

konto usunięte 30.06.2019, 12:07:22 via iOS

@skrzacik320: Jestem zmuszony to zrobić ponieważ siec CNN z biblioteki keras, potrzebuje mieć na wejściu array ;)
x: Numpy array of training data (if the model has a single input), or list of Numpy arrays (if the model has multiple inputs).

skrzacik320

30.06.2019, 12:13:41

@Darkus777: Ale sieć nie bierze na raz całego zbioru danych, tylko minibatche. Więc możesz zamieniać tylko te kawałki całej listy, które w danym momencie wrzucasz do modelu. Pewnie to wymaga napisania własnego iteratora, ale nie powinno to być trudne.

Tak się przy okazji zastanawiam, bo to co robisz wygląda na naiwną implementację warstwy conv2d. Tylko nie wiem, czemu robisz to jako preprocessing, a nie normalnie w modelu używając gotowych klas.

D.....7

konto usunięte 30.06.2019, 12:16:13

@skrzacik320: Wtedy trzeba by było stworzyć własny generator. Nie rozumiałem drugiego akapitu, m.in "czemu robisz to jako preprocessing, a nie normalnie w modelu używając gotowych klas. ". O jakie klasy chodzi?

skrzacik320

30.06.2019, 12:24:34

Wtedy trzeba by było stworzyć własny generator.

@Darkus777: Co za problem. Losujesz num_samples z listy, scalasz w jedną listę, zamieniasz na np.array i zwracasz. Masz generator :-)

Chodzi mi o to, że to co tutaj opisałeś, wygląda jak to co robi warstwa conv2d. Skoro napisałeś, że potem to wrzucasz do modelu CNN, czyli właśnie do sieci zbudowanej z warstw conv2d, to nie bardzo rozumiem do czego to co tutaj robisz

D.....7

konto usunięte 30.06.2019, 12:28:49

@skrzacik320: Tylko, że ja nie wrzucam całego obrazu do sieci ;p Moim zadaniem jest segmentacja guza mózgu. Każde takie okno ma etykietę mówiącą czy w środkowym pikselu tego okna znajduje się tekstura guza, jeśli tak to weź jego otoczenie i przypisz mu etykietę. Jeśli nie, to znaczy, że to jest zdrowa tkanka. Do tego potrzebna jest maska stworzona z 4 różnych sekwencji tego samego obrazu ;P

A co do generatora

skrzacik320

30.06.2019, 12:35:31

@Darkus777: Wybacz, ale nie umiem sobie tego wyobrazić xD

D.....7

konto usunięte 30.06.2019, 12:54:08

Komentarz usunięty przez autora

D.....7

konto usunięte 30.06.2019, 12:56:46

@skrzacik320: @skrzacik320: https://imgur.com/a/A1JYZy5 xDD miszcz painta - rysunek poglądowy, proszę się nie czepiać że nie jest o rozmiarze 5x5 tylko 3x5 xD W środkowym pikselu okna przesuwnego o rozmiarze 5x5 wykryto guza (kolor niebieski) w środkowym pikselu, weź ten obszar i daj etykietę "guz".

skrzacik320

30.06.2019, 13:12:20

@Darkus777: Ok, rozumiem. A dlaczego nie wrzucasz całego obrazu głowy do sieci, tylko dzielisz go na te okienka?

Aktywne Wpisy

WielkiNos

WielkiNos +480

5 godz. i 36 min temu

Juleczka po kulturoznawstwo chwali się dyplomem w sposób sugerujący, że zdobyła go nie tą częścią ciała, którą się go zwykle zdobywa.

#bekaztwitterowychjulek #p0lka #studia #bekazpodludzi #logikarozowychpaskow

WielkiNos - Juleczka po kulturoznawstwo chwali się dyplomem w sposób sugerujący, że z... — **źródło:** temp_file2614539208647029454
Pobierz

Nighthuntero

Nighthuntero +960

5 godz. i 44 min temu

Tak chciałem tylko przypomnieć w jakim cuckoldstanie żyjemy.
Wariatka opublikowała wpis w którym bez żadnych dowodów oskarżyła tatuażystę o molestowanie/gwałt podczas wykonywania jej tatuażu. Jak się oczywiście okazało wszystko zmyślała, aby tylko nie zapłacić za tatuaż. Wykopki od razu zaspamowały sociale, że gość jest gwałcicielem.
Jakie poniosła konsekwencje w cuckoldstanie? Dokładnie tak, macie rację, żadnych.
Moderacja Wykopu i stecka szczególnie się popisali, nie usuwając wpisu przez ponad tydzień.
#p0lka #

Nighthuntero - Tak chciałem tylko przypomnieć w jakim cuckoldstanie żyjemy.
Wariatka ... — **źródło:** 1000016937
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

"NATO przygotowuje się do wojny"

Jak pustoszeją rosyjskie magazyny sprzętu pancernego [PODCAST]

Obława Augustowska jak Katyń. "Zginęli, bo byli Polakami"

Największa biznesowa mina zostawiona przez Daniela Obajtka.

Ryszard Czarnecki ma usłyszeć zarzuty

Popularne tagi