Wpis z mikrobloga

Skopiuj link

18.05.2018, 16:00:58

#programowanie #machinelearning #python #pytanie #opencv

Chciałbym by program w czasie rzeczywistym oznaczał cyfry wyskakujące na ekranie. Zrobiłem już demo z bazą MNIST jednak napotyka ona troche problemów. Pomyślałem, że może stworze nowe wzorce na podstawie fonta (pic rel) gdyż nie są to liczby pisane ręcznie. Najlepiej by było ograniczyć się tylko do tych wzorców. Nie wiem jednak jak dodać to do bazy czy stworzyć nową baze.
Mógłby ktoś nakierować na jakieś przydatne edukacyjne linki?
Wcale nie umiem pythona, program złożyłem z gotowców (na podstawie tego http://hanzratech.in/2015/02/24/handwritten-digit-recognition-using-opencv-sklearn-and-python.html )
Może ktoś ma jakieś porady co do kodu?

glupiekonto

18.05.2018, 16:01:33

@glupiekonto: trener https://pastebin.com/XhQBW5bY
wykrywacz https://pastebin.com/TLD5Xxp6

glupiekonto

18.05.2018, 16:07:35

@glupiekonto: największym problemem było to że program zaznaczał cały obszar prostokątem, musiałem zmienić hierarchie z RETREXTERNAL na RETRTREE

Ustenek

18.05.2018, 16:27:27

Musisz wczytać sobie pliki .png do numpy array. Kazdy plik który masz na screenie jest osobnym elementem 'feature' do którego przypisujesz etykietę zgodnie z nazwą. Przykład, będziesz miał 9 plików charakteryzujących jedynkę. Aby proces uczenia zadziałał musisz również dostarczyć etykietę ('label') do każdego pliku. Można to łatwo dostać przy pomocy skryptu podobnego do https://pastebin.com/77zRij5J
Wczytanie .png do np.array można zrobić na wiele sposobów np. https://stackoverflow.com/questions/31386096/importing-png-files-into-numpy
Po kodze trenera wydaje mi się, że

Ustenek

18.05.2018, 16:38:52

Dawno nie bawiłem się 'computer vision' i nie pamiętam czy HOG jest niezmienniczy ze względu na skalowanie obrazu. Własność ta określa, czy rozpoznawane obiekty mogą mieć różny rozmiar od zestawu treningowego i wciąż być dostatecznie dobrze klasyfikowane. Jeśli tak nie jest, a takiej własności potrzebujesz, być może potrzebujesz innego podejścia.
Co do samej detekcji, w zależności jak bardzo "zaszumione" obrazy próbujesz rozpoznać, możesz popróbować z różnymi progami w cv2.threshold.
Ogółem to polecam

interface

18.05.2018, 17:29:08

Komentarz usunięty przez autora

glupiekonto

18.05.2018, 21:58:48

@Ustenek: Pomniejszyłem te obrazki do 28x28 i przekonwertowałem na idx-ubyte. Wiesz może jak teraz zmienić kod trenera żeby wczytywał nowe pliki?

Ustenek

18.05.2018, 22:07:59

@glupiekonto: Tutaj masz przykład jak wygenerować analog tego co masz pod zmienną 'dataset' w swoim kodzie https://stackoverflow.com/a/40430149/8389830

glupiekonto

18.05.2018, 22:14:53

@Ustenek: tak też zrobiłem

dataset = MNIST('mnist')
features, labels = dataset.load_training()

Tylko teraz wywala AttributeError: 'list' object has no attribute 'reshape'
Podejrzewam że to powinno być w typie array z numpy i znowu nie wiem co z tym zrobic

Ustenek

18.05.2018, 22:23:56

@glupiekonto: zgodnie z https://github.com/sorki/python-mnist/blob/master/mnist/loader.py konstruktor klasy MNIST przyjmuje argument opcjonalny returntype z domyślną wartością 'lists' (linia 53). Spróbuj:

dataset = MNIST('mnist', return_type='numpy')

glupiekonto

19.05.2018, 09:11:34

@Ustenek: Dzięki za szybką pomoc! Tego brakowało.

Program teraz szybko zaznacza liczby jednak opisuje je błędnie (1=2, 2=1, 3=2, 4=3). Czyżby wzorce były źle opisane?

glupiekonto

19.05.2018, 09:34:04

@Ustenek:
Jednak były źle podpisane ( ͡° ͜ʖ ͡°)

Ustenek

19.05.2018, 11:23:15

@glupiekonto: Cieszę się, że mogłem pomóc (⌐ ͡■ ͜ʖ ͡■). Powodzenia z projektem!

glupiekonto

19.05.2018, 11:27:46

@Ustenek: wszystko działało ale kiedy patrzył na jedynke to cały czas twierdził że to trójka. Zacząłem przeglądać baze i sie okazało że jedynek tam w ogóle nie ma. Musiałem dorobić pusty folder w tym konwerterze żeby dodał też te jedynki i teraz wszystko śmiga.

Aktywne Wpisy

32cm

32cm +490

4 godz. i 24 min temu

Czy wiecie że kupując kosiarkę nie macie władzy nad czasem w którym kosi, a producent sprzedaje wam urządzenie którego prace sam kontroluje i wyznacza wam limit dzienny :D #kosiarki #ogrod

32cm - Czy wiecie że kupując kosiarkę nie macie władzy nad czasem w którym kosi, a pr... — **źródło:** FB_IMG_1778474329940
Pobierz

KlawiaturowyKomandos

KlawiaturowyKomandos +6

4 godz. i 40 min temu

Hej! Mam obecnie iPhone 14 pro. No i w sumie oprócz tego, ze zjechałem juz baterie (80%), to telefon działa idealnie. Jest szybki, ma fajny ekran, robi świetne zdjęcia. Do tego używam go czasem jako kamerki internetowej podczas calli - jakość jest po prostu rewelacyjna. Zastanawiam się czy jest sens wymiany tego modelu na nowy, ale nie widzę po prostu żadnych argumentów. Wymienię baterie za około 300zl i będzie idealnie. Co myślicie?

Aktywne Wpisy

Aktywne Znaleziska

Najtrudniejsze pismo świata

Ptaki bardziej boją się kobiet niż mężczyźn. Naukowcy nie wiedzą dlaczego.

Jan Śpiewak wygarnia absurdy mieszkalnictwa.

Dlaczego społeczeństwo drwi z męskich kryzysów?

Zaprojektowałem modułowe narzędzie do ustawiania puszek elektrycznych Ø68 mm

Popularne tagi