Wpis z mikrobloga

Skopiuj link

27.12.2017, 11:46:59

W jaki sposób sprawić, żeby sieć neuronowa była użyteczna dla rozpoznawania cyfr różnej wielkości i pojawiających się w różnych miejscach wczytywanego obrazu? Kojarzy ktoś nazwę algorytmu? Słowa kluczowe pod którymi mógłbym coś znaleźć w Google?

#machinelearning #programowanie

Poziokat

27.12.2017, 11:49:57

@piotrek-5: Trochę niejasne, chodzi Ci o OCR?

ActiZ
konto usunięte

kampar

27.12.2017, 11:54:49

@piotrek-5: Może Convolutional neural network

d.....f

konto usunięte 27.12.2017, 11:55:26 via iOS

@piotrek-5: capsule network :)

d.....f

konto usunięte 27.12.2017, 11:55:46 via iOS

@kampar: główna krytyka CNN to brak odporności na przesunięcia czy obroty

kampar

Ark00

27.12.2017, 12:22:41

@piotrek-5: sliding windows?

dziobaki_sa_jadowite

27.12.2017, 12:26:56

@piotrek-5: jeśli to ty chcesz nauczyć taką sieć neuronową, to niezaleznie od jej architektury po prostu skalujesz obrazek do wspolnego rozmiaru, pomnazasz dataset poprzez obrót kopi zdjecia po roznych kątach. W teorii powinno zadziałać. Jeśli szukasz lepszego rozwiązania lub gotowego programu to poszukaj po haśle OCR.

piotrek-5

27.12.2017, 12:44:14

Trochę niejasne

Moim celem jest automatyczne znajdowanie i rozpoznanie liter bądź ikon ze screenshota z ekranu. Obiekty które chcę wykryć mogą różnić się pozycją, wielkością, ale nie spodziewam się że będą obrócone

vasper

27.12.2017, 16:11:24

@piotrek-5: W takim wypadku dobrym pomysłem byłoby skonstruowanie jakiegoś filtra, który próbowałby ujednolicić to wszystko, co jest widoczne na takim zrzucie ekranu.
Najpierw układasz wszystko w jakąś sensowna całość (data processing), a dopiero później stosujesz jakiś algorytm z zakresu ML.
Generalnie cała procedura tak powinna wyglądać.

piotrek-5

27.12.2017, 20:00:54

@vasper: co masz na myśli mówiąc "skonstruowanie filtra"? Mówisz np. o konwersji kolorów bitmapy do odcieni szarości?

vasper

27.12.2017, 21:00:02

Mam na myśli część programu, która będzie odpowiadać za przetwarzanie danych wejściowych,bo jak rozumiem, chcesz zrobić coś, co pozwoli na odczytanie cyfr z dowolnego dokumentu.
Zrobiłbym to tak:
- Program wczytuje obraz i skanuje, szukając wszystkich cyfr i zapisuje je jakoś w pamięci.
- Kolejnym krokiem byłoby ujednolicenie znalezionych cyfr - ujednolicenie rozdzielczości, usunięcie niepotrzebnych informacji (np. nadmiaru tła, jakichś resztek innych liter z dokumentu itd.)
- I dopiero po takich zabiegach

Aktywne Wpisy

open_or_die

open_or_die +1968

4 godz. i 14 min temu

Moja wieś nie zawiodła xD
Na 330 mieszkańców tylko 1 osoba oddała głos na kandydata z listy KO i bylem to ja xD

#wybory

Kruk_98

Kruk_98 +1615

6 godz. i 10 min temu

Babcia sie popłakała jak powiedziałem że na schetyne głosowałem do senatu XDDDDD i zaczęła mi mówić że przez moje pokolenie ruskie nas napadną, wspaniały moment, czekałem na niego 8 lat a smaku dodał hymn niemiec który puściłem żeby leciał w tle podczas rozmowy #wybory

Aktywne Wpisy

Aktywne Znaleziska

Wstyd i kompromitacja na Narodowym

Uwaga na firme DAMIAN TATARA HORIZON DATA SP. z o.o. NIP: 5252967081

Członkowie komisji wyborczych za granicą mdleją ze zmęczenia i głodu.

"nie będzie w PL nielegalnych migrantów, będą zweryfikowani"

Są wyniki z Jagodna, które głosowało do 3. w nocy. Spektakularna porażka PiS

Popularne tagi