Wpis z mikrobloga

Chcę nauczyć model detekcji znaków drogowych z Mask R-CNN. Dane uczące mają wymiar ok. 50 px x 50 px z adnotacją obszaru każdego ze znaków (zazwyczaj znajdują się one na środku, wiec przykładowy obszar zapisany w adnotacji to np. 5, 6, 40, 42 [xmin, ymin, xmax, ymax]). Taki model w ogóle nie wykrywa znaków na screenie np.1980x1080 , tylko oznacza prawie cale zdjęcie. I tutaj mam pytanie, czy sytuację może poprawić uczenie modelu na wygenerowanej dla każdego znaku grafice o wymiarze 1980x1080 wypełnionej losowymi pixelami i z wklejonym w losowym miejscu znakiem (powiększonym?) lub kilkoma znakami (aby "zasymulować" realną sytuację na drodze), czy jakiś inny sposób?

#programowanie #pytanie #sztucznainteligencja