Mniej więcej rok temu, Google pochwaliło się, że “stary” Tłumacz Google idzie do lamusa, bo nadchodzi lepszy, oparty o uczenie maszynowe i Sztuczną Inteligencję.
(https://www.spidersweb.pl/2017/03/tlumacz-google-translate-polski.html)
Tłumaczenia miały być lepsze niż dotychczas, bardziej zwracać uwagę na kontekst, ogólnie cud-miód i orzeszki.
Od razu pomyślałem “sprawdzam!” i uruchomiłem mój mały eksperyment.
Wybrałem kilka zdań z różnych dziedzin, ale wszystkie z dużych amerykańskich lub brytyjskich portali, żeby mieć dużą pewność, że są napisane poprawnie.
Są to fragmenty:
- depeszy agencyjnej
- recenzjy słuchawek
- “Depeszy” :)
- artykułu o polityce
- przepisu kulinarnego.
Następnie kazałem każde z tych zdań przetłumaczyć Google Translate.
I tak co miesiąc przez rok.
Na koniec@chafer przetłumaczył te zdania w sposób profesjonalny, za co serdecznie dziękuję. To tłumaczenie było potrzebne żeby mieć porównanie do tłumaczenia automatycznego.
W podlinkowanym pliku możecie zobaczyć jak Google Translate poradził sobie z tłumaczeniami i jak one się zmieniały - na lepsze czy na gorsze.
Moim skromnym zdaniem - jest lepiej niż było, choć z niektórymi frazami nadal nie potrafi sobie poradzić.
W tak zwanym międzyczasie, postanowiłem niejako przy okazji zobaczyć jak poradzą sobie inne systemy tłumaczące. Znalazłem kilka, które obsługują język polski i sprawdziłem jakość tłumaczenia. Czasami jest… dziwnie, co też możecie zobaczyć.
Pamiętajcie jednak, że zamiast cieszyć się z wpadek SI, można ją wspomóc naszą, ludzką inteligencją.
Jak to zrobić?
- można proponować lepsze tłumaczenia w Google Translate
- można pobawić się w zdobywanie odznak w Społeczności Tłumacza Google (https://translate.google.pl/community)
- albo w Crowdsource (https://crowdsource.google.com/) - tutaj oprócz tłumaczeń, można uczyć AI rozpoznawania obrazów, pisma odręcznego, rozpoznawania uczuć(?) itd. Jest też aplikacja na Androida jak ktoś by chciał pobawić się w autobusie czy coś :)
A tutaj rzeczony arkusz:
https://www.dropbox.com/s/iclk...
Komentarze (90)
najlepsze
Wszystko w temacie.
Zasada numer 1: jak chcesz pomagać za darmo, pomagaj otwartym projektom, inaczej komercyjny cię wyroluje. Przykład: mapy google vs mapy open street map
Ja równie dużo wspieram OSM, Waze i Mapy Google (choć ostatnio już mniej, bo nie ma narzędzi). I OSM dał mi satysfakcję, Waze - dodatkowo poziom edytora, a Google - dodatkowo parę namacalnych rzeczy :)
Do tego powinna być zasada numer zero - jak nie lubisz komercyjnych, to z nich nie korzystaj. Będzie przynajmniej uczciwie.
Zwracam tylko uwagę, że możesz poświęcić setki godzin na pracach przy google maps, a gdy będziesz chciał z efektów swojej pracy skorzystać w komercyjny sposób, to Google powie płać. Jakby to powiedzieć: podwójne dymanie ( ͡° ͜ʖ ͡°)
Jak pracujesz przy otwartych mapach, to z rozwiązania mogą korzystać wszyscy za darmo. I można dzięki temu tworzyć kolejne dobre
Widać, że jest poprawa z tłumaczeniem w kontekście całości, nadal ma problem z liczbą mnogą.
Automat czasem próbuje zgadywać słowa, najwyraźniej biorąc je za źle zapisane,
Polska język, trudna język - niemniej AI przez ten rok zaczęła rozpoznawać kontekst.
@KubaGrom: tłumaczenie dosłowne to zdecydowanie nie zawsze lepszy wybór. Również w tym przypadku :)
Translator mi to przetłumaczył:
"Krzyżacy zaktualizowali Windows"
Instrukcje niejasne. P---s utknął w grillu.
Ogólnie odkąd Google wprowadziło tłumaczenie przy użyciu sieci neuronowych, to zauważyłem że zdania są składniejsze, ale za to częściej
Dlatego osobiście "bawię się" Crowdsource, bo tam widzę od razu ile razy moje dane zostały potwierdzone przez innych.
Właśnie siedziałem z dobre kilkanaście minut na crowsource i potwierdzałem obrazki. Dość śmieszne, że często był podpis iż coś "sitting on". "Buses sitting on street", czy coś w tym stylu. Z jednej strony poprawnie, z drugiej te sitting przeszkadza.