Tłumaczowi Google zagroziła własna popularność
![](https://wykop.pl/cdn/c3397993/link_SCTsqnnOU95TOquCHWAEwbrvfzn6T0kC,w300h194.jpg)
Czyli o tym jak tłumacz google wpadł w rodzaj rekurencji, niekorzystnej rekurencji i za pomocą statystyki uczy się tłumaczyć obce języki za pomocą swoich własnych tłumaczeń.
![](https://wykop.pl/cdn/c3397992/henk_1,q52.jpg)
- #
- #
- #
- #
- 60
Czyli o tym jak tłumacz google wpadł w rodzaj rekurencji, niekorzystnej rekurencji i za pomocą statystyki uczy się tłumaczyć obce języki za pomocą swoich własnych tłumaczeń.
Komentarze (60)
najlepsze
@mpmp-pmpm: nie tak jakby, a dokładnie tak jest.
Google dobija Seo
Wychodzi na to, że:
1) @Lauretgarnier jest mną z równoległego wszechświata więc myśl bardzo podobnie i pisze podobnie do mnie
2) Mam schizofrenie...
Wolę wytłumaczenie 1. @Lauretgarnier przyznaj się, skąd jesteś?
PS. Sprawdziłem czy teksty nie są tłumaczeniem PL->EN->PL
Jest w sieci pismo o wskazówkach dla googlowskich cenzorantów internetu i uważam ze jest to czyjes widzimisię i taka osoba będzie brala pod uwagę swój gust a nie gust większości.
Można parę tekstów, przed wrzuceniem do korpusu przetłumaczyć za pomocą Googla. Jeżeli tłumaczenie w którąkolwiek stronę będzie identyczne to znaczy że było robione wcześniej przez translate.google.com więc nie należy wrzucać do korpusu.
Można też zwyczajnie zapamiętywać wszystkie tłumaczone teksty (np. w postaci skrótów - o tym piszą w artykule - o ,,odciskach palca'') i nie dodawać takiego który był już kiedyś tłumaczony.
Dodatkowo, wszystkie krótkie teksty bylyby odrzucane, bo w nich jest najmniejsza szansa na wystapienie bledow umozliwiajacych identyfikacje.
Pozostaje jedynie metoda odciskow, ale to strasznie zmudna robota.
Dodatkowo, wszystkie krótkie teksty bylyby odrzucane, bo w nich jest najmniejsza szansa na wystapienie bledow umozliwiajacych identyfikacje.
Prawdopodobieństwo, że nietrywialny tekst zostanie tak samo przetłumaczony przez dwie ,,osoby'' jest zerowe. A jeżeli nawet jeżeli tak by się zdarzyło to takie tłumaczenie zostanie zignorowane, nie dodane do korpusu czyli nic się
Można kilka tekstów, przed wrzuceniem do ciała za pomocą Google Translate. Jeśli tłumaczenie w obu kierunkach są takie same, którzy mówią, że to wcześniej dokonane przez translate.google.com więc nie pozbyć się ciała jest jego.
Można również łatwo przechowywać wszystkie przetłumaczone teksty (np. w postaci skrótów - napisz o tym w artykule - na przykład odciski palców'') i nie dodawać, że był
A może obydwie akcje naraz?