Wpis z mikrobloga

Mam jeden długi tekst z czego na początku jest jego treść po polsku, a niżej (w nieznanym mi momencie) jeszcze raz to samo, ale przetłumaczone na obcy język (przyjmijmy, że zawsze jest to angielski). Algorytm dzieli taką treść na części (dla uproszczenia przyjmijmy, że każde zdanie = 1 element arraya). Macie jakieś pomysły jak obciąć z końca tak powstałej tablicy zdania, które są w języku obcym?

#programowanie #algorytmy #nlp #machinelearning #deeplearning (najlepiej #javascript, ale rozważę wszystkie opcje)
  • 14
  • Odpowiedz
@dziobaki_sa_jadowite: zobacz sobie jaki ten lib jest prosty w środku, działa na zasadzie najczęstszego występowania obok siebie liter w różnych językach albo jakieś inne cuda https://github.com/wooorm/franc/blob/master/packages/franc-min/data.json. Nie ma tu żadnego AI, modeli i trenowania ich, nie ma co wymagać cudów.

Weźmy sobie na warsztat taki ciąg:

Opłata za prąd według zużycia

Wydawać by się mogło, że nie ma szans pomylić tego z żadnym innym językiem niż polski, ale jednak :P Oto
  • Odpowiedz