Wykop.pl Wykop.pl
  • Główna
  • Wykopalisko257
  • Hity
  • Mikroblog
  • Zaloguj się
  • Zarejestruj się
Zaloguj się

Popularne tagi

  • #ciekawostki
  • #informacje
  • #technologia
  • #polska
  • #swiat
  • #motoryzacja
  • #podroze
  • #heheszki
  • #sport

Wykop

  • Ranking
  • Osiągnięcia
  • FAQ
  • O nas
  • Kontakt
  • Reklama
  • Regulamin

355

Język polski najlepszy w testach sztucznej inteligencji

Język polski najlepszy w testach sztucznej inteligencji

Język polski najlepiej działającym językiem w długokonktekstowych (64K-128K tokenów) zadaniach NIAH, angielski dopiero na miejscu 6.

framugabezdrzwi
framugabezdrzwi
z
arxiv.org
dodany: 02.10.2025, 20:37:14
  • #
    sztucznainteligencja
  • #
    ai
  • #
    technologia
  • #
    chatgpt
  • #
    openai
  • #
    programowanie
  • 136
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Treści powiązane (2)

Ciekawe spojrzenie na język polski w kontekście sanskrytu i run
t0rmentor
z youtu.be
  • 3
Gość opisuje poziom skomplikowania polskiej gramatyki
dict
z youtu.be
  • 0

Komentarze (136)

najlepsze

IluzjaWIBORu
IluzjaWIBORu
03.10.2025, 01:03:09 via Wykop
  • 251
Język polski, podobnie jak spokrewniony z nim sanskryt, wyróżnia się wśród innych języków wyjątkowo precyzyjną gramatyką, bogactwem fonetycznym i i złożonym systemem fleksji, który umożliwia tworzenie bardzo precyzyjnych znaczeń. Np takie języki germańskie, nawet w swoich najstarszych formach (a więc i bardziej skomplikowanych, bowiem języki europejskie mocno uprościły się w ostatnich tysiącleciach - pytanie za 100 punktów "dlaczego?" ) nigdy nie miały tylu przypadków ile zachował nasz język do dzisiejszego dnia. Prawda
IluzjaWIBORu - Język polski, podobnie jak spokrewniony z nim sanskryt, wyróżnia się w...

źródło: eeb9b3bf4c688757f34741823399

Pobierz
  • 41
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

jak_ta_lala
jak_ta_lala
03.10.2025, 06:29:40 via Wykop
  • 21
@IluzjaWIBORu: Idąc tym tropem powinni w tych testach uwzględnić łacinę...
  • Odpowiedz
Manah
Manah
03.10.2025, 06:44:13 via Wykop
  • 31
@IluzjaWIBORu: nikt nie ukrywa historii języków indoeuropejskich, nie twórz spisku.
  • Odpowiedz
noHuman
noHuman
02.10.2025, 20:47:31 via Wykop
  • 124
Dość rozbudowana ale przy tym precyzyjna gramatyka... no to jest trudne do nauki przez człowieka ale dla maszyny po prostu gęstsze informacyjnie.
Swoją drogą słucham czasem opowiadań sci-fi na YT i te tłumaczone z ang. mają ciekawą cechę mylą you z thou czyli Wy z Ty :P bardziej złożony 'gender' pomaga na przykład w określeniu z kontekstu podmiotu wypowiedzi
  • 17
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

noHuman
noHuman
02.10.2025, 22:05:32 via Wykop
  • 26
ps. czy gramatyka, fleksja/ składnia są niezbędne do posługiwania się polskim ? nie sądzę, jestem dyslektykiem, a mało który polak składa zdania w poprawne formy.

@martw: też jestem dyslektykiem. AI łatwiej sobie radzi z błędami w informacji niż z wnioskowaniem informacji z kontekstu. dalej jest lepiej jak napiszesz po polsku "Twuj" i "Wszasze" niż You i You ;)
  • Odpowiedz
alexmich
alexmich
03.10.2025, 07:28:37 via Wykop
  • 3
@noHuman: @martw Jestem 3 x Dys z czasów gdzie aby uzyskać papier na to należało zdać egzamin państwowy ( a przynajmniej ja to tak odbierałem jako coś odgórnego z kuratorium). Musiałem wykazać że znam całą gramatykę i wszystkie zasady. To jest małą książeczka. Sam test to było 22 strony A4. Były nawet pytania o zasady pisowni sów zapożyczonych z francuskiego ( ja wkułem je jako wyjątki, nawet nie wiedziałem,
  • Odpowiedz
Majkel2008
Majkel2008
Majkel2008
03.10.2025, 05:20:56 via Wykop
  • 35
Oczywiście tekst przeszukiwany liczony jest w tokenach. Czyli w przypadku języka polskiego, tekst był krótszy, a w przypadku chińskiego był o wiele dłuższy.

A wynika to z tego, że język polski marnuje więcej tokenów niż chiński. Słowo, które po chińsku ma jeden token, po polsku ma:
- token na temat
- token na końcówkę fleksyjną (odmiana przez przypadki, czasy)
- token na przedrostek jeżeli to tryb dokonany
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

dejvo
dejvo
dejvo
03.10.2025, 07:16:05 via Wykop
  • 5
@Majkel2008: Przeprowadzili także testy na podstawie ilości informacji w kontekscie i wyszło na to samo.

Similar findings hold despite dramatic differences in tokenized lengths: As seen in

Figure 25, when controlling for amount of context information, Slavic languages (Russian,

Ukrainian, Polish) perform highly, surpassing the performance of Romance languages like Italian, French, and Spanish. English performance is even lower, typically 8th
  • Odpowiedz
marcinst
marcinst
03.10.2025, 08:41:52 via Wykop
  • 8
bym im zaliczył tą inżynierkę.


@Majkel2008: za to ja bym Ci nie zaliczył matury z polskiego ( ͡° ͜ʖ ͡°)
  • Odpowiedz
munioman
munioman
munioman
03.10.2025, 05:42:22 via Wykop
  • 30
TLDR: ten ejaj wymyślił co się stało z jeziorem kiedy je obszedłem?
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

tdv26
tdv26
tdv26
03.10.2025, 06:33:44 via Wykop
  • 20
@munioman: jezioro zostało obszędłnięte
  • Odpowiedz
FejsFak
FejsFak
03.10.2025, 08:53:29 via Wykop
  • 12
co się stało z jeziorem kiedy je obszedłem?


@munioman:
FejsFak - >co się stało z jeziorem kiedy je obszedłem?

@munioman:

źródło: Screenshot_20251003_105240

Pobierz
  • Odpowiedz
jak_ta_lala
jak_ta_lala
03.10.2025, 06:10:26 via Wykop
  • 23
To zapewne przez możliwość treningu na danych z wykop'u... Tak precyzyjnego myślenia jak tutaj nie uświadczysz nigdzie indziej ( ͡° ͜ʖ ͡°)
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

LUXer
LUXer
03.10.2025, 04:35:04 via Wykop
  • 18
Nie umniejszajmy językowi rosyjskiemu. Zajął drugie miejsce. Angielski jest bezużytecznym językiem, na świecie powinno się mówić tylko po polsku i rosyjsku.
  • 6
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

motylbezskrzydel
motylbezskrzydel
03.10.2025, 05:59:22 via Wykop
  • 88
@LUXer: Przy czym po rusku tylko w Rosji
  • Odpowiedz
fervi
fervi
03.10.2025, 06:25:36 via Wykop
  • 54
@motylbezskrzydel: albo w piekle
  • Odpowiedz
maaaaaaaarcin
maaaaaaaarcin
maaaaaaaarcin
03.10.2025, 09:34:20 via Wykop
  • 12
wniosek jest taki, że ważne teksty powinny być przechowywane w języku polskim :)
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Manah
Manah
02.10.2025, 22:43:01 via Wykop
  • 12
Polska gurom
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

dict
dict
03.10.2025, 07:24:26 via Wykop
  • 10
No ogólnie język polski jest p------y.
Napisałem kiedyś biblioteke w pythonie do generowania pseudorandomowych wyrazów.
Wziąłem linuksowe słowniki różnych języków, angielski, niemiecki, fiński i jakieś inne, łącznie bodajże 6. Dla każdego z nich wykonałem taką operację:
Podzieliłem każdy wyraz na przeplatające się ze sobą grupy samogłoswoe i spółgłoskowe, a następnie skatalogowałem parametry każdego wyrazu - ilość grup, "parzystość", i prawdopodobiestwo wystąpienia każdej grupy na danej pozycji w wyrazie.
Okazało się, że składając nowe wyrazy ze
  • 8
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

lookcipher
lookcipher
03.10.2025, 07:37:37 via Wykop
  • 6
@dict: Dokładnie, stąd powtarzane przez wszystkich naszych rodziców do swoich dzieci "Po Polsku nie rozumiesz?!" :D
  • Odpowiedz
lookcipher
lookcipher
06.10.2025, 12:17:30 via Wykop
  • 0
@krykoz: A z szacunku do naszego języka :) Coś się stało?
  • Odpowiedz
m_77
m_77
03.10.2025, 04:22:01 via Wykop
  • 7
Najzwyklejsze "ku..wa" można powiedzieć na wiele sposobów i chyba każdy odbiorca będzie wiedział, jakie emocje nadawca chciał zawrzeć w przekazie. Łącząc wspomniany wyraz z podobnymi znaczeniowo znacząco wzbogaca to kominukat i mozna tak "pie...dolić" cały dzień.
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Kraina_Wiecznej_Saszety
Kraina_Wiecznej_Saszety
03.10.2025, 09:17:57 via Wykop
  • 0
@m_77: klasyka :-)
  • Odpowiedz
  • <
  • 1
  • 2
  • 3
  • Strona 1 z 3
  • >

Hity

tygodnia

Pamiętacie policjantkę zatrzymaną po imprezie w klubie?
Pamiętacie policjantkę zatrzymaną po imprezie w klubie?
3352
Rodzina Majtczaka opłaciła ucieczkę do Dubaju? Śledztwo zamknięte
Rodzina Majtczaka opłaciła ucieczkę do Dubaju? Śledztwo zamknięte
2428
Policyjny agresor atakuje spokojnego kierowcę podczas kontroli drogowej. A ten w
Policyjny agresor atakuje spokojnego kierowcę podczas kontroli drogowej. A ten w
2441
Migracja pracownicza po polsku: Nie żądaj podwyżki, bo zastąpi Cię cudzoziemiec.
Migracja pracownicza po polsku: Nie żądaj podwyżki, bo zastąpi Cię cudzoziemiec.
1925
Zachowanie sędziego zdumiewa. Obok nie da się mieszkać.
Zachowanie sędziego zdumiewa. Obok nie da się mieszkać.
1914
Pokaż więcej

Powiązane tagi

  • #ai
  • #technologia
  • #chatgpt
  • #ciekawostki
  • #heheszki
  • #openai
  • #programowanie
  • #gruparatowaniapoziomu
  • #komputery
  • #muzyka
  • #grafika
  • #informatyka
  • #google
  • #llm
  • #nauka

Wykop © 2005-2025

  • O nas
  • Reklama
  • FAQ
  • Kontakt
  • Regulamin
  • Polityka prywatności i cookies
  • Hity
  • Ranking
  • Osiągnięcia
  • Changelog
  • więcej

RSS

  • Wykopane
  • Wykopalisko
  • Komentowane
  • Ustawienia prywatności

Regulamin

Reklama

Kontakt

O nas

FAQ

Osiągnięcia

Ranking