Powstanie pierwszy polski otwarty wielki MODEL JĘZYKOWY (PLLUM)

Polski wielki model językowy PLLuM, wytrenowany na treściach głównie polskojęzycznych, oraz oparty na nim inteligentny asystent, powstaną w ramach współpracy sześciu wiodących jednostek naukowych z obszaru AI, przetwarzania języka naturalnego oraz językoznawstwa korpusowego.

- #
- #
- #
- #
- #
- #
- 126
- Odpowiedz
Komentarze (126)
najlepsze
"lubię was"
z polskiego na fiński, to wychodzi"pidän sinusta"
("lubię cię", liczba pojedyńcza), zamiast"pidän teistä"
(liczba mnoga).Nieścisłość
@DEMONzSZAFY: tym bardziej że osoby dla których polski to język ojczysty mają z nim problem xD
Slazacy, jako osobna grupa etniczna maja inne, prostsze umysly przystosowane do pracowania w kopalniach. Nic dziwnego wiec, ze musieli dostosowac jezyk polski do swoich mozliwosci.
"Było, użyj szukaj, zamykam temat."
Najważniejsze by nie blokował używania popularnych słów oznaczających ciasto i pewną roślinę czyli:
murzynek i czarnucha
http://wielkiezarcie.com/przepisy/czarnuch-30004776
@AlexRaven: Chodzi o to, żeby zrobić mniejszy model niż GPT 3/4, taki żeby dało się go lokalnie używać - na 8GB ramu albo wręcz na komórce. Dodatkowo jak przygotują dobrze dane wejściowe i będą dostępne jako open-source to kolejne
@AlexRaven: GPT, ale Llama już niezbyt, szczególnie małe wersje modeli. Z publicznie dostępnych modeli chyba tylko Falcon 180B dobrze radzi sobie z polskim, ale to wielki model, który mało kto może odpalić, a taką Llame 7B czy 13B
https://speakleash.org/
POLSKICH NAUKOWCÓW !!!!!!!
Gnije z tego typu newsów xDD
Każdy może sobie wytrenować model językowy, ludzie nawet się tym nie chwalą. Nawet ja już to zrobiłem do swoich celów mimo, że nie mam technicznego pojęcia (nie pisze tu o fine tuning chata gpt ofc).
Ot kolejny WIELKI worek na hajs dla dziadów z
a to jest przepaść miedzy A40 lub A100 . walenie na kasę z budżet państwa to sie nazywa. Żeby przyzwoity model LLM wytrenować trzeba mieć około 64 kart z pamięcią 80GB. I TO BĘDA TYGODNIE.
jedna karta to 15 000$ - 4 000 000 Zł same karty. Problem