Hej, macie 5 minut? Big tech siedzi na górze polskich nagrań głosowych - twoje komendy do asystentów, wyszukiwania głosowe. Wszystko zamknięte.

Mozilla Common Voice to otwarta alternatywa dla rozpoznawania głosu w polskim języku. Dataset dostępny dla każdego, licencja CC0. Polski nadal potrzebuje wielu nagrań.

Nagrywasz zdania, weryfikujesz innych albo dodajesz własne frazy. Zachęcam, to nawet fajna zabawa (o ile nie trafi się na zbyt dużo fraz z polityką)

Link:
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 2
@login0654: wiesz co to jest open source? Korporacje i tak mają już mnóstwo danych dot. naszego głosu, więc albo zaangażujemy się w open source, albo będziemy właśnie płacić korporacjom za wszystko.
  • Odpowiedz
  • 1
@kwanty: si, si - choć mam już dosyć nagrań z Parlamentu Europejskiego. Wykorzystałem nawet trochę tokenów aby wygenerować trochę niepolitycznych fraz 😁
  • Odpowiedz
Cześć, czy zauważyliście, że zniknęła możliwość generowania obrazów w 4K za pomocą Nano Banana? Problem występuje zarówno w Gemini, jak i w Google AI Studio. Na początku, po premierze Nano Banana 2, dało się generować obrazy w wysokiej rozdzielczości i mam wrażenie, że były one również lepsze jakościowo.
#sztucznainteligencja #ai #si #gemini #chatgpt
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 1
Dostepne modele najmu:

1. Interruptible (Przerywalny)Jest to najtańsza opcja, działająca na zasadzie licytacji (podobnie jak "Spot Instances" w AWS).Jak to działa: Wynajmujesz maszynę po bardzo niskiej cenie, ale ktoś inny może Cię "przebić", oferując wyższą stawkę za tę samą maszynę.Ryzyko: Jeśli inny użytkownik zaoferuje wyższą cenę, Twoja instancja zostanie natychmiast zatrzymana (preempted), a Ty stracisz do niej dostęp.Zastosowanie: Idealne do zadań, które można łatwo wznowić, np. trenowanie modeli z częstym zapisywaniem punktów kontrolnych
  • Odpowiedz