Czy są na #udemy kursy dla początkujących z zakresu #sztucznainteligencja, w których faktycznie tworzy się jakiś konkretny rezultat (sieć neuronową, algorytm genetyczny, etc)? Interesują mnie treści dla programistów, gdzie rzeczywiście koduje się logikę, a nie układa gotowe klocki. Przeglądam różne kursy, to mam wrażenie, że większość to omówienie pythonowych bibliotek czy sucha teoria ze statystyki. Wolałbym się bardziej skupić na technicznej stronie i być w stanie stworzyć coś namacalnego, np. klasyfikator
@ToJestNiepojete: Ale te biblioteki posiadają właśnie warstwy modeli DL, lub gotowe proste algorytmy ML. Z nich trenujesz i układasz model. Chcesz pisać własne warstwy konwolucyjne dla algorytmu computer vision?
  • Odpowiedz
@Bunch: Mówi prawdę. Model językowy GPT 3.5 nie potrafi generować głosu.
Nie myl modelu językowego jakim jest GPT 3.5 z nakładką GUI jaką jest ChatGPT
Kliknięcie tego buttona powoduje że GUI wysyła tekst do odrębnego api na którym zupełnie odrębne AI przeprowadza text2speech.
To że model językowy nie wie o nowych możliwościach wprowadzonych w GUI to nie jest wina modelu lecz jego autorów że nie zaktualizowali jego wiedzy o ten fakt.
  • Odpowiedz
@Bunch
Mam to samo.
Niestety ich model AI służący do zmiany tekstu na głos nie był wystarczająco mocno dotrenowany na języku Polskim.
(jak wspominałem jest to osobne AI niż to które generuje odpowiedź tekstową)
Objawia się to tym, że w przypadku niektórych symboli lub głosek AI nie potrafi dobrze ich wygenerować w języku Polskim (luki w danych treningowych) więc w ich miejsce daje najbardziej pasujące głoski z innego języka co najczęściej brzmi
  • Odpowiedz
@pogop: Najprościej będzie wrzucić to na YT i tam będziesz miał opcję automatycznej generacji napisów. Łap tutorial. https://www.youtube.com/watch?v=xT04yu1KUQw

Jedna zmiana względem tego filmu - przycisk "transcript" znajduje się teraz w opisie filmu. Rozwiń i zjedź na dół.
Alternatywnie możesz również użyć 3rd party rozwiązań. Jest ich przeogromna ilość. Pierwszy strzał: https://youtubetranscript.com/

Drugi sposób to transkrypcja Wordem (serio!). Korzystałem z tego bardzo często. Musisz zrobić split tych nagrań, żeby wyekstrahować samo audio,
  • Odpowiedz