Wpis z mikrobloga

@Syntax: Szacun za pracę. Przydałoby się otwierającą tablicę zedytować, bo są tam zwykłe błędy.
Też słyszę: zgwałcili mnie. Ale ciekawym - a pytam Cę jako specjalistę - czy te odszumianie czasami nie wypłukuje czegoś? Rozumiesz? Szum jest jakąś integralną częścią całości. Czy jest pewność, że odróżniłeś go od głosu?
  • Odpowiedz
@1korner: Szum leży zawsze w całym paśmie. A ludzka mowa to harmoniczne znajdujące się w specyficznych miejscach w widmie częstotliwości.

Szum jednostajny w paśmie słyszalnym:
|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|#|
20
  • Odpowiedz
@Syntax: Rozumiem, bo zajmuję się fotografią i wiem co mogą nawyprawiać pixele. Fajnie, że te rysunki podajesz, bo to otwiera merytoryczną dyskusję. Miejmy nadzieję, że znajdą się tacy w temacie, żeby to nie była tylko gadka laików takich jak ja.
  • Odpowiedz
@1korner: Takie głoski jak "a" "o" "u" "e" są dźwięczne i siedzą w paśmie jako harmoniczne. Nawet osłabiając selektywnie jakiś wąski zakres częstotliwości, nie da się ich zupełnie usunąć. Natomiast takie głoski jak "z" "c" "i" są bardzo silne w wysokich tonach i bardzo krótkie. Na nagraniu nie ma w tym momencie żadnych stuków czy innych zakłóceń w wysokich częstotliwościach poza szumem. Największym problemem są te nieszczęsne głosy w tle.
  • Odpowiedz
Wcześniejsza próba sprzed paru dni, dokładnie pokazuje, że "zgwałc" jest bez zakłóceń. Tu jest podkreślone aż do przesady:
https://instaud.io/WYi
To też pokazuje, że niezależnie od obróbki, wypowiadane słowa, nie ulegają aż takiemu zniekształceniu. Mowa ludzka jest zbyt bogata w częstotliwości, by coś ewidentnie zafałszować, przekombinować.
Ta ostatnia obróbka, finalna, pokazuje jednak dużo więcej detali, bo zostały użyte dużo lepsze narzędzia.
  • Odpowiedz
@Syntax: O Boże, Syntax, Ty bierzesz mnie za fachowca!
Sam widzisz, że zgwał może oznaczać sgwał, czyli sylaba.
A słowo może za tym iść inne. A tu przecież jedna litera może zmienić znaczenie słowa.
Coś tak było w filmie Antonioniego "Powiększenie" : zabójca siedział w krzakach, czy jednak nie siedział ? Lecz tamto to była fotografia analogowa. Teraz mamy niby lepiej. Dopieszczamy każdy dźwięk do końca. Ale cholera wie czy to jest lepiej. Może ci z boku mają rację - słyszą to, co słyszą i basta.

Oczywiście milion razy to słuchałeś - osobiście podobnie słyszę jak Ty - biorąc pod uwagę, że mam ucho słonia. Tylko, że Tobie to odebrało dystans. Śmiem twierdzić, że już nie słyszysz całości, tylko wycinek. Musiałbyś ze dwa tygodnie się wyłączyć - nie tylko z tej akustyki. Ale i z całej sprawy! Żeby świeżym uchem od nowa spojrzeć
  • Odpowiedz
@1korner: Problem w tym że nie ma takiego wyrazu jak "sgwał". Nie możemy dyskutować z pewnością w taki sposób, że nawet jak już wiemy że tam jest "zgwał", to przyjdzie ktoś i powie że tam mogło być: "spał". Owszem mogło, tylko że to nie ma sensu i zwyczajnie nie słychać tam "spał".
Już ktoś kiedyś skomentował, że słyszy: "do domu chcę". Nie da się z takimi ludźmi dyskutować. To jest straszne, już pomijając analizę audio, zwyczajnie to jest pogwałcenie logiki i słuchu jakiegoś przeciętnego słuchacza.
Każda obróbka daje ten sam efekt, każda wyciąga nieco inne aspekty.
Ja po prostu dziwię się ludziom, którzy słyszą: "zgwałcili mnie", ale mądrzą się, że tam jest coś innego, że może być coś innego. Paranoja! Gdybym nagrał teraz swój głos: "zgwałcili mnie" i dał wam do posłuchania, to zapewne znalazł by się jakiś procent osób, które spierały by się, że powiedziałem: "skarcili mnie". Nie ważne że to nie ma sensu, ale skwitują, że nagranie było niewyraźne, więc pasuje tam każde możliwe słowo... No ratujcie mnie ludzie! ;)

I to ciekawe, że akurat ludziom przychodzą do głowy wszystkie mało prawdopodobne wyrazy, ale tego "zgwałcili mnie" unikają jak ognia, żeby tylko ośmieszyć to, co sami słyszą :) No bo skoro to jest tak bardzo prawdopodobne w kontekście całej sprawy, że ją zgwałcono, na dodatek słychać to w wydobytej wypowiedzi, to na pewno nie może być prawda, bo może to nie jest "z" tylko "s". Odrobina zdrowego rozsądku, znajomość fonetyki, kontekst całej sprawy. Wszystko stoi za poparciem tych słów jakie
  • Odpowiedz
@1korner: Taki tok rozumowania po prostu rozwala: "Ja też słyszę 'Zgwałcili mnie' ale tam może być 'Do domu chcę'". To tak samo jakby mówić: ja też widzę rower, ale to może być autobus. Albo: ja też czuję zapach perfum, ale to może być psia kupa. Albo się słyszy (widzi, czuje) albo nie, trzeciej możliwości nie ma.
  • Odpowiedz
@grejfrut: Ale po co napisy? Przecież są napisy w "filmie" :) Chodzi Ci o to, by sprawdzić, czy algorytm dobrze wykryje słowa? W sumie to jest myśl ;)
  • Odpowiedz
@grejfrut: Już mu to podrzucałem. Próbuję jakoś przestawić język napisów. Niestety wygenerował automatycznie angielskie i nie wiem jak to zmienić jeszcze.
  • Odpowiedz