Wpis z mikrobloga

Skopiuj link

30.12.2022, 11:53:03

Uczę się ostatnio #machinelearning i nie mogę znaleźć odpowiedzi na jedno pytanie.

Otóż, w jaki sposób zarządza się danymi z różnych sensorów/źródeł, gdzie dane mają różny wymiar? Chodzi mi szczególnie o składowanie w bazie.
Np. gdybym chciał analizować ruch człowieka przy pomocy kamer i czujników zamontowanych na ciele, to jak zapisać te dane, aby łatwo można było je wczytać w kodzie i analizować? A jakby się jeszcze dodało dodać do tego tekst, który opisuje parametry przy jakich zebrane były próbki, to w ogóle było super.
Szukam w google czegoś takiego, ale nic nie mogę znaleźć. Jak ludzie sobie więc z tym radzą?

Powinno być coś takiego, bo to musi być częsty problem dla osób zarządzających dużymi bazami.

#programowanie #bazydanych #ai #python

patrolez

30.12.2022, 12:03:16

@Ardeo: no specyficzne przypadki wymagają specyficznych rozwiązań.

Jeżeli jesteś zaawansowany odpowiednio, to najlepiej zacząć od napisania symulatora, który byłby w stanie ci wygenerować wszystkie dane wraz z odwzorowaniem ich rozmieszczenia przestrzennego np. na szkielecie, wraz z możliwością ich powtarzalnego zanimowania (albo na jakimś silniku fizyki, nawet tych używanych w grach komputerowych, albo znowu samemu), aby potem je móc zserializować (zapisać do pliku) i zdeserializować (odczytać z pliku).

Analiza całego ruchu ciała

Saly

30.12.2022, 12:09:41

@Ardeo: generalnie modnym podejściem jest trzymanie danych jako blobów bez wstępnego strukturyzowania https://en.wikipedia.org/wiki/Data_lake

patrolez

30.12.2022, 12:11:19

@Ardeo: tutaj jakieś cebulowe narzędzie do Motion Capture: https://www.reddit.com/r/blender/comments/tbvdki/freemocap_a_free_open_source_markerless_motion/

Ardeo

30.12.2022, 12:15:55

Jeżeli jesteś zaawansowany odpowiednio, to najlepiej zacząć od napisania symulatora, który byłby w stanie ci wygenerować wszystkie dane wraz z odwzorowaniem ich rozmieszczenia przestrzennego np. na szkielecie, wraz z możliwością ich powtarzalnego zanimowania (albo na jakimś silniku fizyki, nawet tych używanych w grach komputerowych, albo znowu samemu), aby potem je móc zserializować (zapisać do pliku) i zdeserializować (odczytać z pliku).

@patrolez: Czyli coś w stylu kodera i dekodera? Wydaje mi się

patrolez

30.12.2022, 12:23:11

@Ardeo: no to nie zrozumiałem jednoznacznie z komunikatu, jak mocno chcesz analizować ruch, że w sensie, typu binarnie "jest, nie ma", czy chcesz np. osobno binarnie z dokładnością do rozróżniania kończyn, czy może jednak chcesz wprowadzić już ocenienie "poziomu" wychylenia się kończyn w czasie.

Jeżeli chodzi o potencjalne labelowanie filmików, to moja pierwsza myśl, to skorzystać z istniejących formatów do tworzenia tekstów do filmów, np.:
https://pl.wikipedia.org/wiki/SRT

A jeżeli o sam rodzaj

patrolez

30.12.2022, 12:34:18

@Ardeo: przykład jak to sobie np. w chmurze Azure wygląda:
https://pl.seequality.net/azure-storage-dla-inzynierow-danych-wszystko-co-powinienes-wiedziec/

Czyli coś w stylu kodera i dekodera

@Ardeo: tak, aby później mieć dane zgodne z frameworkiem do ML, którego używasz.

Np. https://pandas.pydata.org/docs/reference/api/pandas.json_normalize.html

patrolez

30.12.2022, 13:00:42

https://pandas.pydata.org/pandas-docs/dev/user_guide/io.html#normalization

Ardeo

30.12.2022, 13:01:51

@patrolez: ok, dzieki. Będę teraz przeglądał te linki.

Ardeo

30.12.2022, 13:20:43

@patrolez: a tak jeszcze dopytam, czy to co napisałem pod koniec, czyli "można zrobić kolejny plik csv z trzema kolumnami i tam powpisywać identyfikatory powyższych plików, aby zachować informacje o powiązaniach", a pliki video i dane z sensorów trzymałbym po prostu w osobnych folderach. Nie jest przypadkiem najprostszym rozwiązaniem mojego problemu?

Z jakiegoś powodu wydawało mi się, że to nie będzie dobre rozwiązanie, ale teraz nie mogę znaleźć kontr argumentów. Plik

wyjechany

30.12.2022, 20:08:46

@Ardeo: ogólnie to jak masz dane z innch źródeł i czujników to najlepiej jest to wszystko połączyć w jeden plik, po czasie, patrząć czy eventy się zgadzają na początku, środku i końcu. jak masz wszystko w jednej bazie to możesz później robić ML.
Najgorsza zabawa zawsze jest z czyszczeniem i łączeniem danych żeby to miało później sens dla ML algorythms.

Bob13

07.01.2023, 08:56:56

@Ardeo: to ja w sumie w doktoracie podobnymi rzeczami się zajmuje.
U mnie wygląda to tak że mam 100 uczestników eksperymentu, dla każdego jest 20 przejsc chodu w których jest X próbek chodu. Łączenie w jeden plik to fantastyka naukowa, bo po co łączyć dane ktore ani nie będę czytelne w formie Csv ani dla jakiego media playera. Zrób dogodna dla Ciebie strukturę a na koniec wygeneruje plik CSV który to

Ardeo

07.01.2023, 14:48:15

@Bob13: dokładnie tak zamierzam zrobić. Jest sobie baza z danymi, a ja tylko dorabiam plik csv, który tworzy relację pomiędzy poszczególnymi plikami i metadanymi.

Zaskoczyło mnie tylko, że takie rozwiązanie okazuje się najlepsze oraz że trzeba je sobie zrobić samemu. Myślę, że w świecie ML mogłoby się pojawić jakieś ustandaryzowane, open-source narzędzie do tego, że jest tutaj mała luka do uzupełnienia, ale może to właśnie tylko kwestia czasu?

Aktywne Wpisy

again_and_again

again_and_again +1200

4 godz. i 33 min temu

Wkrótce usunę ten wpis, więc radzę się pospieszyć z czytaniem

#matura

againandagain - Wkrótce usunę ten wpis, więc radzę się pospieszyć z czytaniem

#matur... — **źródło:** ang
Pobierz

mirko_anonim

mirko_anonim +33

3 godz. i 38 min temu

✨️ Obserwuj #mirkoanonim
Siema. Szybka piłka. Remontuję mieszkanie developerskie, które kupiłem sam 2 lata temu na etapie dziury w ziemi. Będę mieszkał z dziewczyną, która oczywiście nie partycypuje w kosztach raty itd, co jest dla mnie zrozumiałe.
Niezrozumiałe dla mnie jest to, że ona nie chce partycypować w żadnych kosztach związanych z remontem. Zakup mebli, agd, paneli. Mówi że nie będzie dopłacać do mojego mieszkania i to dla mnie jest OK, ale

Aktywne Wpisy

Aktywne Znaleziska

Zabijaja nam Odre! Zobacz, co ukrywają!

Media: Francja wysłała około 100 żołnierzy na Ukrainę

WPROST ujawnia majątek ludzi ojca Rydzyka. Zamieszani są politycy PiS

Kiedy "indywidualizm" wejdzie za grubo....

Bartosz Walaszek kończy dzisiaj 47 lat

Popularne tagi