Aktywne Wpisy
KilY +90
Nareszcie złożylem blaszaka, pierwszego od ponad 15 lat. 3 godziny z życia, ale wyszło i nawet działa. Dużo przyjemniej się to robi bez hdd i napędów.
#pcmasterrace #komputery #pc
#pcmasterrace #komputery #pc
ANON616 +673
Pamiętajcie jeszcze aferę z szefem Dareczkiem?XD
Dareczka tak bardzo boli całą sytuacja, że aż do dziś musi wysłać wiadomości sms do swojej byłej pracownicy xDDDDDDDDDDDDDD
#giftpol #afera #januszebiznesu
Dareczka tak bardzo boli całą sytuacja, że aż do dziś musi wysłać wiadomości sms do swojej byłej pracownicy xDDDDDDDDDDDDDD
#giftpol #afera #januszebiznesu
#programowanie
Hej, mam problem z wyłapaniem "duplikatów" wśród plików. Niestety tych plików mam kilkanaście tysięcy do przejrzenia. Duplikaty same w sobie nie dotyczą całości nazwy pliku tylko błędów, które ktoś wprowadził typu:
00DOWBporte de garage - sectionalgen
01DOWBporte de garage - sectionalegen
Ja wiem, że to są identyczne pliki, ale różniące się "00" i "01" oraz "sectional" i "sectionale". To samo dotyczy poniższych.
20DOWBporte intérieure double - coulissantgen
03DOWBporte intérieure double - coulissantegen
00TAG-MCUNelevation origin - schedule levelgen
00TAG-MCUNélévation origin - schedule levelgen (tutaj różnica między "e" i "é",
56GAWPBcontact fenêtregen
56GAWPBcontacte fenêtregen
ktoś po prostu namieszał w nazwach i wrzucił do jednego wora wszystkie pliki i teraz mam problem z wyłapaniem podobnie brzmiących nazw, żeby je usunąć. Nie mam pomysłu, jak to ugryźć. mam nadzieję, że nie pozostaje mi scrollowanie arkusza z nazwami, żeby wyłapywać takie kwiatki.
Dzięki z góry. Pozdrawiam
Znajdź implementację tego w języku który znasz, oblicz dystans każdy z każdym i tam gdzie uznasz że jest wystarczająco mały - uznaj za identyczne.
edit: chociaż widzę, że nawet jest dedykowany do tego: https://pypi.org/project/python-Levenshtein/