Wpis z mikrobloga

Czy badawczą częścią pracy magisterskiej (program modyfikujący dokumenty pdf), może być sprawdzanie istniejących funkcji (kilku), biblioteki gotowej- której używam oraz interpretacja danych zwracanych na różne sposoby, w celu osiągnięcia danej funkcjonalności programu ?
Zaznaczam że funkcji jest cała masa i dopiero odpowiednie ich użycie prowadzi do zadowalającego wyniku, po odpowiedniej nadbudowie przeze mnie (użycie klasy abstrakcyjnej)
Promotor mi zarzucił że to nie jest badawcze, bo przecież te funkcje już są zrobione... No oczywiście że są, ale są to dosyć proste funkcje, zwracające w większości dane liczbowe... których odpowiednie użycie i zrozumienie, pozwala te dane użyć w innym miejscu, co dopiero wtedy prowadzi do rozwiązania problemu postawionego w wymaganiach pracy.
#nauka
#naukaprogramowania
#pracamagisterska
#pracadyplomowa
#studia
#studbaza
  • 20
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Poczmistrz_z_Tczewa: Zamazuje dane wrażliwe, występujące w formie obrazów bądź w formie źródłowej dokumentu, np takie dane jak PESEL, numer telefonu, imie i nazwisko i cokolwiek innego człowieczek sobie zdefiniuje.
Problem jest w samych plikach .pdf, które nie dają się tak łatwo edytować, o ile w wordzie czy innym edytorze tekstowym, takie coś to łatwizna, o tyle w .pdf to troche inne bajka.
Co więcej w dokumentach pdf występują obrazy w
  • Odpowiedz
@Poczmistrz_z_Tczewa: Propozycja jaką dostałem od promotora na rozdział badawczy to: różne konfiguracje parametrów silnika którego używam i ich wpływ na jego działanie. Tylko że ja z góry wiem że to sie nie uda, bo te parametry dużo nie pomogą, z racji takiej że narzędzie nie jest do końca dopracowane.
  • Odpowiedz
@Poczmistrz_z_Tczewa: To nie do konca jest machine learning, nie mam modelu uczenia maszynowego w tej aplikacji. Zakładam że uczenie maszynowe to zmiana funkcji dynamicznie w programie w oparciu o otrzymane wyniki... Niestety zmiany takie muszę robić ja- programista. Poprostu wciągasz pdfa, a ja jestem na tyle sprytny że wiem co mam zamazać i gdzie.
Jak to wiem? Stosuje wyrażenia regularne, obliczam m.in współrzędne grafiki po transformacjach które robi silnik pdf,
  • Odpowiedz
Co więcej w dokumentach pdf występują obrazy w formie grafiki wektorowej (rysowane przez silnik PDF), których nie widać jako obrazki- znalazłem sposób na ich anonimizacje również, ale nie ma takiej funkcji 'zamaż mi wszystkie obrazy z dokumentu PDF'.


@shaelix92:
Da się to prosto zrobić bez dodatkowych narzędzi. Ja to robię tak:
1. W jakimś prostym edytorze (np.https://www.pdfescape.com/open/) nakładam prostokąt na pesel.
  • Odpowiedz
Pomóżcie mi z tego co zrobiłem wymyśleć problem badawczy ( ͡° ʖ̯ ͡°) Jak usłyszałem o tych parametrach, to przykro mi się zrobiło, to jest w stanie zrobić osoba po 2 miesiecznym kursie programowania, a ja odwaliłem kawał naprawde dobrej roboty...( ͡° ʖ̯ ͡°)
  • Odpowiedz
a anonimizacje przeprowadzam dokładnie tak jak napisałeś- rysuje prostokąt na tym tekscie/obrazku.


@shaelix92:
Ale spłaszczasz potem? Bo przecież pesel jest pod spodem i ktoś z edytorem go odnajdzie ( ͡° ͜ʖ ͡°)
  • Odpowiedz
@Poczmistrz_z_Tczewa: Dokładnie to zrobiłem, opisałem problem spacji- że czasami wyrazy mi łączy bo jest tzw. biała spacja. To znalazłem funkcje która sprawdza mi czy pomiedzy wyrazami jest połowa szerokości jakiegoś tam standarowej wielkości znaku, jeżeli tak to wstawiam spacje i już jest ok, a samo narzędzie w swojej funkcjonalności tego nie zauważy.
TO NIE JEST BADAWCZE, PARAMETRY SE POZMIENIAJ.
Takie coś usłyszałem od promotora... ręce mi opadły poprostu
  • Odpowiedz
@Poczmistrz_z_Tczewa: reguły, w sensie wyrażenia regularne tak ?
Powiem Ci tak, co do regexpów to też sprawy nie miałem prostej ze względu na obiektowość w swoim Programie.
Utworzyłem klasę Słowo, która ma współrzędne słowa (sprytnie je obliczam, nieważne jak).
Potem utworzyłem klasę LINIA, która zawiera listę słów
A klasa strona ma listę linii, no i teraz problem jest z wyrażeniami taki że przecież coś może sie kończyć na pierwszej linii
  • Odpowiedz