Mireczki. Mam dostep do #wykopapi i chce zebrac wszystkie wpisy na mikroblogu z tagu o samochodach z ostatnich 2 lat i zrobic wykres/policzyc ile dane slowo wystapilo w komentarzach/samym wpisie np. ford mondeo w ciagu tego okresu.

Czy ktos robil cos podobnego?
Jak sie do tego zabrac w ogole?

Sa jakies gotowe narzedzia do podobnych zabaw?
  • 12
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@WykopX: bo czym tu się chwalić, to ledwie próba uporządkowania chaosu, zawracanie kijem rzeki. Gdyby zadziałał hive mind i choć kilka osób dorzuciłoby cegiełkę lub dwie, to może liczba powtarzających się pytań o to samo by zmalała. A tak - to taka walka jak Rybeczki z ludźmi postującymi byle co na tagu elektronika :)

To też odpowiada na pytanie czy warto "przywracać" wątki - w sumie sam się nieraz zastanawiałem.
  • Odpowiedz
dziala wam endpoint
DELETE
​/entries​/{entryId}
Usuwanie wpisu

w wykop API? ja caly czas dosteję 403, inny endpoint dziala be z problemu hmm
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

W nawiązaniu do poprzedniego wpisu, zrobiłem stronkę która pokazuje kiedy dana osoba wstawiała wpisy na mikro i pod jakim tagiem xD pierwotnie mialo to sluzyc do wykrywania botow
Jak macie jakieś sugestie co tutaj dorzucić to piszcie
Zapraszam:
http://ec2-16-16-110-142.eu-north-1.compute.amazonaws.com:8501

jezeli ktos ma duzo akcji na mikroblogu, to ladowanie troche
iforgotmypass_ - W nawiązaniu do poprzedniego wpisu, zrobiłem stronkę która pokazuje ...

źródło: Screenshot 2024-05-27 at 00.49.09

Pobierz
  • 8
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@iforgotmypass_ myślę, że kluczowe jest dodanie statystyki w jakich godzinach ktoś dodaje wpisy, od 00 do 23.

Spamerzy kupieni przez partie polityczne, dziennikarze będą zawsze widoczni w godzinach pracy, bez aktywności po nocach. Czyli to samo co "Częstotliwość postów w dni tygodnia", tylko godzinowo.

Oczywiście bez minut - grupowanie po godzinie.
  • Odpowiedz
Hej,
Co robię źle chcąc dodać wpis na mikroblogu z pomocą api?

{
"code": 403,
"hash": "",
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Wykop udostępnił Naukowej i Akademickiej Sieci Komputerowej (NASK) zbiór komentarzy zawierających ofensywne i szkodliwe komentarze usunięte wykopu. W wielkim skrócie można sobie przejrzeć co "profesjonalni moderatorzy" wykopu usuwają.

The repository contains the first publicly available dataset of offensive and harmful content banned from a web service Wykop.pl (often called the "Polish Reddit") by professional moderators. Thanks to the Wykop owners, the banned posts and comments have been reclaimed and preprocessed for public usage. The current version of the dataset consists of 24 000 samples of anonymized content, with 12 000 pieces for the "harmful" and 12 000 for the "neutral" (non-harmful) class. It is the first part of the entire set of about 700 000 samples that have been acquired but still need to be processed before launching. In the near future, we will continue to release further batches.


link do repozytorium z danymi: https://github.com/ZILiAT-NASK/BAN-PL/
dane są zanimizowane. Niestety baza danych zawiera pojedyncze usunięte komentarze bez kontekstu, więc czasami ciężko stwierdzić dlaczego i czy w ogóle słusznie treść została oznaczona jako szkodliwa.
sokytsinolop - Wykop udostępnił Naukowej i Akademickiej Sieci Komputerowej (NASK) zbi...

źródło: PB2h3L1

Pobierz
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Siemka sejmowe świry!
Jutro o 10 startuje S04E01 #sejm na #sejmstream!
Nie do końca udało się zaimplementować wszystko co było zaplanowane, ale obiecałem wpisy na żywo z Mirko to są ( ͡ ͜ʖ ͡)
Na sejm.stream jutro będzie czat z YT jak ostatnio.
Na beta.sejm.stream testowo jest tag #sejm odświeżany co 5 sekund.
Gdyby coś było nie tak to dajcie
IceGoral - Siemka sejmowe świry!
Jutro o 10 startuje S04E01 #sejm na #sejmstream!
Nie...

źródło: sejm.stream

Pobierz
  • 21
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@IceGoral: Trochę przeszkadza mi to utożsamianie posiedzenia z "sezonem". W zasadzie to jest S10 (bo dziesiąta kadencja Sejmu) i epizod czwarty. ( ͡° ͜ʖ ͡°) Teraz może tego jeszcze tak nie widać, ale będą zgrzyty z numeracją jak będzie np. osiemdziesiąte posiedzenie Sejmu - to jak, sezon osiemdziesiąty? No i sezony mające jeden odcinek, bo czasem zdarzy się jedno posiedzenie tylko? ( ͡° ͜ʖ
  • Odpowiedz
  • 1
@wonrz: Wczoraj to poprawialiśmy, ale jeszcze dwie osoby do 3 siedziały przy becie i coś innego wpływa na to. Będziemy szukać.

Przy okazji widzę, że wpisów z mirko mi nie zasysa. Na testach było git. Chyba za dużo ich jest :D
  • Odpowiedz
znaleziska da się filtrować ładnie po domenach ale czy da się wyfiltrować wpisy na mirko z dołączonym embedem z danej domeny? konkretnie, gfycat.com
#wykopapi #wykopapiv3 #wykop
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Gratuluje "programiście" który wymyślił przeglądanie historii tagów na wykop 2.0 Zamiast normalnych cyfr, żeby łatwo dało się szukać w historii np. /tag/wykop/strona/1/2/3 to musi byc 1dMex0bCzgNJPUW/85VdPzyTQXnayFa/JKw0x8zuzL7gohp co wygląda mi na customowy hash (saltowany nazwą tagu?) który bóg wie jak jest generowany. Było normalnie - za łatwo to zmieniamy na gorsze ( ͡° ʖ̯ ͡°)

#wykop #wykop20 #wykopapi
  • 6
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Okej, może nie jest to nigdzie materializowane, a ten niby hash ma zakodowaną informację, od którego wpisu należy ładować dane (odpowiednik parenta z SO). Ale wciąż nie znaczy to, że nie mógłby on być jakimś parametrem, by móc swobodnie poruszać się po stronach...
Cóż, czarna lista zalogowanego użytkownika pewnie tu przeszkadza, ale gdyby zamiast typowej paginacji było coś na kształt "pokaż wpisy starsze z wpis id N" to powinno hulać. No chyba
  • Odpowiedz
Pytanie odnośnie #programowanie i #wykopapi. W nowym API są dwa klucze do autoryzacji aplikacji: key oraz secret. Czy ten "secret" jest faktycznie taki secret, że nie powinien być nikomu przekazywany? Bo z tego co widzę, to strona Wykopu wali oba klucze do endpointu "auth" i się z tym nie kryje.
  • 13
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Czy ten "secret" jest faktycznie taki secret, że nie powinien być nikomu przekazywany?


@DrDevil: tak.
Nie sugeruj się tym jak jest na stronie wykopu, tam to działa trochę inaczej niż API
  • Odpowiedz
No dobra, to mam w takim razie drugie pytanie: co w przypadku, gdy piszę aplikację typowo desktopową i muszę jakoś zalogować użytkownika?


@DrDevil: to zalezy,
sa tak jakby dwa modele.
1. Cala aplikacja dziala na jednym "aplikacyjnym" uzytkowniku
2. Kazdu uzytkownik aplikacji loguje sie
  • Odpowiedz
Długo czeka się na dostęp do API Wykopu? 2 dni temu dostałem wiadomość, że do kilku dni dostane odpowiedź i się zastanawiam, czy można się spodziewać przed weekendem.
Ktoś ostatnio wysyłał prośbę o dostęp?
Czy staż na Wykopie ma znaczenie przy przydzielaniu dostępu?

#apiwykop #wykopapi #dlaprogramistow
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach