Wpis z mikrobloga

#programowanie #analizadanych
W 2021 chcialem poanalizowac dane dla ofert na rynku IT w Polsce i ustawilem sobie malego crona w AWSie, ktory raz dziennie zaciagal dane z JustJoinIT (z endpointu wystawiajacego wszystkie oferty) i zapisywal otrzymanego JSONa do bucketu w S3. Zarzucilem projekt z braku czasu, natomiast cron dzialal sobie caly czas i nazbieralo sie troche danych - pierwszy zaciagniety dzien to 2021-10-23, a ostatni dzien to 2023-09-25 (no i brakuje 32 dni z powodu #!$%@? kodu lambdy).

Postanowilem opublikowac ten dataset, wiec jak ktos ma ochote pogrzebac w tych danych, to mozna je sciagnac tutaj: https://www.kaggle.com/datasets/jszafranqb/justjoinit-job-offers-data-2021-10-2023-09

1GB po skompresowaniu, ~8.5GB bez kompresji, 1 plik JSON per dzien.
  • 10
  • Odpowiedz
  • 2
@Kamokamo Dzieki!

@Pan_latarka Compute w calosci za darmo - wszystko we free tierze (Lambda + wywolujacy ja trigger w EventBridge). Za storage place w tej chwili $0.26 (wliczajac podatek) - pliki trzymane jako S3 standard.
  • Odpowiedz
@jszafran: ciekawi mnie jaka jest różnica między ofertami a faktyczną stawką w umowie. Ja na przykład zostałem kiedyś zatrudniony na kwotę X na stanowisko gdzie w ofercie była kwota od X do Y (w sensie: dolna stawka). Kwota wciąż była dobra, ale takie justjoinit zapewne podając "przeciętne zarobki programisty" obliczy średnią z tych dwóch ( ͡° ͜ʖ ͡°)
  • Odpowiedz