Wpis z mikrobloga

Skopiuj link

19.07.2021, 11:53:10

Co jakiś czas dostaje pytanie w stylu:
"ej! 6 lat temu opublikowałeś w zestawieniu takiego fajnego linka na temat XYZ. Podałbyś mi go?"

Nie pamiętam wszystkich linków publikowanych w ramach #unknownews (było ich przez te lata ponad 5000), ale zrobiłem właśnie pobieralne archiwum w postaci pliku PDF (560+ stron)

Potrzebujesz czegoś z archiwum? CTRL+F i w drogę! ( ͡º ͜ʖ͡º)

➤ https://unknow.news/pelnearchiwum.php

P.S. Nie gwarantuję, że wszystkie linki działają. Niektóre z nich mają już 6+ lat, a trudno je wszystkie zweryfikować.

Tagi: #ciekawostki #technologia

imlmpe - Co jakiś czas dostaje pytanie w stylu:
"ej! 6 lat temu opublikowałeś w zest... — **źródło:** comment_16266954889BILk6wf9GejoX4BCTyrHi.jpg
Pobierz

b.....z

konto usunięte 19.07.2021, 11:57:45

@imlmpe:

W sklepie też płacisz pieniędzmi z Monopoly?

Ta treść nie jest darmowa. Płaci się za nią mailem.

Podając fałszywego maila grasz nie fair...

Przecież podałem prawdziwego maila ( ͡° ʖ̯ ͡°)

imlmpe

19.07.2021, 11:59:10

Przecież podałem prawdziwego maila

@bgrzegorz: tak, yopmail.com + vfemail.net to bardzo Twój mail ;)

b.....z

konto usunięte 19.07.2021, 12:00:45

@imlmpe: co jest nie tak z vfemail.net?

maisterwihaister

imlmpe

19.07.2021, 12:06:06

@bgrzegorz: używam zewnętrznej usługi werfyikacji adresów. Twierdzi ona, że to 'temp mail / spam mail'.
Na stronie jest info, że otrzymujesz 'Unlimited Disposable Addresses'. Jak rozumiem, można generować sobie dowolną ilość śmieciowych maili jednorazowych.

normanos

19.07.2021, 12:08:43

używam zewnętrznej usługi werfyikacji adresów

@imlmpe: jaka to usługa?

imlmpe

19.07.2021, 12:11:48

jaka to usługa?

@normanos: używam (lekko zmodyfikowanej) bazy danych z Mailcheckera.

https://github.com/FGRibreau/mailchecker/blob/master/list.txt

normanos
konto usunięte

b.....z

konto usunięte 19.07.2021, 12:18:01

@imlmpe: polecisz małego emaila który nie należy do wielkiej korporacji i obsługuje mutta?

Falsen123

imlmpe

19.07.2021, 12:23:50

polecisz małego emaila który nie należy do wielkiej korporacji i obsługuje mutta?

@bgrzegorz: rzuć okiem np. na https://www.migadu.com/pricing/

Za $19/rok masz najmniejszy pakiet. Nieograniczona liczba kont, aliasów i domen.
Używam ich podczas pentestów u klientów. Działa spoko.

Obsługuje POP3 / IMAP / SMTP / webmail, a obsługiwany jest przez grupę fanatyków, którzy nie lubią dużych korporacji i zezwalają na pentesty i kampanie phishingowe white-hat ;)

jaksiepatrzy

19.07.2021, 13:02:08

@imlmpe: czemu nie wrzuciłeś po prostu do ściągnięcia albo w ogóle w formie HTML-owej? Bez złośliwości pytam

mk321

becvvv

19.07.2021, 13:06:38

@imlmpe: są tam linki bez tych, do których dostęp mają patroni?

imlmpe

19.07.2021, 13:06:49

czemu nie wrzuciłeś po prostu do ściągnięcia albo w ogóle w formie HTML-owej? Bez złośliwości pytam

@jaksiepatrzy: wrzuciłem w ten sposób, aby poszerzyć liczbę subskrybentów newslettera.
Wersja HTMLowa jest tak długa, że aż zamula przeglądarkę (kilkanaście MB plik), więc zdecydowałem się na PDF, który ładuje się każdemu bez problemu.

imlmpe

19.07.2021, 13:07:17

są tam linki bez tych, do których dostęp mają patroni?

@becvvv: tak - tylko linki ogólnodostępne.
Linki dla patronów są np. tutaj https://mrugalski.pl/linki.php

moon_bluebird

19.07.2021, 13:13:04

@bgrzegorz a ja podełem tempmail'a i poszło (✌ ﾟ ∀ ﾟ)☞

j0seph

jeanpaul

19.07.2021, 13:25:18

@imlmpe: good job - podziekowal

A nie mozesz je uzupelniac na swojej stronie? PDF jest nieporeczny.
Jasne ze pewnie znajde na twojej liscie jakis fajny serwis cloud ( ͡º ͜ʖ͡º), na ktorym bede mogl trzymac tego pdf'a. Wolalbym jednak przeszukiwac twoja strone za pomoca wyszukiwarki.

imlmpe

imlmpe

19.07.2021, 13:27:21

A nie mozesz je uzupelniac na swojej stronie? PDF jest nieporeczny.

@jeanpaul: istnieje na szybko napisana wyszukiwarka używająca tej samej bazy danych, na podstawie której powstał PDF. Tylko wyszukiwarka jest tak beznadziejna, że sam jej nie lubię ;)

https://uw7.org/szukaj/

Kiedyś napiszę coś lepszego.

maniacr

ProgramistaHTML

19.07.2021, 13:29:03

@imlmpe: piszesz o takich technologiach, a archiwum jest dot pehape, szanuję ( ͡º ͜ʖ͡º)

senseiek

19.07.2021, 13:48:05

Nie pamiętam wszystkich linków publikowanych w ramach #unknownews (było ich przez te lata ponad 5000), ale zrobiłem właśnie pobieralne archiwum w postaci pliku PDF (560+ stron)

@imlmpe: Mnie się wydaje, ze bardziej przydatne byłoby CSV.. Mozna by napisać app/web app z np. jQuery/AJAX, która by wyszukiwała/filtrowała po podanym filter-stringu w regex-ie.

P.S. Nie gwarantuję, że wszystkie linki działają. Niektóre z nich mają już 6+ lat, a trudno je wszystkie zweryfikować.

d.....z

konto usunięte 19.07.2021, 14:10:57

@senseiek:

Właśnie można by stworzyć skrypt PHP/Perl/JS który by wczytał je po kolei, i zrobił na nich wget/curl/file get contents(), i zapisał kod błędu HTTP i/lub przeanalizował czy zawierają oczekiwana treść itp.

Nie jest to też takie proste i oczywiste. Musiałbyś do tych linków dorzucać jeszcze ekstra tzw. "oczekiwaną" treść, która byłaby wskaźnikiem czy link wciąż działa prawidłowo. A autor mógł sobie przez 6 lat aktualizować artykuł i usunąć/zmienić akurat część,

Ramciancin

IvanBarazniew

19.07.2021, 14:13:02

To pokazuje, moim zdaniem, że lepiej nie ruszać linka i niech prowadzi, gdzie prowadzi. Jak jest 403, 404 albo jakaś inna treść, niezwiązana (np. przejęcie domeny czy coś), to trudno - mniej z tym problemów niż inne rozwiązania, które mają swoje wady. Na mój gust, to jest prędzej zmartwienie autorów stron, aby utrzymywali je w działaniu.

@devopsiarz: Ja bym przyjął 80/20 rule i te 4xx wyciął skryptem a resztę zostawił jak