Co jakiś czas dostaje pytanie w stylu: "ej! 6 lat temu opublikowałeś w zestawieniu takiego fajnego linka na temat XYZ. Podałbyś mi go?"
Nie pamiętam wszystkich linków publikowanych w ramach #unknownews (było ich przez te lata ponad 5000), ale zrobiłem właśnie pobieralne archiwum w postaci pliku PDF (560+ stron)
Potrzebujesz czegoś z archiwum? CTRL+F i w drogę! ( ͡º͜ʖ͡º)
@bgrzegorz: używam zewnętrznej usługi werfyikacji adresów. Twierdzi ona, że to 'temp mail / spam mail'. Na stronie jest info, że otrzymujesz 'Unlimited Disposable Addresses'. Jak rozumiem, można generować sobie dowolną ilość śmieciowych maili jednorazowych.
Za $19/rok masz najmniejszy pakiet. Nieograniczona liczba kont, aliasów i domen. Używam ich podczas pentestów u klientów. Działa spoko.
Obsługuje POP3 / IMAP / SMTP / webmail, a obsługiwany jest przez grupę fanatyków, którzy nie lubią dużych korporacji i zezwalają na pentesty i kampanie phishingowe white-hat ;)
czemu nie wrzuciłeś po prostu do ściągnięcia albo w ogóle w formie HTML-owej? Bez złośliwości pytam
@jaksiepatrzy: wrzuciłem w ten sposób, aby poszerzyć liczbę subskrybentów newslettera. Wersja HTMLowa jest tak długa, że aż zamula przeglądarkę (kilkanaście MB plik), więc zdecydowałem się na PDF, który ładuje się każdemu bez problemu.
A nie mozesz je uzupelniac na swojej stronie? PDF jest nieporeczny. Jasne ze pewnie znajde na twojej liscie jakis fajny serwis cloud ( ͡º͜ʖ͡º), na ktorym bede mogl trzymac tego pdf'a. Wolalbym jednak przeszukiwac twoja strone za pomoca wyszukiwarki.
A nie mozesz je uzupelniac na swojej stronie? PDF jest nieporeczny.
@jeanpaul: istnieje na szybko napisana wyszukiwarka używająca tej samej bazy danych, na podstawie której powstał PDF. Tylko wyszukiwarka jest tak beznadziejna, że sam jej nie lubię ;)
Nie pamiętam wszystkich linków publikowanych w ramach #unknownews (było ich przez te lata ponad 5000), ale zrobiłem właśnie pobieralne archiwum w postaci pliku PDF (560+ stron)
@imlmpe: Mnie się wydaje, ze bardziej przydatne byłoby CSV.. Mozna by napisać app/web app z np. jQuery/AJAX, która by wyszukiwała/filtrowała po podanym filter-stringu w regex-ie.
P.S. Nie gwarantuję, że wszystkie linki działają. Niektóre z nich mają już 6+ lat, a trudno je wszystkie zweryfikować.
Właśnie można by stworzyć skrypt PHP/Perl/JS który by wczytał je po kolei, i zrobił na nich wget/curl/file get contents(), i zapisał kod błędu HTTP i/lub przeanalizował czy zawierają oczekiwana treść itp.
Nie jest to też takie proste i oczywiste. Musiałbyś do tych linków dorzucać jeszcze ekstra tzw. "oczekiwaną" treść, która byłaby wskaźnikiem czy link wciąż działa prawidłowo. A autor mógł sobie przez 6 lat aktualizować artykuł i usunąć/zmienić akurat część,
To pokazuje, moim zdaniem, że lepiej nie ruszać linka i niech prowadzi, gdzie prowadzi. Jak jest 403, 404 albo jakaś inna treść, niezwiązana (np. przejęcie domeny czy coś), to trudno - mniej z tym problemów niż inne rozwiązania, które mają swoje wady. Na mój gust, to jest prędzej zmartwienie autorów stron, aby utrzymywali je w działaniu.
@devopsiarz: Ja bym przyjął 80/20 rule i te 4xx wyciął skryptem a resztę zostawił jak
"ej! 6 lat temu opublikowałeś w zestawieniu takiego fajnego linka na temat XYZ. Podałbyś mi go?"
Nie pamiętam wszystkich linków publikowanych w ramach #unknownews (było ich przez te lata ponad 5000), ale zrobiłem właśnie pobieralne archiwum w postaci pliku PDF (560+ stron)
Potrzebujesz czegoś z archiwum? CTRL+F i w drogę! ( ͡º ͜ʖ͡º)
➤ https://unknow.news/pelnearchiwum.php
P.S. Nie gwarantuję, że wszystkie linki działają. Niektóre z nich mają już 6+ lat, a trudno je wszystkie zweryfikować.
Tagi: #ciekawostki #technologia
Przecież podałem prawdziwego maila ( ͡° ʖ̯ ͡°)
@bgrzegorz: tak, yopmail.com + vfemail.net to bardzo Twój mail ;)
Na stronie jest info, że otrzymujesz 'Unlimited Disposable Addresses'. Jak rozumiem, można generować sobie dowolną ilość śmieciowych maili jednorazowych.
@imlmpe: jaka to usługa?
@normanos: używam (lekko zmodyfikowanej) bazy danych z Mailcheckera.
https://github.com/FGRibreau/mailchecker/blob/master/list.txt
@bgrzegorz: rzuć okiem np. na https://www.migadu.com/pricing/
Za $19/rok masz najmniejszy pakiet. Nieograniczona liczba kont, aliasów i domen.
Używam ich podczas pentestów u klientów. Działa spoko.
Obsługuje POP3 / IMAP / SMTP / webmail, a obsługiwany jest przez grupę fanatyków, którzy nie lubią dużych korporacji i zezwalają na pentesty i kampanie phishingowe white-hat ;)
@jaksiepatrzy: wrzuciłem w ten sposób, aby poszerzyć liczbę subskrybentów newslettera.
Wersja HTMLowa jest tak długa, że aż zamula przeglądarkę (kilkanaście MB plik), więc zdecydowałem się na PDF, który ładuje się każdemu bez problemu.
@becvvv: tak - tylko linki ogólnodostępne.
Linki dla patronów są np. tutaj https://mrugalski.pl/linki.php
A nie mozesz je uzupelniac na swojej stronie? PDF jest nieporeczny.
Jasne ze pewnie znajde na twojej liscie jakis fajny serwis cloud ( ͡º ͜ʖ͡º), na ktorym bede mogl trzymac tego pdf'a. Wolalbym jednak przeszukiwac twoja strone za pomoca wyszukiwarki.
@jeanpaul: istnieje na szybko napisana wyszukiwarka używająca tej samej bazy danych, na podstawie której powstał PDF. Tylko wyszukiwarka jest tak beznadziejna, że sam jej nie lubię ;)
https://uw7.org/szukaj/
Kiedyś napiszę coś lepszego.
@imlmpe: Mnie się wydaje, ze bardziej przydatne byłoby CSV.. Mozna by napisać app/web app z np. jQuery/AJAX, która by wyszukiwała/filtrowała po podanym filter-stringu w regex-ie.
@
Nie jest to też takie proste i oczywiste. Musiałbyś do tych linków dorzucać jeszcze ekstra tzw. "oczekiwaną" treść, która byłaby wskaźnikiem czy link wciąż działa prawidłowo. A autor mógł sobie przez 6 lat aktualizować artykuł i usunąć/zmienić akurat część,
@devopsiarz: Ja bym przyjął 80/20 rule i te 4xx wyciął skryptem a resztę zostawił jak