Aktywne Wpisy

R2D2_z_Sosnowca +530
A udało się znowu połazić po krzakach i przy okazji ten młody człowiek zdał egzamin na prawdziwego mężczyznę bo znalazł największy patyk jaki był w stanie podnieść i naparzał nim tak długo aż się złamał. Kto tak nie robił niechaj pierwszy rzuci kamieniem #r2d2zwiedza #natura #usa #connecticut
źródło: Zdjęcie z biblioteki
Pobierz
magdalena-gaska +182
Wkurzają mnie niebiescy piszący z różowych nicków, bądźcie chociaż konsekwentni i piszcie w rodzaju żeńskim, wchodźcie w rolę, za takie oszustwa powinien być ban, tits or gtfo





Napisałem sobie prosty #!$%@? obrazków w C#, który po daniu mu linka do strony ordynarnie #!$%@? z niej wszystkie obrazki o odpowiednich formatach jakie się na niej znajdują ( ͡º ͜ʖ͡º)
Niestety nie działa to zadowalająco, bo AJAXy i inne gówna, jak te elementy skalujące obrazki (te co po najechaniu na obrazek powiększają go). Efekt jest taki, że bez interakcji użytkownika zaoranie HTMLa w poszukiwaniu wszystkiego co ma tag ![]() i podpieprzenie src= zwraca mi jedynie miniatury.
Jak wiadomo w takiej podpieprzajce chodzi nam właśnie głównie o te rozmiary oryginalne a nie miniatury, ale czy da się to w ogóle zrobić bez zasymulowania interakcji użytkownika? JavaScript podmienia nam te obrazki w locie reagując na mouse hover czy klikanie, więc w bazowym linku tych obrazków po prostu nie ma. Da się tutaj jakoś zahaxować czy raczej dupa zbita (przynajmniej jak na moje)?
A z ciekawości pytanie - JS dałby sobie radę z taką wybebeszką?
A do pojedynczych stron to bez problemu da się to wyciągnąć z kodu pewnie.
site:domena.tldi dostajesz listę obrazów, miniaturki możesz wywalić za pomocą filtrowania rozmiaru obrazów. Możesz też określić zakres dat, z których chcesz obrazki.Oczywiście musiałbyś pobrać sobie jakiś słownik i do zapytania dołączać słówka żeby otrzymać jak największą liczbę wyników(bo domyślnie chyba są jakieś ograniczenia).
No i jeżeli robiłbyś to bez API to zapytania do google wysyłaj +/- co
Chociaż łatwiej przyjdzie ci to kombinując z https://pptr.dev/
@Decay: Gra niewarta świeczki raczej, szybciej będzie zrobić na stronie prawoklik -> zbadaj. A tu chodziło właśnie o pominięcie kopania w kodzie źródłowym, tylko wdupcenie linka i naciśnięcie przycisku - żeby było szybciej.
Nie jestem specjalistą, ale jak chcesz to spróbuję pomóc. Napisz na pw o co chodzi, albo tutaj jeżeli to nie tajemnica.
@Khaine: nie wiem jak w C# bo go nie znam, ale zakładam, że same zasady są takie same, zresztą widzę że jest wrapper na C#. Generalnie działa to tak, że odpalasz przeglądarkę (PhantomJS to WebKit)
No i wyciągam, ale nie te rozmiary o które mi chodzi - czyli nie te największe, które wchodzą na stronę dopiero po interakcji z użytkownikiem.
Nic ważnego ogólnie,
webbrowser powinien sobie poradzić z wyciągnięciem zrenderowanego kodu.
A jeżeli obrazki wczytuje dynamicznie, to chyba nie mam pomysłu. Ewentualnie mógłbyś znaleźć jakąś bazę produktów, coś jak ceneo i napisać scraper pod
@Decay: To już działa. Wybebesza wszystko co ma tylko <img i src= z jakimś ludzkim formatem .jpg, .jpeg, .png czy cokolwiek bym chciał - pod warunkiem, że znajduje się w źródłowym HTML (tym wyciągniętym z linku). Problem jest właśnie tam, gdzie ten obrazek ładuje się w pełnej formie dopiero jak klikniesz
https://www.nakrywamy.pl/gerlach-celestia-sztucce-komplet-68-el-pudelko-12-os-polysk-gratis-torba-prezentowa
Natomiast stąd już mi nie zaciągnie tego rozmiaru co się pojawi po kliknięciu na te widelce. Jego widać nie ma w pierwotnym HTMLu, pojawia się później. To zresztą widać, bo wystarczy kliknąć na tym "Zbadaj" i możemy sobie w czasie rzeczywistym obserwować jak się ta sekcja pojawia w kodzie po kliku.
https://www.nakrywamy.pl/images/items/18347/gerlach-celestia-68-opakowanie-2_big.png
Jeżeli o te chodzi to one tam są tylko w tagach a. Jak pisałem żeby scrapować linki to chodziło mi o scrapowanie wszystkiego co zaczyna się na http://. W sumie tutaj też może być problem tylko, że z wyciąganiem linków hmm
A czekaj, zapomniałem wyłączyć javascripta, to chwila.
Dobra, bez js też tam linki są w kodzie. Czyli albo scrapujesz wszystkie linki, albo