Wpis z mikrobloga

#google #informatyka #webdev #programowanie #internet #memy

- W Google można wyszukiwać po tekście na stronach (zapisują treść i indeksują).
- W Google można wyszukiwać po obrazku np. po słowach kluczowych w podpisie obrazka w alt="", lub wyszukiwanie obrazem - inne podobne obrazy (zapisują obrazy i indeksują).

Czemu nie zrobią tego?
- Wykonanie OCR obrazków oraz zapisywanie i indeksowanie tekstu. Brakowało mi tego jak np. chciałem wyszukiwać mem po tekście.

Wykonanie prostego OCR jest stosunkowo łatwe. Sam mógłbym to zrobić, tylko, że:
- Nie mam takich możliwości przerobowych jak Google. Przetworzenie choćby wszystkich memów z Wykopu, to stosunkowo duży koszt dla jednej osoby (myślę, że serwera za kilkaset zł miesięcznie i w kilka miesięcy by się udało, a potem tylko nowe na bieżąco).
- Nie mam gdzie tego zapisywać. Nawet jakbym miał ten tekst, to przecież nie wrzucę go Google. Z obrazkami na Wykopie mógłbym zrobić tak, żeby zrobić bota, który by chodził i jako komentarz wklejał tekst. Po zaindeksowaniu tego przez Google dałoby się wyszukiwać po tekście w komentarzu. Tylko to dodatkowy spam na Wykopie. I nie zawsze Google zaindeksuje komentarz. I to się sprawdzi tylko na Wykopie, w innych serwisach nie mam uniwersalnej możliwości dodawania treści.

Jak myślicie, czemu Google tego nie zrobił?
Czy mogę ja coś z tym zrobić? Jakiś pomysł na serwis, żeby jakoś sprytnie to zrobić?
Czy zrobienie tego chociażby na Wykopie (OCR wszystkich obrazków i wstawienie botem jako komentarze) ma sens?
  • 1
Jak myślicie, czemu Google tego nie zrobił?


@mk321: Przeogromne koszty, Google określa "crawl budget" nawet dla stron tekstowych, żeby nie złapać zadyszki, te wymagające większych zasobów (np. z dużą ilością JS) są indeksowane z opóźnieniem (przynajmniej treść renderowana przez JS). Już bardziej rozsądne wydaje się, żeby właściciele stron tak opisywali obrazki, aby były łatwo wyszukiwalne przez Google. Coś jak Facebook, który skanuje zawartość zdjęcia i wrzuca automatycznie w alt co jest