Problemy z chmurą Google – na przykładzie błędnego wyszukiwania w czasie rzeczywistym

Posted: 2010/03/21 by wildwezyr in Pisanie o tym jest w modzie
Tagi: , , , , , , ,

Mniej więcej wczoraj polskie serwisy i blogi obiegła sensacyjna (?) wiadomość o dostępności wyników w czasie rzeczywistym na polskiej stronie wyszukiwarki Google’a. Źródłem wiadomości jest polski oddział Google.

(Tu miało być moje buzznięcie, ale Google mnie nie lubi, nic swojego nie mogę znaleźć!)

Tradycyjnie czujnym i sceptycznym nastawieniem wykazał się chyba tylko Hazan z antyweb.pl ;-). Inni jak zwykle zadziałali jako piewcy (fanboye?) Google lub bezmyślni kopiowacze – na blogach, w serwisach, na Blipie i na Buzzie, gdzie popadnie…

Otóż nie wszyscy mają tyle szczęścia aby móc zaobserwować te jakże przydatne rozszerzenie – wyniki wyszukiwania w czasie rzeczywistym (WOW!)… Jedni widzą wyniki niemal od razu, inni po czasie, jeszcze inni tylko w angielskiej wersji, a w polskiej nie, jeszcze inni wręcz odwrotnie…

Co ciekawe od jakiegoś czasu obserwuje się też rozbieżne wyniki wyszukiwania – dana strona potrafi być u jednej osoby na pozycji 2-giej, a u innej na np. 10-tej. Jakby tego było mało – różne osoby mogą dostać znacząco różną liczbę wyników na to samo zapytanie, nawet gdy używają tej samej wersji językowej Google i inne parametry też mają takie same. Rozbieżność może być drastyczna: raz Google może pokazać 2 mln wyników, innej osobie w tym samym momencie 12 mln, a jeszcze innej np. 18 mln znalezionych stron.

Dlaczego tak się dzieje? Winna jest chmura czyli architektura jaką stosuje Google aby obsłużyć m.in. zapytania do wyszukiwarki. W uproszczeniu polega to na tym, że każda osoba może trafić na inny serwer w chmurze, a dane pomiędzy serwerami nie są synchronizowane w czasie rzeczywistym (jest to technicznie bardzo trudne lub wręcz niewykonalne).

A więc: wrzucam wpis na Buzza, wchodzę na wyszukiwarkę aby go odnaleźć i co? I często go widzę po kilkunastu minutach, a inni widzą go prawie od razu… Bo trafiają na inny serwer, który jest wcześniej powiadamiany o nowym wpisie w Buzzie. Mój serwer potrzebuje na to więcej czasu, ale pewnie zostanie szybciej powiadomiony o innych aktualizacjach.

Powyższe wyjaśnienie wydaje się tłumaczyć czemu nie możemy właściwie mieć na razie wyszukiwania w czasie rzeczywistym (real-time search) tylko wyszukiwanie w czasie zbliżonym do rzeczywistego (near real-time search). Ciekawe kiedy i czy w ogóle nastąpi tu poprawa?

Może być ciężko, gdyż widać, że Google ma większe problemy ze swoją chmurą, skoro zdarza im się podawać znacząco rozbieżne liczby znalezionych stron w zależności od serwera do którego trafimy.

Poniżej konkretny przykład tutaj – z rozmowy na blipie, na przykładzie szukania Intense Debate w Google przez dwie osoby.

Wyszukiwanie pokazujące 14,2 mln wyników:

A tutaj 2,56 mln wyników dla wersji angielskiej Google:

I jeszcze w tej samej rozmowie pada info o 1,44 mln wyników

I co teraz będzie – czy to jakiś chwilowy problem, czy raczej większa słabość architektury chmur w ogólności – nie tylko tej google’owej? Być może w najbliższym czasie będą wychodziły kolejne kwiatki tego typu, albo te problemy co już są staną się bardziej dotkliwe. Wydaje mi się, że kiedyś można było mieć większe zaufanie do wyników Google.

Na marginesie: czy cały hype wokół wyników w czasie rzeczywistym nie przypomina gorączki wokół Google Wave? Nikt nie rozumie co to jest i po co, jak to będzie używał i czy mu się jakkolwiek przyda, ale wielkie Google coś wprowadza, więc trzeba o tym mówić, bo to jest w modzie ;-). Zobaczymy – może będziemy z tego korzystać do czegoś, a może nie. Jak zacznie wreszcie działać, to pomyślimy. Na razie – bez podniety.

Reklamy
Komentarze
  1. […] dzieje, niewątpliwie… Choć przez chwilę miałem wątpliwości. Po ostatnim wpisie dot. dziwnych wyników Google pogadałem z kolegami w pracy. Rozmowa dotyczyła merytorycznej części dyskusji jaką miałem […]

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Wyloguj / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Wyloguj / Zmień )

Connecting to %s