29.04.200819:51

Nowoczesne wyszukiwanie obrazów według Google

Schemat z artykułu PageRank for Product Image Search
Schemat z artykułu PageRank for Product Image Search

Szumnie (złośliwy powiedziałby - nierealnie) sformułowana misja Google - "uporządkowanie światowych zasobów informacji, aby stały się powszechnie dostępne i użyteczne" - wymaga, by poza tekstem wyszukiwarka była też w stanie interpretować i indeksować obrazy. Jak donosi The New York Times, naukowcy firmy pracują nad możliwością analizowania zawartości grafiki.

Marzena Falkowska

Obecnie przeszukiwanie zasobów graficznych, dźwiękowych czy filmowych jest tak naprawdę przeszukiwaniem tekstów z nimi powiązanych. Google ma już na swoim koncie kilka prób zaindeksowania olbrzymiej liczby dostępnych w internecie obrazów. Jedną z nich, ciekawą i innowacyjną, było zachęcenie samych internautów do opatrywania grafik słowami kluczowymi za pomocą dwuosobowej gry (Google Image Labeler). Problem w tym, że wciąż mamy tu do czynienia z wyszukiwaniem tekstowym - problem języka czy Google bombs (dzięki dowcipom tego typu po wpisaniu do wyszukiwarki słowa "kretyn" na pierwszym miejscu pojawiała się swego czasu strona Andrzeja Leppera) sprawiają, że metodę trudno na dłuższą metę uznać za skuteczną. Poza tym każdego dnia w sieci pojawia się tyle obrazów - sam Flickr zyskuje ich około milion na dobę - że poleganie na czynniku ludzkim jawi się jako, delikatnie mówiąc, niewystarczające.

Yushi Jing i Shumeet Baluja z Google w artykule zatytułowanym PageRank for Product Image Search sugerują tymczasem, że wyszukiwarka jest już w stanie "patrzeć" poza sam tekst. Naukowcy opisują efekty swoich eksperymentów nad połączeniem dostępnego obecnie oprogramowania do rozpoznawania zawartości grafiki z technikami nadawania wartości obrazom, które są do siebie najbardziej zbliżone. Algorytm nazwany przez nich VisualRank nadawać ma wyższą wartość tym obrazom, które zawierają najpowszechniejsze wzory z wielu innych.

Działanie algorytmu zilustrowane zostały na przykładzie widocznym powyżej. Dwa największe wizerunki Mony Lisy umieszczone w środku mają najwyższą wartość, ponieważ są wspólnym mianownikiem dla innych wizerunków, które są ich wersjami zniekształconymi, zmniejszonymi, przebarwionymi itp.

Metoda przedstawiona w artykule wydaje się być naprawdę użyteczna i ma szansę ułatwić w przyszłości wyszukiwanie obrazów w sieci. Czy jest coś, czego możemy się w związku z nią obawiać? Najprawdopodobniej nie, choć z drugiej strony trudno oprzeć się wrażeniu, że to kolejny niewielki kroczek w kierunku ograniczania poczucia prywatności. Zwłaszcza, jeśli połączymy te informacje z istnieniem Street View, jednej z funkcji Google Maps pozwalającej na obejrzenie zdjęć przeszukiwanego obszaru z poziomu ulicy (więcej o kontrowersjach m.in. tutaj), a także faktem przejęcia w 2006 roku przez Google Neven Vision, firmy zajmującej się wydobywaniem informacji ze zdjęć, które w przyszłości może pozwolić na zidentyfikowanie osób czy miejsc na nich uwiecznionych.

Dodaj swój komentarz:
Autor:
Login / Pseudonim: Hasło:
Komentuj pod pseudonimem jako Gość lub zaloguj się
| Załóż konto
Komentarz: