Wyszukiwanie obrazów z nowym trybem AI

Google wprowadza przełomowe zmiany w wyszukiwaniu obrazem. Od teraz Google Lens wzbogacone jest w tryb wyszukiwania AI. Innowacyjna funkcja sztucznej inteligencji ma dostarczyć więcej odpowiedzi na podstawie dostarczanego obrazu. Całość zasilana jest modelami językowymi Gemini. Sprawdzamy, co zmieni nowy tryb AI w wyszukiwaniu obrazem, jak działa i jak może nam pomóc na co dzień!

Wyszukiwanie obrazem z funkcją sztucznej inteligencji

Google Lens zyskuje nowy tryb wyszukiwania z pomocą sztucznej inteligencji. Do słynnej soczewki Google, która jest jednym z najpopularniejszych feature’ów Google wszechczasów, została dodana nowa funkcjonalność AI. Sztuczna inteligencja w soczewce pozwala użytkownikom przesyłać zdjęcia i zadawać szczegółowe pytania, łącząc technologię Google Lens z zaawansowanymi możliwościami rozumowania modelu Gemini. Generowane odpowiedzi uzupełniane są o linki do stron internetowych, różne rekomendacje oraz opcje dalszego zgłębiania tematu. Według danych Google zapytania w nowym trybie AI są przeciętnie dwukrotnie dłuższe niż standardowe wyszukiwania. Mają lepiej sprawdzać się w sytuacjach wymagających lepszego researchu potrzebnego do doradzenia użytkownikowi lepszego wyboru.

Tryb AI w wyszukiwaniu obrazem Google Lens to przede wszystkim:

  • zadawania otwartych pytań wymagających złożonych odpowiedzi,
  • porównywania różnych produktów i ich funkcjonalności,
  • wyszukiwania szczegółowych instrukcji i poradników,
  • planowania podróży i tworzenia rozbudowanych itinerariuszy.

Wyszukiwanie multimodalne w trybie AI – główne zastosowania

Najnowsza aktualizacja wprowadza do trybu AI możliwość wyszukiwania multimodalnego. Wpływa to na zwiększenie bazowych możliwości narzędzia i rozszerza katalog potencjalnych zastosowań. Dzięki tej opcji możemy między innymi:

  1. Przesyłać zdjęcia lub robić je bezpośrednio w aplikacji – funkcja pozwala na wykorzystanie zarówno zapisanych wcześniej obrazów, jak i fotografowanie interesujących obiektów w czasie rzeczywistym.
  2. Zadawać pytania dotyczące przesłanych obrazów – użytkownicy mogą formułować zapytania odnoszące się bezpośrednio do zawartości zdjęcia, np. „Co to za roślina?” lub „Gdzie mogę kupić podobne meble?”.
  3. Otrzymywać szczegółowe odpowiedzi uwzględniające pełny kontekst obrazu – system nie tylko identyfikuje poszczególne elementy, ale także rozumie ich wzajemne relacje, kolory, materiały i układ przestrzenny.
  4. Korzystać z linków do stron internetowych, aby dowiedzieć się więcej – odpowiedzi zawierają odnośniki do źródeł, gdzie można znaleźć dodatkowe informacje o obiektach widocznych na zdjęciu.

Widać więc, że nowa funkcja sztucznej inteligencji od Google nastawiona jest przede wszystkim na komfort użytkowników. Faktycznie oferuje ona szereg przydatnych możliwości. Przykładowo, przesyłając zdjęcie regału na książki, użytkownik może otrzymać nie tylko identyfikację poszczególnych tytułów, ale także rekomendacje podobnych książek wraz z linkami umożliwiającymi ich zakup. System jest w stanie rozpoznać detale takie jak gatunki literackie, autorzy, a nawet stan książek czy materiały, z których wykonany jest regał.

Jak działa funkcja AI w wyszukiwaniu wizualnym?

Klasyczne wyszukiwanie wizualne odchodzi w zapomnienie. Nowa odsłona Google Lens przeszła szereg modyfikacji. Całość jest silnie sprzężona z Gemini, aby zapewnić dokładne i kontekstowo trafne odpowiedzi. Proces przetwarzania zapytania wizualnego w soczewce Google składa się kilku głównych etapów:

  1. Holistyczna analiza obrazu przez model Gemini – zaawansowany model AI analizuje całościowy obraz, identyfikując relacje między obiektami oraz kontekst sytuacyjny.
  2. Precyzyjna identyfikacja obiektów przez Google Lens – technologia rozpoznawania obrazów Google Lens identyfikuje poszczególne elementy widoczne na zdjęciu z wysoką dokładnością.
  3. Równoległe wyszukiwania wielokontekstowe – system przeprowadza jednocześnie wiele wyszukiwań dotyczących zarówno całego obrazu, jak i poszczególnych zidentyfikowanych obiektów.
  4. Agregacja i analiza zebranych informacji – algorytm gromadzi znacznie więcej danych, niż byłoby to możliwe przy standardowym wyszukiwaniu.
  5. Generowanie szczegółowej i trafnej odpowiedzi – na podstawie zebranych informacji system tworzy kompleksową odpowiedź, która adresuje pytanie użytkownika w kontekście przesłanego obrazu.

Warto zwrócić uwagę na technikę, którą w materiałach Google określa jako „query fan-out„, co moglibyśmy przetłumaczyć jako “rozszerzanie zapytań”. To technika, która pozwala na skuteczne łączenie różnych typów wyszukiwań i źródeł informacji, aby dostarczyć użytkownikowi najbardziej wartościowych odpowiedzi. Wykorzystanie modelu Gemini do rozumienia kontekstu oraz Google Lens do precyzyjnej identyfikacji obiektów pozwala na sprawniejsze wyszukiwanie danych w wielu różnych kontekstach. System nie tylko „widzi” obraz, ale również „rozumie” go w sposób zbliżony do ludzkiej percepcji.

Smartfon wyświetla stronę główną wyszukiwarki Google na białym tle
Soczewka Google to najpopularniejszy dodatek, który zdobył zaufanie milionów użytkowników.

Tryb AI w wyszukiwaniu obrazem – korzyści dla użytkowników

Rozszerzenie możliwości wyszukiwania obrazem o nowy tryb AI z wyszukiwaniem multimodalnym ma szereg korzyści dla użytkowników. W praktyce nowa funkcjonalność oznacza:

  1. Bardziej intuicyjne wyszukiwanie – możliwość zadawania pytań o obiekty, które widzimy, bez konieczności ich opisywania tekstem.
  2. Głębsze zrozumienie złożonych tematów – AI Mode pozwala na eksplorację tematów na różnych poziomach szczegółowości.
  3. Oszczędność czasu – szybsze uzyskiwanie odpowiedzi na złożone pytania bez konieczności przeprowadzania wielu osobnych wyszukiwań.
  4. Personalizacja doświadczeń wyszukiwania – system adaptuje się do indywidualnych potrzeb i zainteresowań użytkownika.

Wyszukiwanie obrazem z AI – dostępność i warunki korzystania

Warto w tym miejscu napomknąć także o kwestii dostępności. Pomimo tego, że Google Lens zawsze było opcją otwartą, nowy tryb AI nie jest jeszcze dostępny dla wszystkich użytkowników. Początkowo nowy tryb sztucznej inteligencji został wprowadzony do soczewki dla użytkowników na terenie Stanów Zjednoczonych. Wiadomo, że systematycznie usługa będzie rozszerzana na pozostałe państwa. Aby skorzystać z soczewki w trybie AI, konieczne będzie także spełnienie dodatkowych warunków, takich jak:

  • Posiadanie konta Google,
  • ukończony wiek co najmniej 18 lat,
  • korzystanie z najnowszej wersji aplikacji Google lub przeglądarki Chrome,
  • włączona historia wyszukiwania.

Użytkownicy mogą uzyskać dostęp do trybu AI na kilka sposobów:

  • poprzez stronę google.com/aimode,
  • z poziomu strony głównej Google.com (klikając opcję „AI Mode” pod paskiem wyszukiwania),
  • za pomocą aplikacji Google.

Praktyczne przykłady, gdy Google Lens z AI zdziała cuda

Potencjał implementacji sztucznej inteligencji do wyszukiwania obrazem jest ogromny. Aby lepiej zdać sobie z niego sprawę, warto przeanalizować kilka przykładów scenariuszy zastosowania nowej funkcjonalności. Pierwszy przykładem może być sfotografowanie nieznanej rośliny w swoim ogrodzie i zapytanie: „Co to za roślina i jak powinienem się nią opiekować?” Po otrzymaniu takiego promptu na podstawie zdjęcia system samodzielnie zidentyfikuje gatunek, dostarczy informacji o optymalnych warunkach uprawy, częstotliwości podlewania, wymaganiach dotyczących nasłonecznienia oraz potencjalnych problemach, z którymi właściciel może się spotkać.

Funkcje sztucznej inteligencji zaprojektowane z myślą o tym, by były użyteczne w trakcie codziennych sytuacji. Dobrym przykładem jest robienie zakupów. Sfotografowanie mebla w sklepie czy czasopiśmie pozwala użytkownikowi zapytać: „Gdzie mogę kupić podobny mebel w niższej cenie?” Tryb AI nie tylko zidentyfikuje produkt, ale również zasugeruje podobne alternatywy w różnych przedziałach cenowych, uwzględniając preferencje stylistyczne użytkownika.

Co więcej, tryb AI w wyszukiwaniu obrazem pomoże także w gotowaniu. Wystarczy zrobić zdjęcie otwartej lodówki tak, aby widoczne były na nim składniki kulinarne, które aktualnie posiadamy. System sam je przeanalizuje, a następnie na ich podstawie ułoży propozycje możliwych do przygotowania posiłków. Gemini ma też pomagać w edukacji. Przykładowo, uczniowie mogą zrobić zdjęcie problemu matematycznego lub naukowego i zapytać: „Jak rozwiązać to zadanie?” System nie tylko dostarczy rozwiązanie, ale także wyjaśni metodologię krok po kroku, zasugeruje dodatkowe materiały edukacyjne i powiąże problem z szerszymi koncepcjami naukowymi.

Logo obiektywu Google jest wyświetlane na smartfonie
Tryb wyszukiwania obrazami przy pomocy sztucznej inteligencji na początku dostępny jest tylko w Stanach Zjednoczonych.

Wyszukiwanie obrazów z nowym trybem AI – podsumowanie

Dodanie funkcji wyszukiwania obrazem do trybu AI Google oraz rozszerzenie dostępu dla milionów nowych użytkowników w Stanach Zjednoczonych to początek dalszej implementacji AI w poszczególnych usługach Google. Sprawdza się strategia wyznaczona w grudniu przez Sundara Pichai, który mówił, że 2025 rok będzie rokiem AI. Na przestrzeni następnych miesięcy mamy zobaczyć coraz więcej usług Google, które zyskuję dostęp do Gemini. Wyszukiwanie obrazem – zarówno w wyszukiwarce, jak i w Google Lens – jest tego doskonałym potwierdzeniem.

Tryb AI dla wyszukiwania wizualnego nie powinien być traktowany jako kolejny, dodatkowy feature. Nie tylko zwiększa on użyteczność wyszukiwarki Google dla przeciętnego użytkownika, ale również sygnalizuje głębsze zmiany w sposobie, w jaki będziemy wchodzić w interakcje z technologią w przyszłości. Ma to siłą rzeczy ogromne implikacje dla pozycjonowania stron (SEO), bo coraz więcej informacji i interakcji użytkownik będzie dzielił z modułami AI, a nie z klasycznymi wynikami wyszukiwania. W miarę jak Google kontynuuje rozwijanie i udoskonalanie swoich technologii AI, wszyscy zainteresowani – od zwykłych użytkowników po profesjonalistów branży technologicznej – powinni śledzić te zmiany z uwagą.

Napisz komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *