Google ogłosiło premierę Gemini 2.0 – najnowszej wersji swojego multimodalnego modelu AI, który znacząco podnosi poprzeczkę dla sztucznej inteligencji, otwierając drogę do tzw. ery agentowej AI.
Rewolucja w sztucznej inteligencji
Sundar Pichai, CEO Google, podczas prezentacji podkreślił, że Gemini 2.0 stanowi kolejny etap w realizacji wieloletniego celu firmy – przekształcenia sposobu, w jaki ludzie korzystają z informacji. Nowy model, wprowadzony rok po premierze Gemini 1.0, oferuje zaawansowane funkcje multimodalne oraz innowacyjne narzędzia użytkowe.
Pierwsza wersja modelu, zaprezentowana w grudniu 2022 roku, była przełomowa jako multimodel AI – zdolny do analizy tekstu, obrazów, wideo, dźwięku i kodu. Aktualizacja 1.5 zyskała uznanie wśród programistów dzięki rozbudowanej zdolności do pracy na dużych zbiorach danych kontekstowych. Teraz, z Gemini 2.0, Google wprowadza AI, która nie tylko rozumie świat, ale także potrafi planować, podejmować decyzje i działać autonomicznie pod nadzorem użytkownika.
Flagowy model Gemini 2.0 Flash
Kluczowym elementem nowej wersji jest model Gemini 2.0 Flash, który cechuje się szybszym czasem reakcji i większą wydajnością. Oferuje wsparcie dla generowania obrazów i dźwięku w wielu językach na podstawie tekstu. Model integruje się z narzędziami Google, jak wyszukiwarka, a także z funkcjami zdefiniowanymi przez użytkowników.
Gemini 2.0 Flash jest dostępny dla programistów i przedsiębiorstw przez Gemini API w Google AI Studio i Vertex AI, a większe rozmiary modeli pojawią się w styczniu 2024 roku.
Gemini 2.0 – nowe narzędzia i zastosowania
Gemini 2.0 wprowadza szereg innowacji, takich jak:
- Deep Research – asystent badawczy, który automatycznie opracowuje raporty na temat złożonych zagadnień.
- AI Overviews – funkcjonalność, która usprawnia obsługę wieloetapowych zapytań w wyszukiwarce Google.
Nowy model wykorzystuje zaawansowaną infrastrukturę Tensor Processing Units szóstej generacji, znanych jako Trillium, które umożliwiły szybkie szkolenie i działanie Gemini 2.0.
Eksperymentalne projekty agentów AI
Wraz z premierą Gemini 2.0 Google zaprezentowało prototypy agentów AI, które pokazują potencjał tej technologii:
- Project Astra – uniwersalny asystent AI, testowany na Androidzie, łączący funkcje wyszukiwania, map i innych narzędzi Google.
- Project Mariner – asystent przeglądarkowy, który automatyzuje zadania w sieci, takie jak wypełnianie formularzy czy obsługa stron internetowych.
- Jules – narzędzie wspierające programistów, integrujące się z GitHub i automatyzujące zadania związane z kodowaniem.
Odpowiedzialność i bezpieczeństwo w rozwoju AI
Google podkreśla, że rozwój AI musi iść w parze z odpowiedzialnym podejściem. Gemini 2.0 zostało poddane rygorystycznym testom bezpieczeństwa, a mechanizmy takie jak „red-teaming” pomagają zapobiegać zagrożeniom. Projekt Mariner zawiera zabezpieczenia chroniące przed phishingiem, a Project Astra oferuje rozbudowane opcje zarządzania danymi użytkowników.
„Tylko odpowiedzialny rozwój AI pozwala budować rozwiązania, które służą ludziom” – zaznaczył Pichai.
Premiera Gemini 2.0 Flash to kolejny krok w stronę stworzenia uniwersalnego asystenta AI.