Badacze z Massachusetts Institute of Technology (MIT) podjęli próbę odtworzenia ludzkiego sposobu widzenia, symulując tzw. widzenie peryferyjne w modelach sztucznej inteligencji (AI). Skupili się na widzeniu peryferyjnym, które pozwala ludziom dostrzegać obiekty poza bezpośrednim polem widzenia, chociaż z mniejszą szczegółowością. Ta zdolność rozszerza nasze pole widzenia i jest niezwykle przydatna w wielu sytuacjach. Może pomóc na przykład w wykrywaniu nadjeżdżającego z boku pojazdu.
Wyzwanie dla sztucznej inteligencji
AI, w przeciwieństwie do ludzi, nie posiada naturalnego widzenia peryferyjnego. Wyposażenie modeli wizji komputerowej w tę zdolność mogłoby znacząco poprawić ich efektywność w wykrywaniu nadchodzących zagrożeń czy przewidywaniu. AI mogłoby na przykład zasymulować czy ludzki kierowca w danej sytuacji zauważyłby nadjeżdżający obiekt. Badacze z MIT opracowali zestaw danych obrazów, który pozwala na symulację widzenia peryferyjnego w modelach uczenia maszynowego.
Widzenie peryferyjne – technika i odkrycia
Zastosowanie tego zestawu danych w treningu modeli poprawiło ich zdolność do detekcji obiektów w peryferiach wizualnych. Jednak nadal modele te pozostają daleko w tyle za człowiekiem. Wyniki badań ujawniły, że w przeciwieństwie do ludzi, ani wielkość obiektów, ani ilość wizualnego chaosu w scenie nie miały dużego wpływu na wydajność AI.
Znaczenie dla bezpieczeństwa i zrozumienia zachowań
Praca ta ma potencjał, aby poprawić bezpieczeństwo kierowców oraz przyczynić się do lepszego zrozumienia ludzkich zachowań. Poprzez głębsze zgłębienie widzenia peryferyjnego w modelach AI, badacze mogą lepiej przewidywać ludzkie zachowania. Zrozumienie tego, jak działa widzenie peryferyjne, może pomóc w analizie tego, co skłania nasze oczy do zbierania więcej informacji.
Widzenie peryferyjne – dalsze kierunki badań
Eksperymenty pokazały, jak dobrzy są ludzie w wykrywaniu obiektów w swoim widzeniu peryferyjnym, co było zaskoczeniem dla badaczy. Odkrycie to podkreśla różnice w strategiach wykrywania obiektu w polu widzenia między ludźmi a modelami AI. Otwiera ponadto drogę do dalszych badań mających na celu zrozumienie tych różnic. Ostatecznym celem jest znalezienie modelu, który może przewidywać z ludzką wydajnością położenie obiektu znajdującego sie na peryferiach wizji. Naukowcy liczą, iż umożliwi to tworzenie systemów AI ostrzegających kierowców o zagrożeniach, których mogą nie zauważyć.
Wnioski i implikacje
Badanie to dowodzi, że ludzkie widzenie peryferyjne nie powinno być postrzegane jako ograniczone z powodu mniejszej liczby fotoreceptorów, ale raczej jako optymalizacja. Ma nam bowiem umożliwić nam wykonywanie zadań o realnym znaczeniu. Ponadto pokazuje, że modele sieci neuronowych nie są jeszcze w stanie dorównać ludzkiej wydajności w tej dziedzinie. Powinno to skłonić do dalszych badań nad modelami AI uczącymi się na podstawie neurobiologii ludzkiego wzroku.