Jeszcze przed wybuchem fascynacji AI mówiło się o tym że dane są złotem, teraz dane stają się najcenniejszym zasobem. Giganci technologiczni, tacy jak Google, Meta, i Apple, konkurują nie tylko na polu innowacji, ale także w zakresie pozyskiwania danych do trenowania swoich zaawansowanych modeli AI.
Fotobanki jako źródło danych dla AI
Photobucket, niegdyś wiodąca platforma hostingowa zdjęć, mimo spadku popularności, posiada archiwum zawierające 13 miliardów zdjęć i filmów. Firma ta, prowadzona przez CEO Teda Leonarda z Colorado, rozważa licencjonowanie swojego zbioru dla szkolenia modeli generatywnej AI. Rozmowy dotyczą stawek w przedziale od 5 centów do 1 dolara za zdjęcie i ponad 1 dolara za film, z zauważalnymi różnicami w zależności od typu obrazu i kupującego.
Rozmawialiśmy z firmami, które mówią, 'potrzebujemy znacznie więcej’, Leonard dodał, przy czym jeden z kupujących powiedział mu, że chce ponad miliard filmów, więcej niż ma jego platforma.
Ted Leonard, CEO, Photobucket
Shutterstock i Freepik również licencjonują
Shutterstock, lider w dostarczaniu obrazów, zawarł kluczowe umowy z Meta, Google, Amazon i Apple, z początkowymi transakcjami wahającymi się od 25 do 50 milionów dolarów. Freepik, konkurencyjna platforma, również wkroczyła na ten rynek, licencjonując swoje 200-milionowe archiwum obrazów za 2 do 4 centów za sztukę, poszerzając wachlarz dostępnych dla gigantów danych.
Rola Defined.ai w ekosystemie danych AI
Defined.ai, firma specjalizująca się w danych dla AI, współpracuje z czołowymi firmami technologicznymi, dostarczając obrazy, filmy i teksty. Ceny wahają się od 1 do 2 dolarów za obraz, a do 300 dolarów za godzinę filmu, z odrębnym cennikiem dla treści wrażliwych, takich jak zdjęcia nagości.
Prywatność i etyka w centrum uwagi
Rozwój rynku danych dla AI wiąże się z poważnymi pytaniami dotyczącymi prywatności i etyki. Firma Tumblr i Reddit, wchodząc w interakcje z firmami AI, stają się częścią debaty na temat wykorzystania starych danych internetowych w nowych modelach AI, podkreślając potrzebę jasnych ram prawnych i etycznych w tej dynamicznie rozwijającej się dziedzinie.