Gorący maj w AI

Rollercoaster w świecie AI. Ta coraz bardziej zacięta rywalizacja budzi ekscytację i lęk

16 czerwca 2024

Sam Altman, prezes OpenAI, zapowiada nowy ChatGPT. Ciekawsze jest jednak to, czego nie mówi. Justin Sullivan / Getty Images

Ostatnie kilka tygodni to prawdziwy rollercoaster w branży sztucznej inteligencji. Ekscytacja miesza się z rozczarowaniami i niepokojem.

boonruen(YAYMicro)/PantherMedia Uaktualniony ChatGPT-4 stał się w pełni multimodalny. Zaczął „myśleć” także obrazem i dźwiękiem.

Bardzo interesująco zrobiło się już pod koniec kwietnia, kiedy Sam Altman, szef OpenAI, zwrócił się do studentów podczas spotkania na Uniwersytecie Stanforda: „ChatGPT-4 to najgłupszy model, jakiego ktokolwiek z was kiedykolwiek używał”. A udostępnienie go (i poprzednika) miało za zadanie jedynie stopniowo przyzwyczajać ludzkość do tej potężnej technologii. Bo jest niemal pewne, że ChatGPT-5 będzie znacznie mądrzejszy niż poprzednik, podobnie jak kolejne modele – przekonywał Altman.

Google, obecnie jeden z największych rywali OpenAI, od ponad ćwierć wieku organizuje w maju coroczną konferencję programistów, na której ogłasza światu swoje nowości. Wypowiedzi Altmana można było więc odebrać jako podgrzewanie atmosfery. Tym bardziej że 12 maja miała nastąpić kulminacja: jego firma postanowiła akurat tego dnia ogłosić coś ważnego całemu światu. Czyli tuż przed wielką imprezą Google zaplanowaną na 13 maja...

Afera głosowa

Prezentacja OpenAI jednych zachwyciła, innych trochę rozczarowała. Ci drudzy bowiem liczyli, że jednak dostaną dostęp do ChatGPT-5, który okaże się co najmniej podobnym skokiem jakościowym jak zeszłoroczny upgrade z wersji 3.5 na 4. Zamiast tego OpenAI do czwórki tylko dostawiło literę „o”. Od Omni, pochodzącego od łacińskiego słowa omnis, czyli „wszystko”, gdyż uaktualniony ChatGPT-4 stał się w pełni multimodalny. Zaczął „myśleć” także obrazem i dźwiękiem, co sprawia, że można z nim porozmawiać prawie tak samo swobodnie jak z drugim człowiekiem, np. przerywając i wchodząc w słowo.

Omni potrzebuje na udzielenie odpowiedzi tylko ok. 320 milisekund, czyli mniej więcej tyle ile ludzie. Dzięki temu może rozmawiać sam ze sobą (np. uruchomiony na dwóch położonych obok siebie smartfonach), co pokazano na jednym z filmów.

Polityka 25.2024 (3468) z dnia 11.06.2024; Nauka ProjektPulsar.pl; s. 56

Oryginalny tytuł tekstu: "Gorący maj w AI"

Marcin Rotkiewicz

Absolwent dziennikarstwa i filozofii na Uniwersytecie Warszawskim oraz stypendysta Knight Science Journalism Program w Massachusetts Institute of Technology. Popularyzuje wiedzę przede wszystkim na temat biotechnologii, ewolucji naczelnych i neuronauki. Interesuje się również teoriami pseudonaukowymi i spiskowymi. Dwukrotnie nominowany do Nagrody Grand Press w kategoriach dziennikarstwo specjalistyczne i publicystyka. Autor wywiadów rzek: z prof. Jerzym Vetulanim „Mózg i błazen” oraz z prof. Bogdanem Wojciszke „Homo nie całkiem sapiens”. Napisał również „W królestwie Monszatana. GMO, gluten i szczepionki”, za którą otrzymał nagrodę redaktorów portalu Mądre Książki. Dziennikarz działu Nauka/projektpulsar.pl.