Nauka

Gorący maj w AI

Rollercoaster w świecie AI. Ta coraz bardziej zacięta rywalizacja budzi ekscytację i lęk

Sam Altman, prezes OpenAI, zapowiada nowy ChatGPT. Ciekawsze jest jednak to, czego nie mówi. Sam Altman, prezes OpenAI, zapowiada nowy ChatGPT. Ciekawsze jest jednak to, czego nie mówi. Justin Sullivan / Getty Images
Ostatnie kilka tygodni to prawdziwy rollercoaster w branży sztucznej inteligencji. Ekscytacja miesza się z rozczarowaniami i niepokojem.
Uaktualniony ChatGPT-4 stał się w pełni multimodalny. Zaczął „myśleć” także obrazem i dźwiękiem.boonruen(YAYMicro)/PantherMedia Uaktualniony ChatGPT-4 stał się w pełni multimodalny. Zaczął „myśleć” także obrazem i dźwiękiem.

Bardzo interesująco zrobiło się już pod koniec kwietnia, kiedy Sam Altman, szef OpenAI, zwrócił się do studentów podczas spotkania na Uniwersytecie Stanforda: „ChatGPT-4 to najgłupszy model, jakiego ktokolwiek z was kiedykolwiek używał”. A udostępnienie go (i poprzednika) miało za zadanie jedynie stopniowo przyzwyczajać ludzkość do tej potężnej technologii. Bo jest niemal pewne, że ChatGPT-5 będzie znacznie mądrzejszy niż poprzednik, podobnie jak kolejne modele – przekonywał Altman.

Google, obecnie jeden z największych rywali OpenAI, od ponad ćwierć wieku organizuje w maju coroczną konferencję programistów, na której ogłasza światu swoje nowości. Wypowiedzi Altmana można było więc odebrać jako podgrzewanie atmosfery. Tym bardziej że 12 maja miała nastąpić kulminacja: jego firma postanowiła akurat tego dnia ogłosić coś ważnego całemu światu. Czyli tuż przed wielką imprezą Google zaplanowaną na 13 maja...

Afera głosowa

Prezentacja OpenAI jednych zachwyciła, innych trochę rozczarowała. Ci drudzy bowiem liczyli, że jednak dostaną dostęp do ChatGPT-5, który okaże się co najmniej podobnym skokiem jakościowym jak zeszłoroczny upgrade z wersji 3.5 na 4. Zamiast tego OpenAI do czwórki tylko dostawiło literę „o”. Od Omni, pochodzącego od łacińskiego słowa omnis, czyli „wszystko”, gdyż uaktualniony ChatGPT-4 stał się w pełni multimodalny. Zaczął „myśleć” także obrazem i dźwiękiem, co sprawia, że można z nim porozmawiać prawie tak samo swobodnie jak z drugim człowiekiem, np. przerywając i wchodząc w słowo.

Omni potrzebuje na udzielenie odpowiedzi tylko ok. 320 milisekund, czyli mniej więcej tyle ile ludzie. Dzięki temu może rozmawiać sam ze sobą (np. uruchomiony na dwóch położonych obok siebie smartfonach), co pokazano na jednym z filmów.

Polityka 25.2024 (3468) z dnia 11.06.2024; Nauka ProjektPulsar.pl; s. 56
Oryginalny tytuł tekstu: "Gorący maj w AI"
Reklama