Nova multimodalna veštačka inteligencija u realnom vremenu: GPT-40 je stigao (VIDEO)

GPT-4o može da odgovori na audio ulaze za samo 232 milisekunde, što kompanija napominje da je "slično vremenu odgovora čoveka"

Instalirajte našu iOS ili Android aplikaciju
FOTO:Unsplash/Possessed Photography

OpenAI objavio je GPT-4o, novi vodeći AI model ove kompanije.

U nazivu “o” označava “omni”, i odražava sposobnost GPT-4o da istovremeno rukuje sa više tipova unosa, uključujući audio, slike i tekst.

Ovaj multimodalni AI model takođe obećava značajna poboljšanja performansi i brzine, lakše korišćenje i više funkcionalnosti.

Velika najava OpenAI stiže samo 24 sata pre početka Gugl-ove konferencije za programere I/O 2024 u Kaliforniji. S obzirom na značajnu podršku OpenAI-a od strane Gugl-ovog konkurenta, Majkrosofta, ovo nesumnjivo nije slučajnost.

FOTO:YouTube/OpenAI

GPT-4o može da odgovori na audio ulaze za samo 232 milisekunde, što kompanija napominje da je “slično vremenu odgovora čoveka”.

Novi model takođe odgovara GPT-4 Turbo performansama na engleskom tekstu i kodu, dok nudi “značajno poboljšanje” sa tekstom na ostalim stranim jezicima.

Što se tiče “vizije” i audio razumevanja, tehnološka kompanija kaže da je GPT-4o “posebno bolji”.

A jedna od najznačajnijih promena je da GPT-4o obrađuje više tipova ulaza i izlaza koristeći istu neuronsku mrežu.

Ovo je u potpunoj suprotnosti sa GPT-3.5 i GPT-4, koji su koristili brojne modele za transkribovanje zvuka u tekst, analizu teksta i vraćanje u audio.

OpenAI kaže da ovaj pristup “gubi mnogo informacija”, a njegovi stariji modeli su se borili da interpretiraju ton i rukuju sa više zvučnika.

FOTO:YouTube/OpenAI

GPT-4 ne može da emituje smeh, pevanje ili izražavanje emocija, iako su pravi smeh i emocije daleko van domašaja bilo kog AI modela, GPT-4o ima mogućnost da ispušta zvuke smeha, kao i da kaže korisniku pod stresom da se smiri.

S obzirom na multimodalne mogućnosti GPT-4o, OpenAI očigledno ima za cilj da učini ChatGPT pravim AI asistentom.

Pošto GPT-4o može da se uključi u razgovore u realnom vremenu, i da komunicira tekstom i slikama, AI može razgovarati sa osobom u širokom spektru prenesenih medija.

“Naš novi model GPT-4o najbolji je model ikada. Pametan je, brz, prirodno je multimodalan i dostupan je svim korisnicima ChatGPT-a, uključujući i besplatan plan. Do sada su modeli klase GPT-4 bili dostupni samo ljudima koji plaćaju mesečnu pretplatu. Ovo je važno za našu misiju” – rekao je izvršni direktor OpenAI, Sem Altman, na tviteru.

Majkrosoft je mnogo investirao u OpenAI, i očekuje se da će tehnologija kompanije pronaći svoj put u Majkrosoft proizvode u relativno kratkom roku.

OpenAI će pokrenuti ChatGPT na desktopu kasnije ove godine, zajedno sa novim GPT-4o mogućnostima. Za sada se uvode samo za odabrane korisnike ChatGPT-a, a uskoro će biti dostupne većem broju ljudi. Takođe dobija pojednostavljen korisnički interfejs kako bi u potpunosti iskoristio nove mogućnosti i bio pristupačniji široj bazi korisnika – piše Petapixel

Izvor: Objektiv.rs

Komentari (0)

    Trenutno nema komentara. Budite prvi koji će komentarisati!

Ostavite komentar