Kas ir Gemini Live un kad tas būs pieejams

Kas ir Gemini Live un kad tas būs pieejams

Google nesen paziņoja par vairākiem Gemini AI modeļa atjauninājumiem, tostarp vairākiem jauninājumiem un jauniem modeļiem. Viens no tiem, kam tika pievērsta liela uzmanība, bija Gemini Live, multimodāls AI modelis, kurā ir video un balss iespējas.

Kopš Bard februārī tika pārdēvēts par Gemini, AI modelis ir kalpojis kā Google palīga aizstājējs Android ierīcēs. Tomēr pašlaik tas ir diezgan ierobežots. Izmantojot Gemini Live, Google cenšas to mainīt, piedāvājot jaudīgāku un daudzpusīgāku AI modeli.

Kas ir Gemini Live?

Lai nodrošinātu lietotājiem uzlabotu AI pieredzi un izmantotu OpenAI GPT-4o uzlaboto ChatGPT, Google nesen savā I/O izstrādātāju konferencē paziņoja par Gemini Live. Gemini Live ļaus lietotājiem veidot dabiskas un personalizētas sarunas reāllaikā, izmantojot balsi un vēlāk arī video.

Jaunais AI modelis ir daļa no Google projekta Astra, kas ir meklēšanas giganta mēģinājums izveidot universālu AI palīgu, kas palīdzības sniegšanai var izmantot dažāda veida ievades datus no ikdienas dzīves. Piemēram, Gemini Live var izmantot tekstu, viedtālruņa kameras attēlus un jūsu balsi, lai atbildētu uz jautājumiem.

Saskaņā ar Google teikto, jaunais dabiskās valodas modelis ne tikai palīdzēs lietotājiem risināt problēmas un veikt dažādas darbības, bet arī jutīsies pilnīgi dabiski mijiedarbības laikā. Lietotāji varēs palaist Gemini Live, pieskaroties balss ikonai savā tālrunī, kas parādīs AI pilnekrāna režīmā ar audio viļņu formas efektu.

Pēc tam varat sarunāties ar AI tāpat kā ar īstu personīgo palīgu. Lielisks piemērs tam, kā uzlabotais AI modelis var jums palīdzēt, ir tas, ka lūdzat tam palīdzēt sagatavoties intervijai. Gemini Live ieteiks prasmes, kuras varat izcelt, sniegs padomus par publisku uzstāšanos un daudz ko citu.

Iespējas

Gemini Live ir aprīkots ar dažām funkcijām, kas padara to par daudz labāku AI palīgu nekā Google Assistant, Apple Siri vai Amazon Alexa.

Divvirzienu balss sarunas

Gemini Live ļauj sarunāties ar to un nodrošina cilvēkam līdzīgas verbālas atbildes, kā rezultātā rodas saistošas ​​un intuitīvas sarunas. Piemēram, varat jautāt par laikapstākļiem, un tas sniegs precīzu un kodolīgu atjauninājumu.

Viedā palīga iespējas

AI modelis var kalpot kā viedais palīgs un veikt tādus uzdevumus kā informācijas apkopošana no e-pastiem un kalendāra atjaunināšana. Piemēram, varat nofotografēt koncerta skrejlapu, un Dvīņi pievienos notikumu jūsu kalendāram.

Vizuālās iespējas

Izmantojot viedtālruņa kameru, Gemini Live var uzņemt video reāllaikā. Tas ļauj identificēt objektus un atbildēt uz jautājumiem par tiem. Piemēram, ja pavērsiet viedtālruņa kameru pret skaļruni un lūdzat Gemini to identificēt, tas jums pateiks, kas tas ir, un pat identificēs tā marku un modeli.

Avots: Google

Kā Gemini Live darbojas?

Project Astra var apvienot runas un vizuālo ievadi, padarot tos viegli saprotamus AI modelim. Pēc tam tā var reaģēt uz informāciju un sniegt nepieciešamo palīdzību. Tāpat kā OpenAI GPT-4o darbinātais ChatGPT, arī Gemini Live ir multimodāls AI un nepaļaujas tikai uz tekstu kā ievadi.

Lai gan Gemini Live sākotnēji izmantos balss ievadi, lai vāktu un analizētu datus sākotnējā izlaidumā, nākamajos mēnešos tas tiks jaunināts, lai apstrādātu un analizētu arī videoklipus, sadalot tos pa kadriem, lai nodrošinātu labāku izpratni un mijiedarbību.

AI var pielāgoties ātrumam, kādā dažādi lietotāji runā, un jūs pat varat to pārtraukt, lai lūgtu paskaidrojumus vai sniegtu vairāk informācijas. Tā spēja atdarināt cilvēku dialogu var nodrošināt saistošāku mijiedarbību. Tādējādi ar to var sarunāties turp un atpakaļ, tāpat kā ar cilvēka palīgu. Turklāt jūs varēsiet izvēlēties kādu no desmit dažādām AI balsīm.

GPT-4o Vs. Dvīņi tiešraidē

Lai gan gan GPT-4o, gan Gemini Live ir multimodāli AI modeļi, šobrīd ir grūti saprast, kurš no tiem darbojas labāk reālajā dzīvē, jo īpaši tāpēc, ka neviens no tiem pašlaik nav publiski pieejams.

Tomēr atšķirībā no ChatGPT, Gemini Live paļaujas uz citiem AI modeļiem, piemēram, Google Veo un Imagen 3, lai nodrošinātu izvadi video un attēlu veidā. Neskatoties uz to, OpenAI un Google demonstrētajās demonstrācijās ChatGPT šķita dabiskāks, un jaunais GPT-4o modelis pat varēja atklāt un simulēt cilvēka emocijas, izmantojot balss signālus.

Turklāt tas var pielāgoties tam, kā vēlaties, lai tas atbildētu, ko Gemini Live nevar izdarīt, vismaz pašreizējā stāvoklī.

Gemini Live pieejamība

Gemini Live būs pieejams Gemini Advanced abonentiem, kas ir AI tērzēšanas robota maksas versija. Tas tiks izlaists nākamajos mēnešos, un paredzēts, ka tā būs plaši pieejama līdz gada beigām.

Tādas lietotnes kā Google Messages varēs pilnībā izmantot Gemini Live priekšrocības, ļaujot lietotājiem mijiedarboties ar AI tieši ziņojumapmaiņas lietotnē.

Gemini Live varētu būt nākamais lielākais Google AI tērzēšanas robota jauninājums un tieši tas, kas tam nepieciešams, lai cīnītos pret tādiem konkurentiem kā OpenAI ChatGPT. Pateicoties multimodālai funkcionalitātei un jaudīgām runas iespējām, jauninātais modelis var palīdzēt uzņēmumam Google gūt panākumus, nodrošinot daudzpusīgu un uzticamu digitālo palīgu.

Pašlaik Google ir tikai paziņojis, ka jauno AI modeli piedāvās maksas abonentiem. Lai gan tas izlaiž bezmaksas lietotājus, kas veido milzīgu Google lietotāju bāzes daļu, mēs ceram, ka Google mainīs savu nostāju un nolems paplašināt Gemini Live pieejamību.

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *