Maijā OpenAI uzlabotā balss režīma demonstrācija aizrāva auditoriju, radot sajūsmas vilni. Tomēr šī sākotnējā aizraušanās ātri pārvērtās par vilšanos, kad tika atklāts, ka šī funkcija būs pieejama tikai šogad.
Pasteidzieties dažus mēnešus, un OpenAI ir ieviesis uzlaboto balss režīmu visiem ChatGPT lietotājiem, tostarp gan bezmaksas, gan maksas abonentiem. Tā kā tehnoloģija tagad ir pieejama plašākai lietošanai, ir pienācis laiks novērtēt tās veiktspēju un noskaidrot, vai tā atbilst sākotnējās vitrīnas izvirzītajām augstajām cerībām.
Iespēju un ierobežojumu novērtēšana
Lietotāji, kuri gaidīja, ka uzlabotais balss režīms atspoguļos iespaidīgās funkcijas, kas tika parādītas iepriekšējā demonstrācijā, radīja jūtamu vilšanos. Galvenās funkcijas, piemēram, multimodalitāte, interneta savienojamība un failu augšupielādes iespējas, manāmi trūkst. Neskatoties uz ChatGPT Search izlaišanu, balss režīmam joprojām trūkst reāllaika interneta piekļuves un atjauninājumu.
Turklāt nespēja turpināt balss sarunas no iepriekšējām teksta mijiedarbībām ierobežo tā praktiskumu. Šis trūkums krasi kontrastē ar daudzsološajām iespējām, kas tika izceltas demonstrācijas laikā, mudinot lietotājus vēlēties funkcijas, kas paliek nerealizētas.
Sarunu plūsmas uzlabojumi
Neskatoties uz ierobežojumiem, uzlabotais balss režīms uzrāda ievērojamus uzlabojumus salīdzinājumā ar tā priekšgājēju. Sarunas šķiet organiskākas, un lietotāji to var pārtraukt, negaidot, kamēr AI “padomās”, radot saistošāku pieredzi.
Lai gan daži spekulē par jaunā balss režīma aizmugurprocesiem, mana pieredze liecina, ka starp runāšanu un atbildes saņemšanu ir minimāla nobīde. Šis tūlītējums veicina dialoga sajūtu, kas līdzinās cilvēku sarunai.
Uzteicama ir arī iespēja pārslēgties starp valodām, tostarp hindi, pandžabu, angļu un franču valodu. Tomēr dažreiz ir grūti atšķirt hindi un pandžabu valodu, un balss režīms varētu gūt labumu no tiešās transkripcijas funkcijas valodu apguvei.
Daudzveidīgas un saistošas balss iespējas
ChatGPT balsu izvēle uzlabo lietotāja pieredzi. Pašlaik tas piedāvā šādas balsis:
- Lapene (M) – viegla un daudzpusīga
- Vale (F) – gaišs un zinātkārs
- Breeze (M) — animēta un nopietna
- Sol (F) – gudrs un atslābinājies
- Kļava (F) – jautra un vaļsirdīga
- Cove (M) — komponēts un tiešs
- Ember (M) – pārliecināts un optimistisks
- Kadiķis (F) – atvērts un optimistisks
- Egle (M) – mierīga un apstiprinoša
Šo balsu dzīvīgais raksturs padara mijiedarbību daudz patīkamāku salīdzinājumā ar konkurentu, piemēram, Gemini Live un Copilot, piedāvātajām sarunām, kurām trūkst līdzīgas sarunvalodas plūstamības.
Izaicinājumi ar ierobežojumiem
Lai gan balss režīms var efektīvi nodot stāstīšanai emocionālas nianses, tas ir nepietiekams pārāk stingru ierobežojumu dēļ. Iepriekšējā demonstrācijā lietotāji izmantoja plašāku iespēju klāstu, tostarp iespēju dziedāt, kas tika noņemta, lai izvairītos no iespējamiem autortiesību pārkāpumiem.
Diemžēl šie ierobežojumi pasliktina kopējo pieredzi. Lietotāji var saskarties ar atteikumiem pēc saprātīgiem pieprasījumiem, piemēram, ģenerējot dialogus aktierdarbībai, radot neapmierinātību. Uzlabotais balss režīms dažkārt var izpildīt dažus radošus jautājumus, nedaudz pamudinot, bet bieži vien šķiet, ka nekonsekvence kavē tā lietojamību.
Atmiņas iespējas un konteksta apzināšanās
Ievērojama uzlabotā balss režīma iezīme ir tā spēja atsaukt informāciju. Tomēr tas neļauj sekot balss sarunām esošajās tērzēšanas sarunās, kurās ir teksts vai attēli, kas ir būtisks ierobežojums.
Salīdzinājumam, Gemini Live atbalsta pastāvīgu dialogu neatkarīgi no iepriekšējiem tērzēšanas kontekstiem, izceļot jomu, kurā OpenAI varētu būt jāuzlabo, lai efektīvi konkurētu.
Ātrās reaģēšanas laiki
Lai gan ātras atbildes uzlabo sarunu dinamiku, tās dažkārt var traucēt dialoga plūsmu. AI mēdz nepareizi interpretēt pauzes kā aicinājumu atbildēt, izraisot pārtraukumus, kas var izjaukt lietotāja domu gājienu.
Funkcija, kas lietotājiem ļauj signalizēt par ilgākām pauzēm, līdzīgi pogai “Turēt”, ievērojami uzlabotu šīs mijiedarbības dabiskumu.
Reizēm nelielas kļūmes
Lielākā daļa mijiedarbības ar uzlaboto balss režīmu notiek vienmērīgi, taču lietotāji dažkārt var saskarties ar nelielām kļūmēm, piemēram, īslaicīgām statiskām vai negaidītām balss izmaiņām. Lai gan šīs problēmas parasti ir nelielas, tās dažkārt var traucēt lietotāja pieredzi.
Izmaksu un pieejamības apsvērumi
Uzlabotais balss režīms ir pieejams bezmaksas ChatGPT plānā aptuveni 15 minūtes mēnesī, taču pilnīgai piekļuvei ir nepieciešams abonements. Tas ir pretstatā tādiem konkurentiem kā Copilot un Gemini Live, kas lietotājiem piedāvā savas balss funkcijas bez maksas.
Abonēšanas maksa, kā arī citos modeļos tādu funkciju kā interneta piekļuves trūkums rada jautājumus par pakalpojuma vērtību, jo īpaši lietotājiem, kurus interesē tikai balss iespējas.
Galīgais novērtējums
Lai gan uzlabotais balss režīms nenoliedzami lepojas ar iespaidīgiem tehnoloģiskiem sasniegumiem, pašlaik tas nepilda visu, kas solīts demonstrācijā. Tās praktiskie pielietojumi ir ierobežoti, un bez būtiskiem uzlabojumiem tas vairāk kalpo kā jaunums, nevis nepieciešams rīks.
Tiem, kas jau ir abonējuši ChatGPT, lai iegūtu tādas funkcijas kā Canvas, Search vai argumentācijas modelis, uzlabotais balss režīms var kalpot kā apburošs papildinājums. Tomēr tas pats par sevi var neattaisnot abonementu.
Atbildēt