OpenAI spriešanas modeļu o1 un o1-mini ieviešana iezīmē ievērojamu progresu mākslīgā intelekta jomā. Šie modeļi demonstrē uzlabotas spriešanas iespējas, nosakot jaunu standartu dažādās jomās.
o1 un o1-mini spēja efektīvi risināt sarežģītas problēmas un pieņemt niansētus lēmumus nodrošina skaidras, praktiskas atbildes. Šī novatoriskā pieeja pozicionē šos modeļus kā vērtīgus rīkus daudzās jomās.
Kas ir o1 priekšskatījuma modelis?
o1 modelis , kas iepriekš bija pazīstams kā Strawberry , ievērojami atšķiras no OpenAI tradicionālajiem GPT modeļiem, jo tajā tiek izmantoti atšķirīgi algoritmi un apmācības datu kopas. Uzsākts ar solījumu risināt sarežģītas problēmas tādās jomās kā matemātika, zinātne un programmatūras izstrāde, o1 piedāvā neskaitāmas potenciālas lietojumprogrammas. Piemēram:
- Veselības aprūpes pētnieki to var izmantot, lai anotētu šūnu secības datus.
- Fiziķi to varētu izmantot, lai izstrādātu sarežģītas matemātiskas formulas kvantu optikai.
- Izstrādātāji to var izmantot, lai izveidotu un pārvaldītu sarežģītas darbplūsmas.
Jāatzīmē, ka o1 ir demonstrējis ievērojamas spriešanas prasmes, Starptautiskajā matemātikas olimpiādē ( SJO) sasniedzot iespaidīgu rezultātu — 83% , kas ir krasā pretstatā GPT-4o , kas ieguva tikai 13% .
Papildinot o1 modeli, OpenAI atklāja arī o1-mini — racionalizētāku un izmaksu ziņā efektīvāku versiju, kas optimizēta kodēšanai. Lai gan o1 ir prasmīgāks, lai veiktu apjomīgus uzdevumus, o1-mini izceļas ar koda pabeigšanu. Tomēr plašākiem lietojumiem, kam nepieciešamas dziļākas zināšanas, o1 joprojām ir labākā izvēle.
Neskatoties uz progresu, o1 ir ierobežojumi, kas kavē tā lietderību, salīdzinot ar GPT-4o, veicot konkrētus uzdevumus. Tam trūkst interneta pārlūkošanas iespēju, datu analīzes rīku un attēlu vai failu augšupielādes funkciju. Turklāt tam nav atmiņas vai pielāgotu instrukciju, kā arī tas neatbalsta balss izmantošanu.
Šī koncentrēšanās uz nišas tirgiem lika man sākotnēji vilcināties ar o1 modeļu izpēti. Tie var šķist biedējoši tiem, kas nav pazīstami ar to specifiskajiem lietojumiem. Tomēr zinātkāres dzirksts piespieda mani izpētīt, kādas unikālas priekšrocības o1 varētu piedāvāt plašākai auditorijai.
Pirmie iespaidi
Pirmajā tikšanās reizē o1 neapšaubāmi pārsteidz ar savām iespējām. Tomēr tas, kas izceļas vēl vairāk nekā tajā piedāvātie risinājumi, ir tā spriešanas process. Lietotāji var novērot, kā tā nonāk pie secinājumiem, uzlabojot pārredzamību.
Tomēr OpenAI novērojumi ir patiesi: o1 izceļas ar sarežģītiem uzdevumiem, taču tas nenozīmē, ka tas ir pārāks visu veidu izmeklēšanā. Kā norādīja Sems Altmens , o1 rada ievērojamus ierobežojumus, kas kļūst acīmredzami, ilgstoši lietojot: “o1 joprojām ir nepilnīgs, joprojām ierobežots un joprojām šķiet iespaidīgāks pirmajā lietošanas reizē nekā pēc tam, kad ar to pavadāt vairāk laika.” Šis noskaņojums sasaucās ar manu pieredzi.
Loģiskā domāšana
Lai novērtētu tā veiktspēju, es sāku testēšanu ar vienkāršiem loģiskiem jautājumiem, uzdodot o1 mīklu sēriju.
Atbildot uz pirmo mīklu, kas tika uzskatīta par vienkāršu, o1 vajadzēja aptuveni 22 sekundes , lai sniegtu pareizo atbildi. Turpretim GPT-4o un GPT-4o-mini sniedza precīzas atbildes uzreiz. Šī tendence saglabājās arī turpmākajās mīklās, norādot, ka, lai gan o1 apstrādes laiks mainījās, precizitāte saglabājās līdzvērtīga tās kolēģiem.
Pēc tam es apstrīdēju gan o1, gan GPT-4o ar šādu uzvedni:Here we have a book, 9 eggs, a laptop, a bottle, and a nail. Please tell me how to stack them onto each other in a stable manner.
Lai gan tas nebija īpaši praktisks, o1 nodrošināja loģisku izkārtojumu:
Book (base)
9 Eggs (arranged in a 3x3 grid)
Laptop
Bottle
Nail
Un otrādi, GPT-4o ieteica šādu steku:
Book (base)
Laptop
Bottle
Eggs - To put them in a carton (which isn't available) or arrange them in a pyramid
Nail
Šī izpēte parādīja, ka, jautājumiem kļūstot sarežģītākiem, o1 spēja spriest par problēmām sniedz niansētākus risinājumus. Tas var kalpot kā vērtīgs prāta vētras partneris reālās dzīves loģiskām grūtībām.
Palīdzības un atsauksmju rakstīšana
Un otrādi, o1 izmantošana pamata rakstīšanas palīdzībai, piemēram, e-pasta ziņojumu vai uzdevumu sastādīšanai, var izraisīt vilšanos. Tas mēdz būt lēnāks nekā GPT-4o, un izvadi būtiski neatšķiras.
Vienā gadījumā o1 prasīja vairākas minūtes, lai apstrādātu vaicājumu, kā rezultātā radās kļūda. Tomēr tā caurspīdīgais argumentācijas process ļāva man redzēt, ka tas ir novirzījies no efektīva risinājuma, izvēloties klusēšanu, nevis nepareizu atbildi, kas liecina par halucināciju samazināšanos.
Uzmundrināts, es meklēju atsauksmes par savu rakstīto no o1. Mana iepriekšējā pieredze ar ChatGPT atklāja tendenci vājināt manu personīgo balsi. Līdz ar to pie o1 vērsos piesardzīgi, cerot uz citu iznākumu.
Galu galā o1 radītā atgriezeniskā saite atspoguļoja GPT-4o atgriezenisko saiti. Lai gan tā atbildes bija lēnākas un ilgākas, es atklāju, ka jēgpilnas analīzes sasniegšanai GPT-4o bija nepieciešama tikai papildu pamudināšana. Tomēr, ja jūsu vajadzības ir saistītas ar scenāriju rakstīšanu vai radošu ideju ģenerēšanu, kur GPT-4o dažkārt klibo, o1 parādīja labāku izpratni, rūpīgi pārbaudot uzvednes.
Analīze, stratēģija un plānošana
Papildus STEM lietojumprogrammām o1 spriešanas spējas spīd tādās jomās kā stratēģija, plānošana un pētniecība. Tā metodiskā pieeja problēmu risināšanai padara to īpaši piemērotu kontekstos, kuros ir jāņem vērā vairāki mainīgie.
Es izmantoju o1, lai risinātu personīgās veselības problēmas, un tā niansētā perspektīva sniedza ieskatu, ko iepriekš nebiju neievērojis. Tas parādīja o1 potenciālu daudzpusīgai analīzei neatkarīgi no tā, vai to piemēro veselības problēmām vai satura stratēģijām.
Turklāt o1 var papildināt jūsu pētniecības procesu, ļaujot veikt izpēti no dažādiem leņķiem ar minimālu pamudinājumu.
Vai o1 ir piemērots tieši jums?
Izpētot o1 iespējas, varētu rasties jautājums: vai tas ir piemērots modelis jūsu vajadzībām? Pirmkārt, apsveriet tā lietošanas ierobežojumus; o1-preview ļauj nosūtīt tikai 50 ziņojumus nedēļā , savukārt o1-mini ierobežo lietotājus līdz 50 ziņojumiem dienā . Turklāt o1 modeļiem ir nepieciešams abonements, savukārt GPT-4o piedāvā dažas bezmaksas lietošanas iespējas.
Ir ļoti svarīgi novērtēt o1 lietošanas ietekmi uz vidi, kas pazīstama ar lielo resursu patēriņu, jo īpaši, ja veiktspējas atšķirības starp o1 un GPT-4o var būt minimālas. Tomēr uzdevumiem, kas saistīti ar sarežģītu loģiku, stratēģisko analīzi vai daudzpusīgiem novērtējumiem, o1 varētu būt izdevīgāks.
Rezumējot, vai ir pienācis laiks pāriet uz ChatGPT o1? Ne obligāti – vismaz ne vispārēji. Lai gan o1 ir būtisks lēciens spriešanas uzdevumu veikšanā, tā ierobežojumi un īpašais fokuss padara to piemērotāku STEM profesionāļiem vai tiem, kas meklē sarežģītu stratēģisku ieskatu. Ikdienas lietotājam GPT-4o saglabā savu statusu kā daudzpusīgāka iespēja. Tomēr tiem, kurus interesē AI spriešanas nākotne, o1-preview noteikti ir izpētes vērts, lai gan tas, iespējams, vēl neaizstās jūsu vēlamo modeli.
Atbildēt