fbpx
ՏՏ

OpenAI-ը ներկայացրել է նոր լեզվական մոդել. այն սովորել է մարդու նման մտածել

OpenAI-ը ներկայացրել է լեզվական նոր մոդել՝ o1-ը, որն ունի տրամաբանելու և խնդիրները տրամաբանորեն լուծելու ունակություն: Ի տարբերություն նախորդ մոդելների, o1-ն կարող է նմանակել մարդու մտածելու գործընթացը՝ բարդ խնդիրները բաժանելով ավելի պարզ քայլերի, վերլուծելով տարբեր մոտեցումներ և ուղղելով սեփական սխալները։

o1 լեզվական մեծ մոդելը գերազանց արդյունքներ է ցուցադրել թեստերում և մրցույթներում՝ համեմատած մարդ փորձագետների հետ: Ծրագրավորման ոլորտում o1-ն զբաղեցրել է 49-րդ տեղը 2024-ի Ինֆորմատիկայի միջազգային օլիմպիադայում և հաղթել է Codeforces հարթակի մարդկանց 89%-ին: Մաթեմատիկայի բնագավառում o1-ը դասվել է Միացյալ Նահանգների լավագույն 500 ուսանողների շարքում Ամերիկյան մաթեմատիկական օլիմպիադայի (AIME) որակավորման փուլում՝ ցուցադրելով առավել շնորհալի ուսանողների համար նախատեսված խնդիրները լուծելու ունակություն, OpenAI-ը հայտնում է իր կայքում։

Բնական գիտություններում մոդելը գերազանցել է բժիշկներին և գիտությունների թեկնածուներին GPQA diamond համալիր թեստում, որը գնահատում է գիտելիքները քիմիայի, ֆիզիկայի և կենսաբանության ոլորտներում: «Սա չի նշանակում, որ o1-ն ավելի խելացի է, քան գիտության ցանկացած թեկնածու,- բացատրում են մշակողները,- Սա խոսում է այն մասին, որ մոդելը կարող է որոշ խնդիրներ լուծել բարձրակարգ մասնագետների մակարդակով»։

o1 մոդելը նաև գերազանց ցուցանիշներ է գրանցել նախորդ մոդելների համեմատ բանականության և խնդիրների լուծման թեստերում, ներառյալ MMMU-ն և MMLU-ն: Ըստ OpenAI-ի, նոր մոդելը զգալիորեն գերազանցում է իր նախորդին՝ GPT-4o-ին, տրամաբանական առաջադրանքների մեծ մասի դեպքում: «Մեր փորձարկումը ցույց է տվել, որ o1-ը հետևողականորեն բարելավում է արդյունքները միջամտության ուսուցման ծավալի և մտորումների վրա ծախսվող ժամանակի աճով»,- նշում է ընկերությունը: Մասնավորապես, AIME թեստերում o1 մոդելը լուծել է խնդիրների միջինը 83%-ը, մինչդեռ GPT-4o-ի արդյունքը կազմել է 13%:

Մոդել o1 հալյուցինացիաները զգալիորեն ավելի քիչ են, քան GPT-4o-ի դեպքում: Այնուամենայնիվ, այն ավելի դանդաղ է և ավելի թանկ: Բացի դրանից՝ o1-ը զիջում է GPT-4o-ին հանրագիտարանային գիտելիքներով և չի կարողանում մշակել վեբ էջերը, ֆայլերը և պատկերները: Բացի դրանից՝ նոր մոդելը կարող է մանիպուլացնել տվյալները՝ լուծումը հարմարեցնելով արդյունքին։

Հաջողության գաղտնիքը հիմնովին նոր ուսուցման ալգորիթմի մեջ է՝ «մտքերի շղթաները»: Մոդելը կարողանում է բարելավել այս շղթան՝ սովորելով «ուսուցում գիտելիքի ամրապնդման» մեթոդով, որի շնորհիվ այն ճանաչում և ուղղում է իր սխալները, բարդ քայլերը բաժանում է ավելի պարզերի և փորձում է տարբեր մոտեցումներ կիրառել խնդիրները լուծելու համար: Այս մեթոդաբանությունը մեծապես բարելավում է մոդելի տրամաբանական կարողությունը, որը «ինչպես մարդը կարող է երկար մտածել բարդ հարցին պատասխանելուց առաջ»։

OpenAI-ն արդեն թողարկել է o1-preview մոդելի նախնական տարբերակը, որը հասանելի է ChatGPT-ում և ծրագրավորողների համար API-ի միջոցով օգտագործելու համար: Ընկերությունը խոստովանում է, որ դեռ շատ աշխատանք կա անելու, որպեսզի o1-ը նույնքան հեշտ օգտագործվի, որքան ներկայիս մոդելները: Ընդգծվում է նաև, որ նոր մոդելն անվտանգ է ու էթիկական, քանի որ դրա դատողությունները կարող են վերահսկվել՝ կանխելով պոտենցիալ անցանկալի վարքագիծը: Եվ մինչ o1-preview-ն հանրային օգտագործման համար թողարկելը, OpenAI-ն անվտանգության թեստեր է անցկացրել:

o1-preview-ի օգտագործման արժեքը կազմում է 15 դոլար 1 միլիոն մուտքային թոքենի և 60 դոլար՝ 1 միլիոն ելքային թոքենի համար: Համեմատության համար, GPT-4o-ն առաջարկում է $5 գին 1 միլիոն մուտքային և $15 մեկ միլիոն՝ ելքային թոքենի համար:

ԱՄԵՆԱԴԻՏՎԱԾՆԵՐԸ

ՎԵՐ