OpenAI-ն ներկայացրել է GPT-OSS մոդելները՝ հեղափոխելու ԱԻ մատչելիությունը

Հրապարակող՝

OpenAI-ն ներկայացրել է երկու նորարարական բաց կշռով ԱԻ մոդելներ՝ GPT-OSS-120B և GPT-OSS-20B, հենց GPT-5-ի թողարկման նախօրեին։ Այս մոդելները առաջնահերթություն են տալիս արդյունավետությանը, մատչելիությանը և հարմարեցմանը՝ նոր նշաձող սահմանելով բաց ԱԻ զարգացման մեջ։

Արագ Ընթերցում

  • OpenAI-ն ներկայացրել է GPT-OSS-120B և GPT-OSS-20B մոդելները՝ GPT-5-ի թողարկումից առաջ։
  • Մոդելները օգտագործում են «Մասնագետների խառնուրդ» ճարտարապետություն՝ արդյունավետության համար։
  • Դրանք կարող են աշխատել համեստ սարքավորումների վրա, ինչպիսիք են նոութբուքերը։
  • «Հալյուցինացիան» մնում է հիմնական մարտահրավեր՝ համեմատած փակ մոդելների հետ։
  • OpenAI-ն համագործակցել է Microsoft-ի և այլոց հետ՝ ներդրման հեշտացման համար։

OpenAI-ն կրկին հայտնվել է ուշադրության կենտրոնում՝ ներկայացնելով երկու բաց կշռով ԱԻ մոդելներ՝ GPT-OSS-120B և GPT-OSS-20B, սպասված GPT-5-ի թողարկումից առաջ։ Այս մոդելները նշանակալի առաջընթաց են ԱԻ ոլորտում՝ առաջարկելով ծրագրավորողներին և ձեռնարկություններին աննախադեպ մատչելիություն և ճկունություն։ Մի ոլորտում, որտեղ գերակշռում են սեփականատիրական համակարգերը, OpenAI-ի որոշումը՝ այս մոդելները թողարկել Apache 2.0 լիցենզով, համարվում է խիզախ քայլ դեպի բաց ԱԻ նորարարություն։

GPT-OSS-120B և GPT-OSS-20B մոդելների առանձնահատկությունները

Այս երկու մոդելները նախատեսված են տարբեր կարիքների և սարքավորումների համար։ GPT-OSS-120B-ը, որը ավելի մեծ է, ունի 117 միլիարդ պարամետր, բայց օգտագործում է խելացի «Մասնագետների խառնուրդ» (Mixture-of-Experts) ճարտարապետություն՝ ակտիվացնելով միայն 5.1 միլիարդ պարամետր յուրաքանչյուր նշանի համար։ Այս դիզայնը թույլ է տալիս այն աշխատեցնել բարձրակարգ Nvidia GPU-ի վրա, ինչպիսին է 80GB Nvidia H100-ը։ Մյուս կողմից, GPT-OSS-20B-ը, որը 21 միլիարդ պարամետր ունի, օպտիմալացված է 16GB RAM-ով սարքերի համար, ինչպիսիք են սովորական նոութբուքերը։ Երկու մոդելներն էլ տեքստային են և կենտրոնանում են տրամաբանական խնդիրների, կոդավորման և առաջադեմ աշխատանքային հոսքերի վրա՝ առանց բազմամոդալ հնարավորությունների։

India Today-ի տվյալներով՝ մոդելները գերազանց են մաթեմատիկական խնդիրներ լուծելու, կոդ գրելու և նույնիսկ Python սցենարներ աշխատեցնելու մեջ, երբ ինտեգրված են լրացուցիչ գործիքների հետ։ Ծրագրավորողները կարող են կարգավորել տրամաբանության մակարդակը՝ արագ և մակերեսային զրույցներից մինչև խոր վերլուծական պատասխաններ՝ պարզապես փոփոխելով համակարգային հրահանգները։

Արդյունավետություն և մատչելիություն՝ նոր նշաձող

GPT-OSS մոդելները մշակվել են արդյունավետությունը առաջնահերթ դարձնելու նպատակով։ Mixture-of-Experts ճարտարապետությունը ոչ միայն նվազեցնում է հաշվարկային ծախսերը, այլև բարելավում է արձագանքման արագությունը՝ թույլ տալով մոդելներին մրցել սեփականատիրական համակարգերի հետ։ Օրինակ, GPT-OSS-120B-ը Codeforces ծրագրավորման չափորոշիչում հավաքել է 2622 միավոր՝ գերազանցելով մրցակիցներին, ինչպիսիք են DeepSeek-ի R1-ը։ Սակայն, ինչպես նշում է TechEBlog-ը, մոդելները դեռ հետ են մնում OpenAI-ի փակ համակարգերից՝ ընդհանուր կատարողականության մեջ։

Այս մոդելների առանձնահատկությունն այն է, որ դրանք կարող են աշխատել համեստ սարքավորումների վրա։ Սա հնարավորություն է տալիս փոքր բիզնեսներին, անկախ ծրագրավորողներին և նույնիսկ ռեսուրսներով սահմանափակված տարածաշրջաններում կազմակերպություններին օգտվել ԱԻ-ից՝ առանց թանկարժեք ամպային ծառայություններից կախվածության։ Բացի այդ, մոդելների օֆլայն գործառույթը ապահովում է տվյալների անվտանգությունը՝ դրանք հարմար դարձնելով զգայուն միջավայրերի համար։

OpenAI-ն համագործակցել է Microsoft-ի, NVIDIA-ի և Hugging Face-ի հետ՝ ապահովելու մոդելների հեշտ ներդրումը տարբեր պլատֆորմներում։ Azure AI Foundry և Windows AI Foundry գործիքները հեշտացնում են մոդելների հարմարեցումը կոնկրետ կիրառությունների համար։

Մարտահրավերներ և սահմանափակումներ

Չնայած իրենց ուժեղ կողմերին՝ GPT-OSS մոդելները ունեն որոշ թերություններ։ Մոդելները հաճախ «հալյուցինացնում» են, GPT-OSS-120B-ը՝ 49%-ով, իսկ GPT-OSS-20B-ը՝ 53%-ով։ Այս ցուցանիշները զգալիորեն ավելի բարձր են, քան ավելի հին մոդելների մոտ։ OpenAI-ն սա վերագրում է ավելի փոքր մոդելների սահմանափակ «աշխարհի գիտելիքին»։

Անվտանգության ապահովման համար OpenAI-ն անցկացրել է լայնածավալ թեստավորումներ՝ ներառյալ վնասակար նպատակներով վերապատրաստված տարբերակների փորձարկումը։ Ընկերությունը հայտարարում է, որ մոդելները չեն հասնում «բարձր վտանգավորության» շեմին։ Բացի այդ, OpenAI-ն սկսել է $500,000 մրցանակային ֆոնդով ծրագիր՝ մոդելների թուլությունները հայտնաբերելու համար։

OpenAI-ի GPT-OSS մոդելները ապացուցում են, որ բաց կշռով համակարգերը կարող են փոփոխել արդյունաբերությունը, ուժեղացնել ծրագրավորողներին և խթանել էթիկական ԱԻ-ն ամբողջ աշխարհում։

Ամենաթարմ