Country Flag
Facebook logo Instagram logo
am
ru en
27 / Հունվար / 2025 : 15-49

DeepSeek․ Չինական AI ստարտափի հաջողությունը, որը խուճապի է մատնել Սիլիկոնյան հովիտը

DeepSeek-ը, չինական արհեստական բանականության (AI) ստարտափը, որը հիմնադրվել է ընդամենը մեկ տարի առաջ, զարմանք և անհանգստություն է առաջացրել Սիլիկոնյան հովտում՝ ցույց տալով առաջադեմ AI մոդել, որոնք մրցունակ են աշխարհի լավագույն չաթբոթերի հետ՝ դրա հետ մեկտեղ ունենալով համեմատաբար ցածր ֆինանսական կարիքներ:

DeepSeek-ը հակադրվում է այն տարածված համոզմունքին, որ AI-ի ապագան մեծ էներգիա և հզորություն է պահանջելու զարգացման համար։ Երբ հունվարի վերջին գլոբալ տեխնոլոգիական ընկերությունների բաժնետոմսերի գները կտրուկ նվազեցին, DeepSeek-ի նորարարության հանդեպ հետաքրքրությունը աճեց, իսկ ներդրողները սկսեցին գիտակցել դրա ազդեցությունը ԱՄՆ-ում գործող մրցակիցների և նրանց սարքավորումների մատակարարների վրա։

Ի՞նչ է DeepSeek-ը:

DeepSeek-ը հիմնադրվել է 2023 թվականին Լյան Վենֆենի կողմից, որը AI-ով աշխատող քվանտային հեջ-ֆոնդ High-Flyer-ի ղեկավարն է։ Ընկերությունը մշակում է բաց կոդով AI մոդելներ, ինչը նշանակում է, որ ծրագրավորողների համայնքը կարող է ուսումնասիրել և բարելավել ծրագրակազմը։ 2024 թվականի հունվարին ընկերության հավելվածը ԱՄՆ-ում դարձավ iPhone-ի ամենաշատ ներբեռնվող հավելվածը։ Այն առանձնանում է OpenAI-ի ChatGPT-ի նման չաթբոթերից՝ նախ տրամաբանությունը բացատրելու և ապա պատասխան տալու մոտեցմամբ։ Ընկերությունը պնդում է, որ իր R1 թողարկումը համապատասխանում է OpenAI-ի վերջին մոդելներին և թույլ է տալիս անհատներին այդ տեխնոլոգիայի հիման վրա նոր չաթբոթեր զարգացնել։

Ինչո՞վ է DeepSeek R1-ը տարբերվում OpenAI-ից կամ Meta AI-ից:

Թեև ընկերությունը դեռ չի մանրամասնել բոլոր դետալները, DeepSeek-ի մոդելների ուսուցման և մշակման արժեքը, ըստ երևույթին, միայն մի փոքր մասն է այն ծախսերի, որոնք պահանջվում են OpenAI-ի կամ Meta-ի առաջատար մոդելների համար։ Մոդելի ավելի բարձր արդյունավետությունը հարցականի տակ է դնում այն մոտեցումը, թե AI-ի համար անհրաժեշտ է հսկայական կապիտալ ծախսեր կատարել՝ ձեռք բերելու համար Nvidia-ի և նմանատիպ ընկերությունների ամենահզոր չիպերը։ Սա նաև ավելացնում է ուշադրությունը ԱՄՆ-ի կողմից Չինաստանին առաջադեմ չիպերի արտահանման սահմանափակումների վրա, որոնք նպատակ ունեին կանխել այսպիսի հաջողությունները։

DeepSeek-ը նշում է, որ R1 մոդելը մի շարք առաջատար չափանիշներով, օրինակ՝ AIME 2024 (մաթեմատիկական առաջադրանքների համար), MMLU (ընդհանուր գիտելիքների համար) և AlpacaEval 2.0 (հարց ու պատասխանների համար), հավասար է կամ գերազանցում է մրցակիցներին։ Այն նաև զբաղեցնում է առաջատար տեղեր UC Berkeley-ի հետ կապված Chatbot Arena վարկանիշային աղյուսակում։

Ո՞վ է DeepSeek-ի հիմնադիրը:

Լյան Վենֆենը ծնվել է 1985 թվականին Գուանդունում։ Նա ստացել է բակալավրի և մագիստրոսի աստիճաններ Ցզեցզյան համալսարանի էլեկտրոնային և տեղեկատվական ճարտարագիտության ֆակուլտետում։ Ընկերությունը հիմնադրել է 10 միլիոն յուան (մոտ $1.4 միլիոն) կանոնադրական կապիտալով՝ ըստ Tianyancha ընկերության տվյալների։

Ինչո՞ւ է DeepSeek-ը մտահոգություն առաջացնում ԱՄՆ-ում:

Վաշինգտոնը Չինաստանին արգելել է բարձր տեխնոլոգիաների, ինչպես GPU չիպերի, արտահանումը՝ խոչընդոտելու համար երկրի առաջընթացը AI ոլորտում, որը ԱՄՆ-Չինաստան տեխնոլոգիական մրցակցության հիմնական դաշտն է։ Սակայն DeepSeek-ի զարգացումները ցույց են տալիս, որ չինացի ինժեներները գտել են այլընտրանքային ուղիներ՝ կենտրոնանալով ավելի մեծ արդյունավետության վրա՝ սահմանափակ ռեսուրսներով։
Թեև պարզ չէ, թե որքան բարձրակարգ AI ուսուցման սարքավորումների հասանելիություն է ունեցել DeepSeek-ը, ընկերությունը ցույց է տվել, որ առկա սահմանափակումները լիովին արդյունավետ չեն եղել։

Ի՞նչ հետևանքներ կարող է ունենալ սա գլոբալ AI շուկայի համար:

DeepSeek-ի հաջողությունը կարող է ստիպել OpenAI-ին և մյուս ամերիկյան մատակարարներին նվազեցնել իրենց գները՝ պահպանելու համար իրենց առաջատար դիրքերը։ Սա նաև հարցականի տակ է դնում այն հսկայական ծախսերը, որոնք կատարում են Meta-ն և Microsoft-ը՝ հիմնականում AI ենթակառուցվածքների համար։
Դիտվել է 1820անգամ
Վերջին լուրեր