Google-ը 2024 թվականի Google I/O ամենամյա կոնֆերանսի ընթացքում ներկայացրեց Veo և Imagen 3 նորագույն արհեստական բանականության գործիքները, որոնք նպատակ ունեն հեղափոխել վիդեո և պատկեր ստեղծման ոլորտը: Այս գործիքները, որոնք ներկայումս հասանելի են միայն ընտրված ստեղծագործողներին, վկայում են Google-ի՝ գեներատիվ AI տեխնոլոգիաների զարգացման համարձակ մոտեցման մասին։
Veo-ն Google-ի նորագույն վիդեո գեներացման մոդելն է, որը հնարավորություն է տալիս ստեղծել հիասքանչ 1080p որակի վիդեոներ՝ պարզապես տեքստային հրահանգներից։ Այն կարող է հասկանալ կինեմատոգրաֆիկ տարրեր, ինչպիսիք են «timelapse»-ն ու «օդային կադրերը», ինչը թույլ է տալիս ստեղծել ֆիլմերի համար լիովին համապատասխան բովանդակություն։ Veo-ն արդեն ցուցադրվել է Դոնալդ Գլովերի և նրա Gilga ստուդիայի հետ համագործակցության շրջանակում՝ ընդգծելով իր պրոֆեսիոնալ կինոարտադրության հնարավորությունները։ Այժմ Veo-ն հասանելի է միայն ընտրված ստեղծագործողների համար՝ VideoFX հարթակի միջոցով։
Imagen 3-ը Google-ի ամենազարգացած տեքստից պատկեր գեներացման մոդելն է։ Այն ապահովում է ֆոտոռեալիստիկ պատկերներ՝ առավել մանրամասնությամբ և նախորդ մոդելների համեմատ ավելի քիչ տեսողական թերություններով։ Imagen 3-ը գերազանց է բարդ տեքստային հրահանգների մեկնաբանման հարցում և կարող է ստեղծել բովանդակություն տարբեր ոճերով՝ սկսած վայրի բնության մանրամասն պատկերներից մինչև դինամիկ լանդշաֆտներ։ Այս մոդելը ներկայումս հասանելի է ընտրված ստեղծագործողներին ImageFX հարթակի միջոցով և շուտով ինտեգրվելու է Vertex AI պլատֆորմում։
Երկու գործիքներն էլ ներառում են Google-ի SynthID տեխնոլոգիան, որը թվային ջրային նշաններ է ներդնում AI-ի միջոցով ստեղծված բովանդակության մեջ՝ ապահովելով դրա իսկությունը և հետագծելիությունը։ Սա կարևոր քայլ է՝ նվազեցնելու թվային աշխարհում բովանդակության ծագման վերաբերյալ մտահոգությունները։