ФИЛМСКЕ СЛИКЕ ИЗ ТЕКСТА

Наиме, реч је о новој врсти вештачке интелигенције, такозваним генеративним алгоритмима који су у стању да производе слике од датог текста или чак од скенова мозга.

Филмски сценаристи ће ускоро имати нову могућност која им највероватније неће донети Оскара – снимање филмова помоћу кратког текста. Наиме, реч је о новој врсти вештачке интелигенције, такозваним генеративним алгоритмима који су у стању да производе слике од датог текста или чак од скенова мозга. Мада слични проналасци постоје и усавршавају се већ дуже време, новитет је у томе што овај апарат прави слике које се померају у складу са оним што је написано у за сада кратком тексту.

Тренутно ови филмови трају око једне
секунде и величине су америчких
поштанских маркица, 64 са 64 пиксела.

Овај нови алгоритам, који су произвели истраживачи са америчког Универзитета Дјук, представља врсту вештачке интелигенције (machine learning) где уређаји сами уче да предузимају одређене радње. Овде је конкретно реч о мрежама неурона, односно о низу слојева малих рачунарских елемената који обрађују податке на начин који подсећа на оно што раде неурони. У овом процесу компјутер сам „учи” да предузима радње и током таквих тренинга софтвер оцењује своје перформансе након сваког покушаја и ради на томе да их побољша и временом научи.

Јитонг Ли (Википедија)

Ова мрежа неурона има две фазе. У првој се текст користи како би се створила сама суштина видеа, што је у основи замагљена слика позадине са замућеним центром у коме се дешава главна радња. У другој фази се користи и суштина видеа и текст како би се створио кратак видео. Током тренинга друга мрежа ради као дискриминатор и посматра видео који илуструје, на пример једрење на мору, поред правог видеа који то приказује и учи се да одабере онај прави. Вежбањем мрежа постаје све бољи и оштрији критичар што утиче на генераторску мрежу која се на тај начин даље усавршава.

Тренутно ови филмови трају око једне секунде и величине су америчких поштанских маркица, 64 са 64 пиксела. Према речима Јитонга Лија, компјутерског научника са Дјук универзитета и првог аутора студије, све што је веће од тога смањује тачност. С обзиром да у овим филмовима људи најчешће изгледају потпуно искривљено, следећи корак његовог тима јесте коришћење људских скелетних модела за побољшање кретања и изгледа.

Истраживачи који се баве овом темом верују да ови алгоритми могу да имају ширу употребу него што је снимање филмова. Осим што могу да помогну у реконструкцији злочина, могу да буду корисни и за генерисање сличних machine learning алгоритама. На пример, овакви реални видео-снимци могу да помогну и такозваним аутономним аутомобилима да се припреме за опасне ситуације или чак да обуче кућног робота да отвара фрижидер.

(Ивана Николић, ЦПН)

Visited 691 times, 1 visit(s) today