Велики подаци могу помоћи рачунарима да идентификују емоције везане за слике

Популарне странице попут Твиттер-а, Фацебоок-а и других канала сада су испуњене сликама које помажу особи да боље изрази мисли и осећања. Ново истраживање сугерише да „велики подаци“ - било која колекција скупова података толико великих или сложених да их је тешко обрадити помоћу традиционалних апликација за обраду података - могу да се користе за подучавање рачунара да тумаче садржај и осећања повезана са сликама.

Др Јиебо Луо, професор рачунарских наука на Универзитету у Роцхестеру, у сарадњи са истраживачима компаније Адобе Ресеарцх недавно је на конференцији Америчког удружења за вештачку интелигенцију (АААИ) представио рад који описује прогресивни тренинг дубоке конволуционе неуронске мреже (ЦНН) .

Обучени рачунар се затим може користити за одређивање осећаја које ће ове слике вероватно изазвати. Луо каже да би ове информације могле бити корисне за тако разнолике ствари попут мерења економских показатеља или предвиђања избора.

Задатак је, међутим, сложен. Анализа расположења текста помоћу рачунара сама по себи представља изазов. А у друштвеним медијима анализа сентимента је сложенија јер се многи изражавају користећи слике и видео записе, које рачунар теже разуме.

На пример, током политичке кампање гласачи ће често делити своје ставове путем слика.

Две различите слике могу приказивати истог кандидата, али можда дају врло различите политичке изјаве. Човек би могао препознати један као позитиван портрет кандидата (нпр. Кандидат се смеши и подиже руке), а други негативан (нпр. Слика кандидата који изгледа поражено).

Али ниједан човек није могао да погледа сваку слику дељену на друштвеним мрежама - то су заиста „велики подаци“. Да би могли да информишу нагађања о популарности кандидата, рачунари треба да буду обучени за варење ових података, што је оно што приступ Луо-а и његових сарадника могу учинити тачније него што је то било могуће до сада.

Истраживачи третирају задатак издвајања осећања са слика као проблем класификације слика. То значи да некако треба анализирати сваку слику и на њу налепити налепнице.

Да би започели процес обуке, Луо и његови сарадници користили су огроман број Флицкр слика које је машински алгоритам са специфичним осећањима слабо означио, у постојећој бази података познатој као СентиБанк (коју је развила група др Схих-Фу Цханг из Колумбије Универзитет).

Ово даје рачунару полазну тачку да започне разумевање онога што неке слике могу пренети.

Али машински генерисане налепнице такође укључују вероватноћу да је та налепница тачна, односно колико је рачунар сигуран да је налепница тачна?

Кључни корак у процесу обуке долази следећи, када одбаце све слике за које осећај или осећања са којима су означени можда нису тачни. Дакле, они користе само „боље“ означене слике за даље усавршавање на прогресивно побољшавајући начин у оквиру моћне конволуционе неуронске мреже.

Ресаерцхер је открио да је овај додатни корак значајно побољшао тачност осећања којима је означена свака слика.

Такође су прилагодили овај механизам за анализу расположења са неколико слика извучених са Твитера. У овом случају су користили „интелигенцију мноштва“, са више људи који помажу у категоризацији слика путем платформе Амазон Мецханицал Турк.

Користили су само мали број слика за фино подешавање рачунара, а ипак, применом овог процеса прилагођавања домена, показали су да могу побољшати тренутно стање технике за анализу расположења за Твиттер слике.

Изненађујуће откриће је да је тачност класификације расположења слике премашила тачност класификације расположења текста у истим Твиттер порукама.

Извор: Универзитет у Роцхестеру

!-- GDPR -->