Емоционална зараза на Фејсбуку? Више попут лоших метода истраживања

Недавно је објављена студија (Крамер и сар., 2014) која је нешто показала задивљујуће - људи су мењали своје емоције и расположења на основу присуства или одсуства позитивних (и негативних) расположења других људи, како је изражено у ажурирањима статуса на Фацебоок-у. Истраживачи су овај ефекат назвали „емоционалном заразом“, јер су наводно показали да су речи наших пријатеља на нашој Фацебоок вести директно утицале на наше расположење.

Нема везе што истраживачи никада заправо нису мерили ничије расположење.

И нема везе да студија има фаталну ману. Једно које су друга истраживања такође превидела - чинећи све налазе ових истраживача помало сумњивим.

Ако се остави на страну смешни језик који се користи у оваквим врстама студија (заиста, емоције се шире попут „заразе“?), Ове врсте студија често до својих налаза долазе спровођењем анализа језика на ситним делићима текста. На Твиттеру су заиста малени - мање од 140 знакова. Ажурирање статуса на Фацебоок-у ретко је више од неколико реченица. Истраживачи заправо не мере ничије расположење.

Па, како водити такву језичку анализу, посебно на 689.003 ажурирања статуса? Многи истраживачи се за то обраћају аутоматизованом алату, нечему што се назива Лингвистичко истраживање и апликација за рачунање речи (ЛИВЦ 2007). Аутори ове софтверске апликације описују:

Прва ЛИВЦ апликација развијена је као део истраживачке студије језика и обелодањивања (Францис, 1993; Пеннебакер, 1993). Као што је описано у наставку, друга верзија, ЛИВЦ2007, је ажурирана ревизија оригиналне апликације.

Забележите те датуме. Много пре оснивања друштвених мрежа, ЛИВЦ је створен да анализира велика дела текста - попут књиге, чланка, научног рада, есеја написаног у експерименталном стању, записа на блогу или транскрипта терапијске сесије. Имајте на уму једну заједничку ствар свих њих - добре су дужине, са најмање 400 речи.

Зашто би истраживачи користили алат који није дизајниран за кратке исечке текста да би, па ... анализирали кратке исечке текста? Нажалост, то је зато што је ово један од ретких доступних алата који може прилично брзо да обради велике количине текста.

Кога брига колико дуго текст треба да мери?

Можда седите тамо и чешете се по глави, питајући се зашто је важно колико дуго текст покушавате да анализирате помоћу овог алата. Једна реченица, 140 знакова, 140 страница ... Зашто би дужина била битна?

Дужина је битна јер алат заправо није баш добар у анализирању текста на начин на који су га истраживачи Твиттера и Фацебоок-а задужили. Када од њега затражите да анализира позитивно или негативно осећање текста, он једноставно броји негативне и позитивне речи у тексту који се проучава. За чланак, есеј или унос на блогу, ово је у реду - пружиће вам прилично тачну укупну резиме анализу чланка, јер већина чланака има више од 400 или 500 речи.

Међутим, за твеет или ажурирање статуса ово је ужасан алат за анализу. То је зато што није дизајниран да разликује - и заправо, не могу разликовати - негативна реч у реченици.1

Погледајмо два хипотетичка примера зашто је ово важно. Ево два примера твеетова (или ажурирања статуса) која нису ретка:

    "Ја нисам срећан."

    „Немам сјајан дан.“

Независни оцењивач или судија оценио би ова два твита као негативна - они јасно изражавају негативну емоцију. То би било +2 на негативној скали, а 0 на позитивној скали.

Али алат ЛИВЦ 2007 то не види тако. Уместо тога, оценила би ова два твеета као бодовање +2 за позитивно (због речи „сјајно“ и „срећно“) и +2 за негативно (због речи „не“ у оба текста).

То је огромна разлика ако сте заинтересовани за непристрасно и тачно прикупљање и анализу података.

А будући да већи део људске комуникације укључује суптилности попут ове - а да се ни не упуштате у сарказам, кратке скраћенице које делују као негативне речи, фразе које негирају претходну реченицу, емоџије итд. - не можете ни рећи колико су тачне или нетачне резултујућа анализа ових истраживача је. Будући да ЛИВЦ 2007 игнорише ове суптилне стварности неформалне људске комуникације, тако и истраживачи.2

Можда зато што истраживачи немају појма колико је проблем заправо лош. Јер они једноставно шаљу све ове „велике податке“ у механизам за анализу језика, а да заправо не разумеју како је механизам за анализу неисправан. Да ли 10 посто свих твеетова укључује негативну реч? Или 50 одсто? Истраживачи вам нису могли рећи.3

Чак и ако је тачно, истраживање показује мале ефекте из стварног света

Због тога морам да кажем да чак и ако верујете да је ово истраживање номинално, упркос овом огромном методолошком проблему, и даље вам преостају истраживања која показују смешно мале корелације које обичним корисницима имају мало или нимало значаја.

На пример, Крамер и сар. (2014) пронашли 0,07% - то није 7 процената, то је 1/15 од једног процента !! - смањење негативних речи у ажурирању статуса људи када се смањио број негативних постова на њиховој Фацебоок вести. Да ли знате колико речи бисте морали прочитати или написати пре него што напишете једну негативну реч мање због овог ефекта? Вероватно хиљаде.

Ово није толико „ефекат“ колико статистички пресликавање које нема стварно значење. И сами истраживачи то признају, напомињући да су њихове величине ефеката биле „мале (као мале као д = 0,001). “ Даље тврде да је то и даље важно, јер „мали ефекти могу имати велике агрегиране последице“, позивајући се на Фацебоок-ову студију о мотивацији за политичко гласање једног од истих истраживача и аргумент стар 22 године из психолошког часописа.4

Али они себи противрече у претходној реченици, сугеришући да је на емоцију „тешко утицати с обзиром на распон свакодневних искустава која утичу на расположење“. Која је то? Да ли ажурирање статуса на Фацебооку значајно утиче на емоције појединца или на њих не може лако утицати једноставно читање ажурирања статуса других ??

Упркос свим овим проблемима и ограничењима, ништа од тога на крају не спречава истраживаче да изјаве: „Ови резултати указују на то да емоције које други изражавају на Фацебоок-у утичу на наше сопствене емоције, што представља експериментални доказ масовне заразе путем друштвених мрежа.“ 5 Опет, без обзира што заправо нису мерили емоције или стања расположења једне особе, већ су се уместо тога ослањали на погрешну меру процене.

По мом мишљењу, истраживачи Фацебоок-а јасно показују да превише верују у алате које користе, а да не разумеју и расправљају о значајним ограничењима алата.6

Референца

Крамер, АДИ, Гуиллори, ЈЕ, Ханцоцк, ЈТ. (2014). Експериментални докази масовне емоционалне заразе путем друштвених мрежа. ПНАС. ввв.пнас.орг/цги/дои/10.1073/пнас.1320040111

Фусноте:

  1. Ово према упиту програмерима ЛИВЦ-а који су одговорили, „ЛИВЦ тренутно не гледа да ли у његовом бодовању постоји негативни појам у близини позитивне или негативне речи емоција и било би тешко смислити ефикасан алгоритам за ово ионако “. [↩]
  2. Не могу да нађем никакво помињање ограничења употребе ЛИВЦ као алата за анализу језика у сврхе за које он никада није дизајниран или намењен у овој студији или другим студијама које сам испитивао. [↩]
  3. Па, могли би да вам кажу да ли су заиста провели време валидирајући своју методу са пилот-истраживањем ради поређења са мерењем стварног расположења људи. Али ови истраживачи то нису успели. [↩]
  4. Постоје нека озбиљна питања у вези са истраживањем гласања на Фејсбуку, од којих је најмање приписивање промена у понашању гласања једној корелационој променљивој, са дугачким списком претпоставки које су истраживачи изнели (и са којима бисте се морали сложити). [↩]
  5. Захтев за појашњењем и коментаром аутора није враћен. [↩]
  6. Ово није ископавање ЛИВЦ 2007, које може бити одличан алат за истраживање - када се користи у праве сврхе и у правим рукама. [↩]

!-- GDPR -->