Мудрост (одабране) гомиле

Све више компанија користи мудрост својих купаца и корисника - врло одабране гомиле. То раде путем „великих података“ - прикупљајући ризнице анонимних података, а затим раде на њима пост-хоц анализе.

Овај напор може довести до неких занимљивих увида. Такође може навести компаније да сугеришу да су резултати уопштени за целу популацију.

И управо је ово последње питање проблем. Јер ако започнете са самоизабраним узорком, ваши подаци су релевантни само за људе попут њих, а не за целу популацију. То је само један од проблема са мерењем - и предузимањем мера - на основу информација одабране гомиле.

Веб локације врше мерења „великих података“ већ скоро 20 година. Сваки пут када посетите веб локацију, она оставља мали траг података на серверу веб странице. Власници сервера узимају ове податке и покрећу их путем платформе за аналитику података (попут Гоогле аналитике). Власнику веб локације даје обједињене информације о врстама људи који посећују њихову веб страницу.

Будући да је свака веб локација јединствена, такви увиди су релевантни само за њу. Корисник који посети ЦНН, на пример, може имати мало заједничког са корисником који посети Матцх.цом.

Проблем одабране гужве

У анализи података, статистичари такво узорковање називају „сам одабраним узорком“, што резултира проблемом „пристрасности према самоизбору“. Једноставно речено, то значи да будући да ваши подаци потичу само од људи који користе одређену апликацију или врсту друштвених медија, они нису репрезентативни за популацију у целини. А пошто није репрезентативан за популацију у целини, не можете генерализовати податке.

Ово називам проблемом „одабране гужве“. Јер ако стекнете своју мудрост из гомиле, радије се побрините да та гомила представља популацију ако из ње покушавате да добијете уопштене увиде.

Постоје читаве компаније које не раде ништа друго него анализирају трендове и податке са Твитера. Али ако погледате ко користи Твиттер - и како га користе - одмах бисте били забринути шта такви подаци заиста значе. На пример, корисници Твиттера су много млађи од опште популације, а старији људи су у великој мери недовољно заступљени. Ако водите компанију која на Твиттеру гледа здравствене трендове, видећете нешто сасвим другачије него да сте спровели рандомизирану телефонску анкету.

Другим речима, који трендови на Твиттер-у могу или не морају имати никакво значење за 80+ процената Американаца који не користе Твиттер.

Апликације нису боље

Апликације често воле да прикупљају податке својих корисника, анонимизирају их, а затим користе за упоређивање вашег учинка са другима који такође користе апликацију. Ово би требало да вам учини да се осећате као да сте део друштвене мреже која има заједничку апликацију. То је сјајна идеја.

Јер шта ако само одређени тип особе користи ту одређену апликацију? Шта ако само депресивни људи користе апликацију за праћење расположења која треба да помогне људима да се извуку из депресије помажући им да прате њихово расположење, упоређујући свој напредак са другима који такође користе апликацију? Такви резултати би сами по себи могли бити ненамерно депресивни.

Можете ли позитивно мотивисати некога кроз социјално поређење? Можете, али пречесто, истраживање такође показује да таква социјална поређења доводе до тога да се људи осећају горе него раније. То мора да се уради изузетно пажљиво - нешто што већина типичних програмера апликација не разуме.

Изостављање важних ствари које треба измерити

Било која апликација или услуга толико су добре као оно што одабере да мери. Можете да унесете пристрасност - намерно или ненамерно - у своје резултате оним што одлучите да мерите - а не мерите.

Размислите овако: размишљате да се преселите у нови град са мање кише, па гледате само просечну годишњу количину кише за различите градове. Погледали бисте град попут Мајамија и помислили: „Знате, не селим се у Мајами - киша им падне скоро 62 инча годишње! Упоредите то са оскудних 37 инча кише које Сијетл има. Сијетл мора да буде сунчаније, мање кишовито место. " Будући да у мерење нисте укључили друге важне показатеље, направили бисте погрешан избор на основу превише ограничених информација.

Оно што програмер апликација или веб локација мисли да је важно за мерење нечега можда заправо није толико важно као нешто што је изоставио. Замислите апликацију која је мерила само вашу реакцију на лекове, али је изоставила све остале важне факторе који доприносе вашем расположењу и лечењу.

Лечење се не одвија у вакууму са вама и једним леком. Одвија се у богатом, сложеном екосистему који може садржати лек, али такође укључује и многе друге важне ствари које чините да бисте себи помогли да се опоравите. То може бити колико вежбате, или не размишљате, или колико дана прођете без напада панике или под стресом због члана породице или посла.

Укратко, постоји безброј ствари које би требало да прате апликације и друге добронамерне услуге, али нису. А ово даје искривљену перспективу како је нешто што се мери повезано са нечијим расположењем или напретком опоравка. Лекови су заиста важни у лечењу многих људи, али можда нису - а често и нису - најважнија ствар.

!-- GDPR -->