Др Епстеин, политичка пристрасност и резултати Гоогле претраге

Помало сам збуњен тврдњама др Роберта Епстеина и његовом тврдњом, заснованом на једној студији од 95 учесника, да је Гоогле некако намерно пристрасио резултатима приказаним пре америчких председничких избора 2016. године. Стога је вероватно утицао на саме изборне резултате.

То је огроман тврдња да се. Могли бисмо се надати да ће уважени истраживач попут др. Епстеина имати научне податке који ће то подржати. Нажалост, не видим га.

Наука је објективна само до тренутка када научник призна и објасни своје пристрасности. Наука се не заснива на унапред утврђеном дневном реду или на покушају да се изравна резултат. Нисам сигуран да ли је др. Епстеин држао до знања своје пристрасности у свом очигледном лову на вештице како би уклонио Гоогле због нужде „пристрасних“ резултата претраге.

Претраживачи су увек били пристрасни

Гоогле је увек нудио пристрасне резултате претраге. Ако то не разумете има да би то био случај са било којим претраживачем, можда ће вам требати курс за освежавање како функционишу претраживачи.

Непристрасни резултати претраге не постоје. Сви претраживачи користе заштићене алгоритме са пословном тајном како би осигурали да видите шта компанија за претраживаче верује да доноси „најбоље“ резултате. „Најбоље“ је - од почетка претраживача на мрежи још почетком 1990-их - увек био субјективан појам. Не постоји јединствено рангирање веб локација које каже: „Увек прво прикажи ову веб локацију за овај упит за претрагу, јер је то очигледно најбољи резултат.“

И погодите шта - људи то воле! Због тога је Гоогле на врху гомиле претраживача, јер заиста нуди резултате који су очигледно најрелевантнији за већину људи. Оног тренутка када Гоогле престане да нуди тако релевантне резултате, нови претраживач може и заузеће његово место. (Да ли се неко сећа Алта Висте, Екците или чак Иахоо-а? [И не, Иахоо више не врши претрагу - његове резултате пружа Бинг.])

Како изгледа пристрасност у резултатима претраживача?

Без обзира на то што многи не знају, претраживачи не приказују потпуно исте резултате на исти упит који су поставиле две различите особе. Већина претраживача, укључујући Гоогле, користе сложене факторе персонализације као и психографски профил како би даље сортирали и представили резултате за које мисли да су вама најрелевантније.

У пракси то значи да моја потрага за „симптомима депресије“ може дати другачији скуп резултата од вашег претраживања под истим терминима. Ако то пажљиво не контролишете у својој методологији, ваши резултати ће бити бесмислени и запрљани.

Епстеин & Робертсон (2015) пронашли су у низу лабораторијских (не из стварног света) експеримената, када су вештачки манипулисали страницама резултата претраживача, могли су да утичу на преференције бирача субјеката током кратког временског периода. Није истраживао ниједну стварну страницу претраживача. И занемарила је изглед и изглед модерних страница резултата претраживача. Стварне странице резултата претраге садрже више огласа (које свако може купити) на врху странице пре било каквих органских резултата.

Резултати ових истраживача нису изненађујући по томе што понављају оно што би вам рекао било који стручњак за оптимизацију претраживача (СЕО) - позиционирајте ствари на страници резултата претраживача. Веб странице добијају тоне више промета ако су на првом, другом или трећем месту у односу на бр. 9 - или још горе на другој страници резултата.

У другом лабораторијском експерименту, исти истраживач је демонстрирао методе (опет, користећи потпуно лажни претраживач - не Гоогле) у којем се ефекат који су они створили - ефекат манипулације претраживача (СЕМЕ) - може сузбити (благовременим упозорењима која се приказују корисницима ).

Гоогле помогао Хиллари да победи?

2017. године Епстеин и Робертсон нису се више задовољили да демонстрирају очигледно - да су позиције на рангирању битне на страницама резултата претраживача. Учинили су корак даље и спровели истраживање на 95 Американаца (од којих је само 21 идентификовано као „неодлучно“ на предстојећим председничким изборима) 2016. године и њихових навика претраживања.

У белом раду објављеном само на њиховој веб локацији, Епстеин & Робертсон износе изванредне тврдње:

[… В] Открили смо да су између маја и новембра 2016. године резултати претраге приказани као одговор на широк спектар појмова за претрагу у вези са изборима били у просеку пристрасни у корист госпође Цлинтон на свих 10 позиција резултата претраживања.

Објављено као „бели папир“, а не као рецензија часописа, ово је подигло гомилу црвених застава.1

У студији је мало објашњено методологије. То не укључује информације о томе шта је учињено како би се ограничила персонализација резултата претраге (јер желите да контролишете ту независну променљиву), нити које термине за претрагу су заправо користили.У ствари, читајући две претходне студије које су ови истраживачи објавили, чак није јасно ни да ли су свесни како претраживачи раде у погледу њихових стратегија монетизације, недељних промена алгоритма које користе и персонализације резултата претраге.

По мом мишљењу, такође постоји одређена траљавост у напорима истраживача. Не постоји образложење за одређени период од 25 дана који су испитивали у студији, у односу на било који други временски период. И у ствари, признају да заправо нису све то пажљиво погледали већину тачака података које су сакупили. Истраживачи су игнорисали истраживачке податке вредне 7 месеци да би се усредсредили само на 3 недеље пре избора.2

Такође су донели одлуку, пост-хоц, да одбаце све податке засноване на Гмаил.цом због аномалија у тим подацима. Те аномалије случајно нису показивале такву пристрасност, коју су приписали или скупу „ботова“ или - сачекајте то - намерној саботажи од стране Гоогле-а.

Будући да постоји значајна мањина легитимних корисника који користе Гмаил, ова образложења за избацивање свих података изведених из Гмаил.цом-а у најбољем су случају сумњива. По мом мишљењу, то је ужасна истраживачка одлука коју смо донели, али она која је случајно такође обезбедила да истраживачи пронађу значај у њиховим подацима.

Али ево правог ударца:

Екстраполирајући из математике представљене у овом извештају, у чланцима објављеним у фебруару 2016. године и након тога, водећи аутор студије ПНАС предвидео је да ће проклинтоновска пристрасност у Гоогле-овим резултатима претраге с временом пребацити најмање 2,6 милиона гласова на Клинтонову.

У њиховом белом раду нема математике. Ето су гомила описне статистике, али та статистика једва говори о томе какве су процедуре или моделирање истраживачи заправо користили да дођу до закључака које су урадили.

„Докази систематске пристрасности истраживача на председничким изборима 2016.?“ Мали узорак података о моделирању на основу 95 Американаца (минус корисници Гмаил.цом чије су податке бацали пост-хоц).

Укратко, по мом мишљењу, ово је управо онаква сумњива, сумњива, стравично дизајнирана истраживања која у данашње време представљају „доказ“. Зашто би истраживачи спровели такву наизглед политички пристрасну студију и такође извукли закључке за које немају стварних директних доказа? 3

Можда постоји секира за млевење?

Истраживачи су људи. А људи понекад имају и секиру за млевење. Не морате ићи далеко да бисте пронашли једну од могућих Епстеин-ових осе.

Пре 2012. године, Епстеин је показивао мало интересовања за претраживаче или како они раде. Објављивао је о широком спектру тема о психологији, везама и менталном здрављу и писао о њима за редовне веб странице.

Тада је почетком 2012. године Епстеинова лична веб локација примила упозорење о малверу које се појавило када су корисници покушали да приступе његовој веб локацији са Гоогле-а. Гоогле приказује ова упозорења како би кориснике одвратио од потенцијално злонамерних веб локација.

Али овај инцидент се очигледно на неки начин увукао Епстеину под кожу, јер је изненада у јесен 2012. написао више чланака о потреби регулисања Гоогле-а. Ово од истраживача који никада раније није написао ниједну реч о претраживачима. Занимљив ми је тајминг.

Укратко, Епстеин се залаже за регулацију савезне владе о Гоогле-у током последњих седам година. Не би било претешко замислити хипотетичког истраживача који дизајнира студије како би подржао своје уверење.

Преглед резултата пристрасности претраживача

Претраживачи су увек били пристрасни и увек ће бити јер су они субјективни алати који помажу корисницима да дођу до информација или забаве. Оног тренутка када велика влада жели да почне да надгледа моје резултате претраживања, тренутак је када се окренем претраживачу где такво владино филтрирање није извршено.

Такође помаже имати на уму хипотетичко мешање насупрот стварном мешању у америчку политику. Иако Епстеин инсинуира да Гоогле манипулише резултатима своје политичке претраге како би фаворизовао кандидате за које жели да буду изабрани на функцију, ми имамо стварни доказ да Фацебоок манипулише председничким изборима 2016. путем организација које спонзоришу Руси купујући милионе долара лажног оглашавања на својој платформи.

Занимљиво је да се Епстеин за то не занима превише. Можда је то зато што му Фацебоок никада није нанео неправду као Гоогле једном.

За даље информације

Политифацт: Доналд Трумп греши у Гоогле-у манипулишући резултатима избора

Референце

Епстеин & Робертсон. (2017). Сузбијање ефекта манипулације претраживача (СЕМЕ). Проц. АЦМ Хум.-Цомпут. Интеракција., 1 (2), 42.

Епстеин & Робертсон. (2017). Метода за откривање пристрасности у рангирању претраге, са доказима систематске пристрасности повезане са председничким изборима 2016. године. Бела књига коју је објавила АИБРТ, Епстеинова организација.

Епстеин & Робертсон. (2015). Ефекат манипулације претраживачем (СЕМЕ) и његов могући утицај на исходе избора. ПНАС, 10.1073 / стр. 1419828112

Фусноте:

  1. На питање о недостатку рецензираних студија, Епстеин ми је одговорио: „Такође имам проблема и хитности и квантитета: завршио сам или имам у току толико различитих студија нових облика онлајн утицаја (студирам седам различитих врста утицаја у овом тренутку - СЕМЕ и шест других) да сам одлучио да своје налазе сажмем у конференцијске радове, беле књиге и, у неком тренутку, у облику књиге, уместо да потрошим оно мало времена које ми остаје на болно спори процес академских публикација. Када налетим на други нови облик онлајн утицаја, треба ми најмање годину или две да га разумем и квантификујем. (Нисам стигао ни започети експерименте са пола туцета нових облика утицаја за које знам.) Додавање још годину-две у тај процес да бих објављивао у часопису изгледа непромишљено с обзиром на моје године и обзиром на то колико су потенцијално важна ова открића за човечанство “. [↩]
  2. Истраживачи су тврдили да је то због онога што су рекли да регрутује проблеме и усавршава своје процедуре. Што поставља питање - зар не би требало да њихови поступци прво буду усавршени у пилот студији, као што би то учинила већина истраживача? [↩]
  3. Или, ако желите да будете педантни, имајте минимални доказ на основу малог узорка од само 95 корисничких претрага - умањене за одређени број Гмаил.цом предмета - током 25 дана. [↩]

!-- GDPR -->