Лоше истраживање: Популарни термини за претрагу секса

Људи воле секс. Они толико воле секс, проводе много времена тражећи га на мрежи. Замисли. (Можете рећи да ћу се овдје позабавити стварно вртоглавим, вртоглавим стварима ...)

Истраживачи Оги Огас и Саи Гаддам недавно су објавили књигу, Милијарда злих мисли, детаљно анализирајући 400 милиона претрага које су прикупили са претраживача Догпиле. Од тих 400 милиона претраживања, 13 процената (55 милиона) односило се на еротски садржај.

Како се покварило тих 55 милиона претрага? Откријмо ... али погледајмо и методологију ових истраживача да бисмо видели да ли су њихови налази вредни папира на којем су одштампани. (Ако мислите да нисте, вероватно сте у праву.)

Дакле, ево шта људи на Догпиле-у траже када су сексуална интересовања у питању. Имајте на уму да су доленаведени појмови општа категорија претраживања за тај интерес, која укључује све врсте пермутација појмова. Ове пермутације (као што су „сисе“ за дојке) нису наведене у наставку; користе своју машту.

  1. Млади - 13,5 одсто
  2. Геј - 4,7 одсто
  3. МИЛФ-ове (мајке бих волела да се ***) - 4,3 процента
  4. Дојке - 4,0 одсто
  5. Варање супруга - 3,4 одсто
  6. Вагине - 2,8 одсто
  7. Пениси - 2,4 одсто

Смеће у ђубре

Стара је изрека у рачунарском програмирању - ГИГО: Гарбаге Ин, Гарбаге Оут. Подједнако се примењује на било који научни подухват, који је подједнако добар као и подаци које одаберете да анализирате. Ако започнете са скупом података сумњиве генерализације или вредности, можда ћете наћи закључке који имају мало везе са стварношћу.

У овом случају, постоји огроман проблем са подацима истраживања које су ови истраживачи сакупили. Не долазе од Гоогле-а или чак Бинг-а. Долазе из мало познатог претраживача званог „Догпиле“ који чак није ни претраживач. Оно што је Догпиле је једноставно агрегациони механизам резултата претраживања од Гоогле-а, Иахоо-а и Бинг-а (будући да Бинг Иахоо-у сада пружа њихове податке о претрази, нисам сигуран зашто још увек постоји та диференцијација).

То није исто као претрага обављена на Гоогле-у преко Гоогле.цом или претрага извршена на Бинг-у преко Бинг.цом. Заправо морате да посетите веб локацију Догпиле да бисте добили ове резултате - резултате који су формирали скуп података за садашње истраживаче. Ако претражујете на Гоогле.цом, ови истраживачи не би анализирали вашу претрагу (што има смисла, јер Гоогле и Бинг податке које прикупљају у претрагама не чине доступним истраживачима).

Оно што Догпиле вероватно мало користи јесте чињеница да спојене спонзориране огласе за претрагу меша у органске резултате претраге, готово без визуалног знака да то чини. Ситни отисак на крају сваког резултата претраге даје вам до знања да ли је то „спонзорисани“ резултат или не - нпр. Оглас. У потрази за „депресијом“ на Догпиле-у, 14 од првих 20 резултата претраге били су огласи - није баш нешто са чим би се већина обичних људи дуго подносила.

Људи који траже садржај на мрежи одавно су одлучили да напусте употребу претраживача који покушавају да измешају оглашавање са стварним резултатима. Разлог је једноставан - људи ће кликнути на оглас када их занима производ или услуга који се нуде. Не воле да их превара да кликћу на оно што су сматрали резултатом претраге, само да би сазнали да је то маскирани оглас.

Па ко користи Догпиле? Ко зна, али сигурно није вероватно да ће то бити редовни корисник Интернета. Док преко 150 милиона људи користи Гоогле, а 90 милиона користи Бинг.цом, Догпиле-ових 2-3 милиона људи месечно бледи у поређењу и далеко је мање од 0,05% укупног тржишта претраживача.

Можете ли спровести анкету на тако малом скупу података и покушати користити дим и огледала како бисте учинили да сте заправо радили исту врсту револуционарних истраживања која је Кинсеи Институте радио 1950-их и 1960-их? Сигурно можеш.

На пример, Оги Огас и Саи Гаддам рекли су да су анализирали 400 милиона претраживања Интернета. Али упоредите овај број са 3 милијарде претрага извршених сваког дана, према Хитвисе-у, компанији за аналитику на мрежи. Одједном 400 милиона - иако наизглед импресиван број у вакууму - изгледа далеко мање импресивно када се ставе у неку врсту контекста података. 400 милиона претраживања еквивалентно је ономе што је изведено за око 3 сата. У једном дану.

Контекст је, наравно, све што се тиче скупова података, посебно када су ти скупови података вероватно пристрасни на начине на које се никада нисте потрудили да истражите. У овом случају, скуп података је пристран употребом претраживача Догпиле - сићушног претраживача са нишама који је вероватније него што га не користи одређени подскуп становништва који се разликује од остатка популације.

Дакле, узмите ову листу са резервом. Занимљиво је, али нисам сигуран да одражава општу популацију. И сигурно не вреди купити целу књигу која се упушта у овај мањкави скуп података.

!-- GDPR -->