Научне мере: поузданост и валидност

Мерење је важан део научног процеса. Кључни аспекти који се тичу квалитета научних мера су поузданост и валидност.

Поузданост је мера унутрашње конзистентности и стабилности мерног уређаја.

Ваљаност нам даје назнаку да ли мерни уређај мери оно за шта тврди.

Унутрашња конзистентност је степен у којем ставке или питања у мери доследно процењују исту конструкцију. Свако питање треба да буде усмерено на мерење исте ствари. Унутрашња конзистентност се често мери помоћу Цронбацх-ове алфе - супер-корелације свих ставки на скали. Ако је оцена 0,70 или већа, мерење је прихватљиво. Међутим, пожељно је 0,80 или више. Такође је важно узети у обзир контекст када се узима у обзир оцена која одражава унутрашњу доследност.

Стабилност се често мери поузданошћу испитивања / поновног тестирања. Иста особа два пута полаже исти тест и упоређују се резултати сваког теста. Висока корелација између два теста значи да је тест поуздан. У већини случајева корелација од најмање 70 сматра се прихватљивом. Међутим, ово је општа смерница, а не статистички тест.

Поузданост интертератора је још један коефицијент поузданости који се понекад користи за процену поузданости. Са поузданошћу интертератора, различити судије или оцењивачи (два или више) врше запажања, бележе своје налазе и затим упоређују своја запажања. Ако су оцењивачи поуздани, проценат сагласности треба да буде висок.

Када питамо да ли је мера валидна, питамо се да ли мери оно што би требало. Ваљаност је пресуда заснована на прикупљеним подацима, а не статистички тест. Постоје два основна начина за утврђивање валидности: постојеће мере и познате групне разлике.

Постојећи тест мера утврђује да ли је нова мера у корелацији са постојећим релевантним важећим мерама. Нова мера требало би да буде слична мерама које су забележене већ успостављеним важећим мерним уређајима.

Познате групне разлике одређују да ли нова мера прави разлику између познатих групних разлика. Илустрација познатих разлика у групама види се када се различитим групама даје иста мера, а очекује се да ће постићи различит резултат. Као пример, ако бисте демократама и републиканцима дали тест којим процењују снагу одређених политичких ставова, очекивали бисте да постигну другачији резултат. Њихови погледи се битно разликују по многим питањима. Ако би ове две групе постигле различит резултат, како се очекивало, могли бисмо рећи да мера указује на валидност - мерење онога за шта тврди да мери.

Приликом дизајнирања нових мерних уређаја неопходно је узети у обзир њихову поузданост и валидност. Мера може бити поуздана и неваљана. Али ваљана мера је увек поуздана мера.

!-- GDPR -->