Teorie položkových odpovědí (IRT)


Úvod

Teorie položkových odpovědí (ve zkratce IRT z anglického názvu Item Response Theory) patří do rodiny modelů s latentními proměnnými. Podobně jako ve faktorové analýze i zde vystupují empirické indikátory, které jsou reprezentovány manifestními proměnnými, ve kterých se odráží teoretické koncepty (kostrukty). Matematickým modelem teoretického konstruktu je latentní proměnná, která je obdobně jako ve faktorové anlýze spojitá a bývá známá jako latentní rys (z anglického latent trait). Na rozdíl od faktorové analýzy, kde se předpokládá, že manifestní proměnné jsou spojité, jsou v IRT tyto proměnné diskrétní.
V našem případě jsou manifestními proměnnými položky v dotazníku, které jsou zaměřené na zjišťování digitálních dovedností, sociální sítě a práci s internetem. Jsou tvořeny výroky, na které respondent odpovídá na 5-ti bodové Likertově škále (1-zcela neodpovídá mé situaci, ..., 5-zcela odpovídá mé situaci). Položky jsou tedy měřeny na ordinální škále a pro jejich kalibraci se používá IRT s ordinálními proměnnými (v tomto případě byl aplikován dvouparametrový Graded Response Model ). Tento model byl aplikován na každou ze tří dimenzí samostatně. Odpovědi na negativně formulované výroky (např. výrok Vyhledávání na internetu mě unavuje) byly v našem případě pro lepší interpretaci inverzně překódovány.

Vizualizace

Tato vizualizace je zaměřena především na kalibraci jednotlivých položek a obsahuje tři hlavní části: oblast grafu, oblast ovládání a legendu. V hlavním okně se nachází spojnicové grafy, kde jsou obsaženy následující komponenty:
Osa X - Na horizontální ose je obsažena latentní proměnná (Théta), která reprezentuje spojitou míru teoretického konstruktu (např. úroveň orientace na internetu). Protože latentní proměnná nemá žádnou škálu, musí se tato škála uměle vykonstruovat, aby bylo možné určit relativní pozici dané osoby v souboru podle hodnoty tohoto parametru. Definiční obor je stanoven od -4 do +4 a vychází z předpokladu, že Théta má v populaci standardizované normální rozdělení s nulovou střední hodnotou a směrodatnou odchylkou rovnou jedné. Jedná se k analogii k faktorovému skóru známému z faktorové analýzy.
Osa Y - Na vertikální ose je podle zvoleného typu křivky zobrazena buďto pravděpodobnost nebo informace. V prvním případě se jedná o pravděpodobnost, že osoba s danou lokalizovanou úrovní Théta zvolí určitý z pěti stupňů odpovědi a to v závislosti na typu křivky buďto samostatně nebo kumulativně. Obor hodnot je zde mezi nulou a jedničkou. Ve druhém případě není informace zhora omezená jedničkou a může nabývat i vyšších hodnot. V tomto případě bylo maximum rovno 18,2 u šesté položky druhé dimenze (instalace aplikací na telefon).

Typy křivek

Charakteristické křivky mezí - V případě pětibodové škály dostáváme 4 meze, které oddělují jednotlivé stupně. Jedná se o dichotomizaci odpovědí, kdy se celá úloha převádí na jednoduchý a původně používaný binární model. Následně je odhadována pravděpodobnost, že osoba s určitou úrovní Théta odpoví na danou položku některým stupňem pod danou mezí nebo některým stupňěm nad danou mezí. Výsledné čtyři křivky mají tvar písmene S a tento tvar je adjustován v závislosti na dvou odhadovaných parametrech:
  • Parametr diskriminace - tento parametr (ve vzorcích, které neuvádíme, bývá značen písmenem b) určuje, jak moc vzpřímená nebo položená bude výsledná křivka. Díky překódování odpovědí na negativně orientované položky je odhad tohoto parametru vždy kladný. Čím vyšší je hodnota tohoto parametru, tím více je S-křivka vzpřímená. Například v případě položky G2_06 (instalace aplikace na telefon) je odhad tohoto parametru roven 7,81. Jako kontrast si uživatel může prohlédnout např. položku G1_03, kde je odhad tohoto parametru roven 0,87. Matematicky se jedná o směrnici tečny v inflexním bodě. Tento parametr se liší napříč položkami, ale je stejný pro všechny 4 meze.
  • Parametr obtížnosti - tento parametr (bývá značen písmenem a) určuje horizontální posun křivek. Liší se nejen napříč položkami ale i mezi křivkami uvnitř zvolené položky. Respondent, jehož úroveň latentní proměnné Théta je rovna parametru obtížnosti, odpoví stupni pod a nad danou mezí se stejnou pravděpodobností - tedy 50% (hodnota 0.5 na ose Y). Z vizualizace se dá hodnota tohoto parametru názorně odečíst z průsečíku dané křivky a vodící přerušované čáry (hodnota Y = 0,5) rovnoběžné s osou X. Jako příklad položky s nízkou hodnotou odhadu parametru obtížnosti si můžeme vzít položku G1_04 (Vím, jak otevřít nové okno v internetovém prohlížeči). V případě první meze je obtížnost rovna -3,14, což znamená, že u osoby s hodnotou Théta = -3,14 (tzn. více než 3 směrodatné odchylky pod průměrem) je pravděpodobnost 50% že zvolí stupeň 2 a více. Jako příklad položky s vysokým parametrem obtížnosti můžeme uvést položku G2_02 (Vím, jak vytvořit webovou stránku), kde teprve u osoby s hodnotou Théta alespoň +1,19 je 50% pravděpodobnost zvolení stupně 5.
  • Charakteristické křivky položek - Jedná se o křivky pravděpodobnosti zodpovězení jednoho konkrétního stupně v závislosti na hodnotě Théta. Na rozdíl od předešlého případu se zde neberou do úvahy kumulativní stupně odpovědí, a proto ne všechny křivky jsou monotónní. Kromě krajních stupňů (1 a 5), které mají stejnou obtížnost jako krajní meze předešlých křivek, je nejvyšší pravděpodobnost zvolení daného stupně mezi parametry obtížnosti těchto krajních mezí.
    Informační křivky položek - V případě binárních položek je informační křivka unimodální a symetrická. V našem případě ordinálních položek to však neplatí. Informační křivka je multimodální, protože každý stupeň přispívá svojí vlastní informací, což způsobuje lokální maxima napříč různou úrovní latentního rysu Théta. Informační křivky obvykle bývají užitečné pro výzkumníky, kteří se zabývají kalibrací položek za účelem vývoje testové baterie nebo dotazníku. Snahou obvykle je zahrnout co nejmenší počet položek přinášející co nejvíce informace v co nejširším spektru latentního rysu Théta. Jak bylo zmíněno, v našem případě přináší nejvyšší informaci položka G2_06, avšak ve velmi úzkém intervalu Théta od -2 do 0. Poznamenejme, že pro každou dimenzi bylo maximum informace určováno samostatně.

    Ovládací panel a legenda

    V pravé horní části obrazovky je umístěn ovládací panel, který umožňuje uživateli přepínat pomocí select boxu mezi jednotlivými položkami. Dále je umožněno volit typ křivky kliknutím na příslušný text, který funguje jako radio button.
    V pravé dolní části se nachází legenda, která identifikuje barevné odlišení jednotlivých křivek.

    Tooltip

    Při najetí myší na určité křivky se objeví informační panel (tooltip) pro danou křivku. Tooltip obsahuje zejména interpolaci hodnot X (Théta) a Y (pravděpodobnost nebo informace) za použití interpolační metody d3.curveMonotoneX.