zaterdag 7 december 2019

De AQ meet autisme belangrijk beter dan de kernitems


'Autisme' is een lastig begrip doordat iedereen er iets anders onder kan verstaan. Gelukkig kunnen we het meten met de AQ. Helaas heeft deze vragenlijst ook een belangrijk bezwaar. Het probleem is, dat de betrouwbaarheid nogal beperkt is.

Eerder (hier) kon ik voor de Zweedse AQ berekenen dat coëfficiënt alfa, een maat voor de betrouwbaarheid op basis van de mate waarin de items soortgelijke uitkomsten opleveren, slechts 0.73 bedraagt. Een waarde die voor een vragenlijst van 50 items nogal matig is.

Een consequentie van die lage betrouwbaarheid is dat de AQ alleen voor onderzoeksdoeleinden (gemiddelden van groepen) goed bruikbaar is. De AQ is echter te weinig nauwkeurig voor uitspraken over individuele personen. De betrouwbaarheid (de nauwkeurigheid) van de scores is daarvoor te gering.

Gelukkig blijken er in de AQ een 12-tal items te zitten, die onderling wel goed samenhangen: de zogenaamde 'kernitems'. Deze items zijn wel betrouwbaar: de coëfficiënt alfa bleek 0.92 te bedragen. Deze items vormen inderdaad een consistente maat.

Verder maken deze kernitems goed onderscheid tussen 'autisten' en 'niet-autisten'. De scores van beide groepen op de kernitems verschillen sterk. De kernitems meten dus niet alleen betrouwbaar een  eigenschap X, maar de eigenschap X die ze meten is ook bruikbaar (valide) om 'autisten' te onderscheiden van 'niet-autisten'.

De AQ maakt echter -- vreemd genoeg -- ook goed onderscheid tussen beide groepen. De vraag rijst dan: welke van de twee doet het beter? Maakt de AQ beter onderscheid of winnen de kernitems op dit punt?

De manier om beide tests op dit punt te vergelijken, is het verschil dat beide groepen maken op de desbetreffende maat, te delen door de standaarddeviatie van die maat. Wanneer het verschil tussen beide groepen met de kernitems bijvoorbeeld 8 is en de maat heeft een standaarddeviatie van 10, is het verschil gerekend in standaarddeviaties 0.8. Op deze manier kunnen beide maten op dit punt eenvoudig vergeleken worden.


Welke vragenlijst onderscheidt autisme beter: de AQ of de kernitems?

De vijftig items van de AQ leveren een verschil van 0.17 per item tussen het gemiddelde van de 'autisten' en het gemiddelde van de 'niet-autisten'. Het totale verschil voor 50 items is 8.3 punt die de 'autisten' hoger scoren dan de 'niet-autisten'. Uitgaande van de standaarddeviatie van 6.3 voor de AQ komt dat neer op een verschil van 8.3/6.3 standaarddeviatie. Voor de AQ vinden we dus 1.3 standaarddeviatie.

De 12 kern-items van de AQ leveren een verschil van 0.30 per item. Bijna twee keer zoveel als het gemiddelde item van de AQ. Samen leveren de 12 kernitems 3.6 punt verschil op tussen beide groepen.

Daar de betrouwbaarheid van de kernitems bekend is (0.92) en ook de som van de itemvarianties (in Baron-Cohen scoring: 2.70) bekend is, kan via de berekeningsformule voor coëfficiënt alfa de variantie van de itemsom gevonden worden (17.3). Dat levert voor de kernitems een standaarddeviatie van 4.2 op.

Voor de 12 kernitems vinden we dan een verschil tussen 'autisten' en 'niet-autisten' van 3.6/4.2. Voor de kernitems vinden we dus 0.9 standaarddeviatie.

Voor de AQ vonden we 1.3, voor de kernitems 0.9. De AQ wint dus met een grote voorsprong. Hoewel de AQ items bevat die onderling alle kanten lijken uit te schieten, meet ze op een of andere manier autisme belangrijk beter, dan de 12 kernitems, die wel een betrouwbare maat opleveren.

Conclusie: de 50 items tellende AQ  maakt beter onderscheid tussen 'autisten' en 'niet-autisten' dan de 12 kernitems alleen. Wie dus onderscheid wil maken tussen autisten en niet-autisten heeft belangrijk meer aan de AQ, dan aan alleen de 12 kernitems.













Geen opmerkingen:

Een reactie posten