Laatst bijgewerkt: 24/3/2024 om 23.59
Het boek 'The Authoritarian Personality' (TAP) dat in 1950 verscheen, geldt als het begin van het empirische onderzoek naar discriminatie en facisme. Met 'discriminatie' werd niet bedoeld dat mensen een auto anders behandelen dan een hond, maar werd 'sociale discriminatie' bedoeld. Met 'fascisme' werd bedoeld 'enthousiasme voor de strongman'.
Het boek heeft ladingen kritiek losgemaakt, maar uiteindelijk -- na bijna 75 jaar -- leidde al die ophef tot de bijna onvoorstelbare resultaten op het gebied van discriminatie en agressie, die we nu hebben.
Dat het boek die cult-status tenslotte kon krijgen, danken we vooral aan het werk van wijlen Bob Altemeyer. Zonder zijn bijna levenslange werk om de F-schaal te verbeteren, wat resulteerde in de RWA-schaal en onze kennis over 'rechtse autoritaristen', zou het boek mogelijk verzonken zijn in de diepten van het verleden.
In dit verband is er nog een bijzonderheid te melden. Altemeyer vond TAP aanvankelijk helemaal niks. Ook later zag hij vooral problemen met het in TAP uitgevoerde onderzoek.
Waarom ging hij dan toch door op dit gebied, waar veel psychologen vaak weinig mee hebben? Er zijn leukere dingen dan de Holocaust. Altemeyer formuleerde het zo: hij puzzelde graag. Dit was een soort grote puzzel, het was leuk die op te lossen.
Terug naar het boek. Met het boek zijn een aantal merkwaardige zaken. Op bepaalde punten is het een vreemd boek.
Het idee achter het boek was relatief simpel. Duitse Joden waren voor zichzelf tot de overtuiging gekomen dat er met de nazi's in Duitsland iets was. Dat het mensen waren met een gemankeerde persoonlijkheid.
Mijn vader kwam in Nederland tijdens de bezettingsjaren tot een soortgelijke conclusie. Hij had een stel NSB'ers in zijn kennissenkring en had zich afgevraagd: hoe kun je enthousiast zijn voor zo'n foute club? Zijn conclusie was als volgt: het waren op zich goede mensen, waar niets mis mee was, maar ze hadden 'een kronkel in de kop'. Iets in hun hoofd zat niet goed.
Waar moet je beginnen als je onderzoek wilt doen naar de Holocaust? Het populaire antwoord is, dat alles begon met Hitler. Maar als je beter kijkt, zie je dat dat niet klopt. Hitler was een oproerkraaier, het was iemand die een grote menigte met zijn toespraken kon opzwepen. Dat soort mensen heb je echter overal en altijd.
De vraag was dus, hoe had deze oproerkraaier de macht kunnen grijpen? Hij kon pas aan de macht komen, nadat een belangrijke minderheid van de Duitsers op hem stemden.
Wie waren die Duitsers? De meeste Duitsers stemden niet op Hitler. Wat maakte dat sommige Duitsers dat wel deden en Hitler door dik en dun steunden? Met andere woorden: was het mogelijk de kronkel in de kop van fascisten echt aan te tonen?
Ik probeer hier de zaken zo simpel en helder mogelijk op te schrijven. En zo kort mogelijk. Dat is een soort natuurwetenschappelijke traditie. Einstein schijnt daar ooit iets over opgemerkt te hebben. Het moet allemaal zo kort mogelijk, maar niet zo kort, dat het onduidelijk of onvolledig wordt. De auteurs van TAP waren echter niet geschoold in de natuurwetenschappelijke traditie.
Het principe dat Einstein zo pakkend verwoordde, was niet besteed aan de
auteurs. De tekst gaat eindeloos door. Zelfs de twee mensen die meer
geschoold waren in de statistische verwerking van vragenlijstonderzoek,
hebben de neiging eindeloos door te keuvelen over van alles en nog wat.
Dat maakt het achterhalen van wat men nu precies gedaan en gevonden
heeft, niet eenvoudiger.
Het boek telt 984 bladzijden (inclusief de twee voorwoorden, exclusief dankwoord, inhoudsopgave, index en literatuurlijst). Het gaat, afgezien van de tabellen en figuren, om dicht bedrukte bladzijden. Ongeveer 500 woorden per pagina. In totaal dus ongeveer een half miljoen woorden.
Was deze wijdlopigheid in die tijd en in die kringen normaal? In de serie boeken waarin TAP verscheen, was een jaar eerder (1949) Prophets of Deceit verschenen. Ook dit boek ging over de Holocaust, maar dan niet over de mensen die de strongman aan de macht hielpen, maar over de mensen die strongman probeerden te worden en te zijn. Dit boekje telt 160 niet te grote, prettig leesbare bladzijden. Die vreemde wijdlopigheid was dus in die tijd en in dat verband absoluut geen culturele norm. Het is echt een kenmerk waarmee TAP zich onderscheidt. Wat mij betreft: in negatieve zin.
Als je beter kijkt naar de hoofdstukken in het boek, zie je dat slechts twee van de vier vermelde auteurs scholing en ervaring hadden met de statistische verwerking van persoonlijkheidsvragenlijsten. Dat waren: Daniel J. Levinson en R. Nevitt Sanford.
De twee andere voorin vermelde auteurs, Else Frenkel—Brunswick en T. W. Adorno, worden in dit deel van het boek over de vragenlijsten , alleen vermeld bij de F-schaal (hoofdstuk VII), maar niet als eerste auteur. Dat was Sanford.
Frenkel-Brunswick was verantwoordelijk voor 'Part II' (198 bladzijden). Adorno was verantwoordelijk voor 'Part IV' (184 bladzijden).
Alleen deel 1 van het boek (Part I) is gewijd aan het vragenlijstonderzoek en telt 260 bladzijden. Slechts iets meer dan een vierde van het hele boek vormde de basis voor waar we nu zijn.
'Part III' telde 114 bladzijden en handelde over de problemen en de scoring van de Thematic Apperception Test. Het eerste hoofdstuk was van Betty Aron (niet voorin vermeld als auteur). Het tweede hoofdstuk was van Levinson.
'Part V' telde (exclusief het slothoofdstuk) 184 bladzijden in drie hoofdstukken. Je zou dit deel kunnen zien als een soort toegift. Het eerste hoofdstuk was van Sanford, het tweede van William R. Morrow (voorin ook niet vermeld als auteur) en het derde hoofdstuk was van Maria Hertz Levinson (voorin ook niet vermeld als auteur).
Het slot-hoofdstuk telt 6 bladzijden en is kennelijk namens de voorin het boek vermelde auteurs. Het begint namelijk zo: "The most crucial result of the present study, as it seems to the authors, ..."
Je bent allemaal wetenschappelijk geschoold en je schrijft allemaal in hetzelfde boek over 'sociale discriminatie'. Je bent dan geneigd te verwachten, dat iedereen als gelijkwaardig lid van het team wordt gezien. In dit geval werd er echter openlijk onderscheid gemaakt. Er waren vier 'echte' auteurs en er waren drie 'onechte'. Die laatsten mochten wel een hoofdstuk schrijven, maar waren niet van voldoende gewicht om voorin vermeld te worden als auteur. Men dacht kennelijk: onderscheid moet er zijn.
Hoe pakten de auteurs het probleem van het vinden van de 'kronkel in de kop' aan? De eerste poging was om antisemitisme te meten met een vragenlijst. Dat leek goed te lukken, het leverde een betrouwbare lijst op. Alle items leken hetzelfde te meten.
Maar openlijk vragen naar de mening over Joden is natuurlijk niet ideaal. Je hebt dan kans dat echte jodenhaters invullen dat ze Joden fantastische mensen vinden. Men probeerde de lijst daarom breder te maken door te vragen naar de mening over zwarte mensen, de mening over andere Amerikaanse minderheden en de mening over het eigen land (Patriotism, vaderlandsliefde). Deze nieuwe vragenlijst had dus vier sublijsten.
Al die vier sublijsten bleken betrouwbaar (de score op de even items correleerde hoog met de score op de oneven items) en bleken alle vier dezelfde factor te meten. Deze resulterende lijst noemde men Etnocentrisme (E) of de E-schaal. Etnocentrisme betekent dat mensen de eigen groep als ideaal en norm zien en andere groepen als afwijkend, fout en minderwaardig.
Was Etnocentrisme inderdaad de kronkel in de kop die men zocht? Kon je met Etnocentrisme inderdaad nazi's herkennen? Als je daar zeker van wilde zijn, had je minstens nog een aparte check nodig, leek het.
Als check vroeg men naar de politiek economische overtuiging. Men dacht dat 'fascisten' qua denkbeelden op dit gebied nogal rechts moesten zijn. Deze PEC-schaal (Political Economic Conservatism-schaal) bleek minder betrouwbaar (0.70) dan de E-lijst, maar voor onderzoeksdoeleinden (om groepen te karakteriseren) leek dat nog voldoende.
Vervolgens was men pennywise, maar pound foolish. Men wilde zuinig doen, maar daardoor stortte de hele check uiteindelijk volledig inelkaar. Men bracht de PEC-lijst terug tot de helft: 5 items. Dan was de lijst sneller in te vullen door de respondenten, dacht men. Maar een vragenlijst met een matige betrouwbaarheid, die vervolgens ook nog eens gehalveerd wordt, heeft daarna natuurlijk doorgaans een veel te lage betrouwbaarheid. En dat was precies wat er gebeurde.
Wat leverde het onderzoek naar het verband tussen E en PEC op? Als alles goed was, zou men een mooie correlatie moeten vinden, omdat E en PEC allebei op verschillende manieren de aanleg moesten meten om enthousiast te zijn over de strongman. De correlatie die men vond, hield echter niet over. Kennelijk hadden E en PEC wel een factor gemeenschappelijk, maar maten ze tegelijkertijd allebei ook nog steeds iets anders, dacht men.
Letterlijk vermeldt TAP (p. 180) (de witregels heb ik terwille van de leesbaarheid tussengevoegd):
"The general level of the E-PEC correlations demonstrates that ethnocentrism and conservatism, as measured by the present scales, are significantly but imperfectly related.7 In everyday terms, we may say that conservatives are, on the average, significantly more ethnocentric than liberals are. The more conservative an individual is, the greater the likelihood that he is ethnocentric — but this is a probability and not a certainty.
Since the existence of an affinity between these ideological patterns has often been observed previously, the present correlations are perhaps less a startling discovery than an indication of the validity of the scales. To those who have been unaware of the E-PEC relationship, the significance of the correlations must be stressed.To those who tend to equate conservatism and ethnocentrism as psychological trends in the individual, it must be pointed out that the correlations are far from perfect.
Even with a much more reliable measure of PEC, the correlation with E could hardly average over .70 — a value inadequate for predictive purposes. It becomes necessary, then, to understand what produces the close association between these ideological patterns in the individual, as well as what systematic factors — apart from ignorance or misinformation — make the E-PEC correlation less than 1.0."
Welke correlatie vond men eigenlijk tussen E en PEC? De gemiddelde correlatie (over verschillende groepen; niet de beste manier om een correlatie te berekenen over een groot bestand!) was 0.57 (p. 179). Maar om die correlatie op waarde te kunnen schatten, heb je de betrouwbaarheden nodig van de twee betrokken variabelen. Omdat men dacht dat die akelig laag zou uitvallen, had men die echter maar niet berekend.
Wie de tekst nauwkeurig leest, ziet echter dat op p. 175 van TAP de gemiddelde onderlinge correlatie tussen de 5 items van de gehalveerde PEC-schaal staat vermeld als 0.14. Maar dat betekent dat de items (na standaardisatie op een standaarddeviatie van 1) een betrouwbaarheid hadden van gemiddeld 0.14. Via de Spearman-Brown formule voor testverlenging vind je dan voor 5 items samen een betrouwbaarheid van 0.45. Inderdaad nogal laag.
Maar als de betrouwbaarheid rond de 0.45 ligt en de gevonden correlatie bedraagt 0.57 dan is er een soort probleem. Want een variabele kan nooit hoger met een variabele correleren dan de wortel uit zijn betrouwbaarheid. In dit geval: 0.67. Met andere woorden: de gevonden correlatie was gelet op de onbetrouwbaarheid van de maat, vrijwel maximaal.
Wanneer we ook nog rekening houden met de onbetrouwbaarheid van de E-schaal (0.80) dan vinden we via de formule voor 'attenuation' een maximaal mogelijke correlatie van 0.60 wanneer beide variabelen (E en PEC) perfect betrouwbaar gemeten zouden zijn. Met andere woorden: rekening houdend met de onbetrouwbaarheid van beide variabelen was de gevonden correlatie vrijwel maximaal. Om precies te zijn, na correctie voor onbetrouwbaarheid 0.95.
De onderzoekers hebben zich door hun negatieve emoties over de lage betrouwbaarheid van PEC laten meeslepen, waardoor ze zich niet realiseerden dat ze via de E- en PEC-schaal tweemaal dezelfde factor hebben gemeten.
Tot zover bevat mijn verhaal niets nieuws, want het voorgaande heb ik in andere bewoordingen eerder gerapporteerd op deze blog. Maar nu komen we bij de volgende poging bevestiging te krijgen voor de validiteit van de E-schaal door deze te correleren met de beroemde/beruchte F-schaal. Hier verandert mijn eerder gerapporteerde belangrijk.
Dat rapporteer ik ter wille van de lengte echter in de volgende blogpost.
Geen opmerkingen:
Een reactie posten