Laatst bijgewerkt: 28-6-2020 om 14.43
Ik besteedde dit jaar (2020) al eerder aandacht aan het boek The Authoritarian Personality (TAP). Het idee achter die serie posts was: wat levert nauwkeurige lezing van dit belangrijke boek, waar het empirische discriminatie- en agressie-onderzoek mee begon, precies op?
Mijn eerste blogpost (hier)
ging over de vraag welk probleem de auteurs precies wilden aanpakken.
Hun formuleringen op dat punt liepen nog wel eens wat uiteen en waren
niet altijd even duidelijk.
Mijn tweede post ging over de verborgen nugget in TAP (hier).
Een van de auteurs, Levinson, was er eerst in geslaagd anti-semitisme
meetbaar te maken. Daarna was hij erin geslaagd het wijdere begrip
'etnocentrisme' (bevooroordeeldheid, 'generalized prejudice') meetbaar te
maken op zo'n manier dat er niet langer echt aan getwijfeld kon worden.
Ik geef hierna een samenvatting van de eerdere posts en introduceer het laatste grote resultaat van TAP: de beruchte F-schaal.
Het begin van het onderzoek
Het empirische onderzoek naar de wortels van de Holocaust bereikte haar eerste mijlpaal met de publicatie van The Authoritarian Personality (TAP). Dit dikke (in totaal meer dan duizend bladzijden) en lastig leesbare boek verscheen in 1950.
Als auteurs staan vermeld: T.W. Adorno, Else Frenkel-Brunswik, Daniel
J. Levinson en R. Nevitt Sanford. Verder droegen Betty Aron, Maria
Hertz-Levinson en William Morrow ieder een hoofdstuk bij aan het boek.
Kennelijk mochten zij ieder een deel-onderzoekje uitvoeren en
beschrijven, maar hadden zij geen inspraak in het totale project.
Het
onderzoek dat in het boek wordt gerapporteerd, is gestart tijdens de
Tweede Wereldoorlog op verzoek van de AJC (American Jewish Committee).
Deze Joodse organisatie maakte zich grote zorgen over de gebeurtenissen
in Europa en wendde zich tot wetenschappers voor een oplossing.
Dik en lastig leesbaar
Ben
ik de enige die denkt dat het boek lastig leesbaar is? Bob Altemeyer
'vergat' als student gemakshalve dit boek door te ploeteren en viel
vervolgens bij het mondelinge tentamen (dat had je in die tijd nog) door
de mand. Als remedie mocht hij vervolgens een nota schrijven om aan te
tonen, dat hij zich alsnog in het boek verdiept had.
Die
nota zou zijn basis worden voor iets van veertig jaar moeizaam
onderzoek. Zijn onderzoek resulteerde in een betrouwbare en goed
gevalideerde maat om de problemen met de F-schaal voor eens en altijd op
te lossen. Althans dat was de bedoeling.
We
kennen zijn maat nu als de RWA-schaal (Right Wing
Authoritarianism-schaal). Met de RWA-schaal an sich is geen enkel
probleem, maar uit het vervolg van mijn verhaal zal blijken dat deze
schaal iets anders meet, dan de oorspronkelijke F-schaal.
Ik
kon via Amazon.com het boek tweedehands uit Amerika laten komen. Het
blijkt het voormalige exemplaar te zijn van het Mt. Vernon College
Library, 2100 Foxhall Rd., N.W, Washington D.C. Een
universiteits-bibliotheek in de Amerikaanse hoofdstad. In de meer dan
vijftig jaar dat men het boek bezat, is het tweemaal uitgeleend. Eerst
in december 1972, daarna in augustus 1997. Mogelijk is het in de
bibliotheek tussentijds nog wel eens ingekeken. Maar doordat het een
zeldzaam dik boek is, dat ook nog eens weinig toegankelijk geschreven
is, lijkt het niet plausibel dat iemand met inkijken, echt ver kon
komen.
Toch is er op dit boek veel kritiek
geleverd. Wat ik in de loop der jaren van die kritiek gezien heb, houdt
niet altijd over. Soms lijken de aangevoerde bezwaren nogal gezocht. Het
lijkt me plausibel dat veel mensen kritiek hebben geleverd, maar nooit
de moeite hebben genomen het boek grondig door te nemen. Waarom zou je?
Dat kost veel tijd, terwijl de bedoeling van kritiek doorgaans toch
vooral is, jezelf als wetenschapper te profileren. (De rest van mijn verhaal zal dit punt overtuigend bevestigen.)
De beruchte F-schaal
De
kritiek die geleverd is, had bijna altijd betrekking op de F-schaal. De
F-schaal was door de auteurs bedoeld de aanleg voor fascisme te meten,
zonder openlijk te vragen naar vooroordelen jegens minderheidsgroepen.
Op die manier hoopten de auteurs aan te tonen, dat aanleg voor fascisme
een persoonlijkheidskenmerk is.
Bepaalde
personen hebben aanleg voor fascisme, andere mensen hebben dat niet. Een
idee dat in 1950 zo revolutionair was, dat eigenlijk niemand eraan
wilde. En misschien geldt dat punt ook nu nog wel. Het idee dat sommige
mensen 'racistisch' zijn, maar anderen niet, is niet wat iedereen graag
hoort.
De auteurs presenteerden de auteurs
de F-schaal, waar ze officieel allemaal aan hadden meegewerkt, als het
belangrijkste resultaat van het boek. Het draaide uiteindelijk allemaal
om de F-schaal, beweerde Adorno. De F-schaal was de grote doorbraak in
het onderzoek naar fascisme, vond hij.( En uiteraard was die F-schaal
vooral zijn werk. In werkelijkheid raakte hij pas halverwege het project
bij het onderzoek betrokken.) Door die manier van presenteren, lijkt het
begrijpelijk dat de kritiek zich daarna vooral op de F-schaal richtte.
Wie
echter de moeite neemt het boek beter door te lezen, ziet dat het boek
al voordat het aan de behandeling van de F-schaal begint, twee
belangrijke ontdekkingen heeft gerapporteerd. De tweede ontdekking is
echter alleen zichtbaar voor de grondige lezer en ontging ook de auteurs
zelf volledig. Kennelijk hebben ook zij nooit de moeite genomen elkaars
hoofdstukken nauwkeurig door te ploeteren.
Bevooroordeeldheid (etnocentrisme): het fundament onder het empirische discriminatie-onderzoek
Het
eerste belangrijke resultaat in het boek is het meetbaar maken van
bevooroordeeldheid. Tegenwoordig noemen we dat ook wel: 'generalized prejudice'. Hoe
moet je geneigdheid tot discriminatie meten? Dat is nog
niet zo'n simpele vraag. Maak er echter van: hoe moet je het instemmen met vooroordelen meten en de vraag is opeens beantwoordbaar geworden.
Wie overigens vandaag de dag
deze vraag (how to measure prejudice?) aan Google voorlegt, krijgt nog steeds een reeks onjuiste en misleidende links. We
willen kennelijk heel hard roepen dat 'racisme' en 'discriminatie'
volledig fout zijn, mits we ons maar niet in de kille feiten hoeven te
verdiepen.
TAP is
het eerste onderzoek dat ondubbelzinnig aantoonde dat je
bevooroordeeldheid kunt meten door een reeks uiteenlopende vooroordelen
aan de respondenten voor te leggen. De ontdekking wordt meestal
toegeschreven aan Allport (1954, hier), die het resultaat beeldend verwoordde, maar die was toch echt een aantal jaren later en heeft dit zelf nooit aangetoond. De
auteurs van TAP boekten deze historische
doorbraak: de neiging tot discriminatie is een meetbaar persoonlijkheidskenmerk.
In werkelijkheid waren het echter niet alle auteurs. In werkelijkheid ging het om een enkele auteur. Levinson, de man die deze hoofdstukken schreef, was eerst begonnen
anti-semitisme meetbaar te maken.
Nadat dat boven verwachting goed
gelukt was, vroeg hij zich af, of het niet kon gaan om een algemener
verschijnsel. Kon het niet zo zijn dat mensen die anti-semitisch waren,
vaak ook niets moesten hebben van andere 'foute' en 'vreemde' groepen?
Ons soort mensen is oké, maar Joden, kleurlingen, buitenlanders en
dergelijke deugen niet? Was het instemmen met vooroordelen misschien een
algemeen kenmerk van bepaalde mensen?
Levinson
vond de term 'bevooroordeeldheid' te beperkt. Hij wilde
benadrukken dat het niet alleen ging om een negatief oordeel over mensen
van andere groepen, maar dat het ook kon gaan om een positief oordeel
over de mensen van de eigen groep. Het idee: wij zijn oké, maar zij deugen niet.
Hij prefereerde de minder bekende term: 'etnocentrisme'. Alles en
iedereen beoordelen volgens de normen van je eigen groep.
Zijn
etnocentrisme-maat (de E-schaal) bleek betrouwbaar te zijn. Verder
leverden de verschillende subschalen van deze maat uitkomsten op die
onderling allemaal hoog met elkaar correleerden. Welke subschalen je precies
gebruikte, maakte dus voor het uiteindelijke resultaat niet uit. Alle subschalen maten
dezelfde eigenschap. Wie bevooroordeeld was tegen de X, was dat doorgaans ook tegen de Y.
Levinson
had een prachtig resultaat geboekt. Hij had als eerste aangetoond dat
je bevooroordeeldheid kunt meten. Bevooroordeeldheid is niet beperkt tot
afkeer van specifieke groepen, maar geldt voor alle 'anderen'. Bevooroordeeldheid is ook niet beperkt tot afkeer van 'foute' groepen, maar omvat ook voorkeur voor mensen van de 'eigen' groep. Verder is
bevooroordeeldheid een meetbaar persoonskenmerk. Niet iedereen heeft evenveel. Sommige mensen bezitten veel, anderen hebben weinig of niets.
Het
resultaat van Levinson, in 1950 gepubliceerd in TAP, vormt het
solide fundament onder het empirische discriminatie- en agressie-onderzoek.
Zonder dit resultaat is de rest van het verhaal niet denkbaar. Merkwaardig genoeg bleef
dit resultaat echter grotendeels onopgemerkt en lijkt men zich nog
steeds vaak de relevantie niet te realiseren.
Bevooroordeeldheid (generalized prejudice)
Bevooroordeeldheid is nooit beperkt tot een bepaalde selecte outgroup, maar generaliseert naar alle mogelijke 'vreemde' groepen. Bevooroordeeldheid houdt ook in: positieve discriminatie van de leden van de eigen groep. Maar het belangrijkste punt: bevooroordeeldheid is een meetbare eigenschap. Niet iedereen is even bevooroordeeld. Je hebt mensen die het vrijwel niet zijn, je hebt mensen die het heel erg zijn en de meeste mensen zitten daar tussenin.
De 'mislukte' check met de PEC-schaal
Levinson hoopte met etnocentrisme de aanleg voor fascisme bepaald te hebben.
Mensen die vooroordelen jegens andere groepen omarmen, zijn -- als je let op fascistische en rechtse propaganda -- de
ideale aanhangers van de strongman. Maar om zeker te zijn, dat je inderdaad 'fascisme' meet, heb
je een check nodig. Je hebt een tweede maat nodig om fascisme te meten, die hetzelfde resultaat oplevert.
Als
tweede fascisme-maat nam Levinson het onderscheid tussen politiek links
en rechts. De mensen die politiek rechts zitten, steunen de absolute vorst. Ze steunen de strongman. Je kunt dat meten door na te gaan of men wel of niet instemt
met politiek rechtse
standpunten. (Wat precies politiek links is, is vaak minder duidelijk.)
Hij noemde deze vragenlijst: Politiek-Economisch Conservatisme (de
PEC-schaal). Als de PEC-schaal dezelfde resultaten opleverde als de
Etnocentrisme-schaal, ging het kennelijk inderdaad om de 'aanleg voor
fascisme' die door beide maten gemeten was.
Levinson vond een duidelijke
correlatie tussen etnocentrisme en Politiek-Economisch Conservatisme, maar een
correlatie die lang niet perfect (één) was. Beide maten leken enigszins hetzelfde te meten, maar lang niet precies hetzelfde.
Hierna ging Levinson onderzoektechnisch de mist in. Hij realiseerde
zich niet dat hij rekening moest houden met de lage
(alfa-)betrouwbaarheid van de gebruikte PEC-schaal. Wanneer je
meet met een betrouwbaarheid van bijvoorbeeld 0.50, dan kan in beginsel
de correlatie met een andere variabele (die met dezelfde lage betrouwbaarheid
gemeten is) nooit hoger uitvallen dan 0.50. Wanneer je in dat geval een
correlatie van 0.50 vindt, betekent dat, dat beide variabelen -- mits je
ze betrouwbaar zou meten -- perfect gecorreleerd zijn. Levinson
concludeerde ten onrechte dat de E-schaal slechts beperkt correleerde
met de PEC-schaal.
Wie zich realiseert dat
de PEC-schaal zeer onbetrouwbaar was en dat ook de betrouwbaarheid van
de E-schaal niet perfect was, ziet dat voor de onbetrouwbaarheid van
beide schalen gecorrigeerd moet worden via de zogenaamde 'correctie voor attenuation'. Wie dat doet, vindt vervolgens een vrijwel perfect
verband (een correlatie van bijna 1). Politiek rechts (PEC) en
bevooroordeeldheid (de Etnocentrisme-schaal) leveren -- mits betrouwbaar gemeten --
vrijwel dezelfde resultaten op.
Hoe verder?
Men had 'etnocentrisme' boven alle twijfel meetbaar weten te maken, maar de check met PEC als tweede variabele om aanleg voor fascisme te meten was niet echt gelukt. Wat moet je in zo'n geval doen?
Wie rationeel denkt, zal proberen de aanleg voor fascisme een derde keer meetbaar te maken en dan op zo'n manier dat er geen twijfel kan bestaan, dat er inderdaad fascisme gemeten is. Je wilt dus een instrument bestaande uit meerdere subschalen die onderling duidelijk correleren.
Vervolgens moet je aantonen dat die derde maat inderdaad hetzelfde meet als de eerste maat (de Etnocentrisme-schaal). Anders zit je immers met het probleem dat je twee maten hebt voor hetzelfde die verschillende uitkomsten opleveren.
Het ging dus niet alleen om de succesvolle constructie van een nieuw meetinstrument voor fascisme, maar het ging er ook om te laten zien dat dat nieuwe meetinstrument dezelfde resultaten opleverde als de etnocentrisme-maat.
Wie echter slordig denkt, ziet wel het constructiepunt, maar mist het aantoonpunt. Of mist dat tweede punt niet volledig, maar ziet niet het grote belang ervan. Ik vrees, dat dat inderdaad is, wat er vervolgens gebeurde. De auterus van TAP realiseerden zich niet, dat alles stond en viel met de uitkomst van de aanstaande check.
Geen opmerkingen:
Een reactie posten