zondag 28 juni 2020

Terug naar TAP ('The Authoritarian Personality')


Laatst bijgewerkt: 28-6-2020 om 14.43


Ik besteedde dit jaar (2020) al eerder aandacht aan het boek The Authoritarian Personality (TAP). Het idee achter die serie posts was: wat levert nauwkeurige lezing van dit belangrijke boek, waar het empirische discriminatie- en agressie-onderzoek mee begon, precies op?

Mijn eerste blogpost (hier) ging over de vraag welk probleem de auteurs precies wilden aanpakken. Hun formuleringen op dat punt liepen nog wel eens wat uiteen en waren niet altijd even duidelijk.

Mijn tweede post ging over de verborgen nugget in TAP (hier). Een van de auteurs, Levinson, was er eerst in geslaagd anti-semitisme meetbaar te maken. Daarna was hij erin geslaagd het wijdere begrip 'etnocentrisme' (bevooroordeeldheid, 'generalized prejudice') meetbaar te maken op zo'n manier dat er niet langer echt aan getwijfeld kon worden.

Mijn derde blogpost (hier) ging over de 'mislukte' check die Levinson vervolgens uitvoerde. Hij wilde aantonen dat zijn etnocentrisme-maat inderdaad de aanleg voor fascisme weergaf. Om zekerheid te krijgen, had hij een tweede maat voor fascisme nodig. Hij koos het politieke links-rechts onderscheid. Vervolgens ging er iets helemaal mis.

Ik geef hierna een samenvatting van de eerdere posts en introduceer het laatste grote resultaat van TAP: de beruchte F-schaal.


Het begin van het onderzoek

Het empirische onderzoek naar de wortels van de Holocaust bereikte haar eerste mijlpaal met de publicatie van The Authoritarian Personality (TAP). Dit dikke (in totaal meer dan duizend bladzijden) en lastig leesbare boek verscheen in 1950.

Als auteurs staan vermeld: T.W. Adorno, Else Frenkel-Brunswik, Daniel J. Levinson en R. Nevitt Sanford. Verder droegen Betty Aron, Maria Hertz-Levinson en William Morrow ieder een hoofdstuk bij aan het boek. Kennelijk mochten zij ieder een deel-onderzoekje uitvoeren en beschrijven, maar hadden zij geen inspraak in het totale project.

Het onderzoek dat in het boek wordt gerapporteerd, is gestart tijdens de Tweede Wereldoorlog op verzoek van de AJC (American Jewish Committee). Deze Joodse organisatie maakte zich grote zorgen over de gebeurtenissen in Europa en wendde zich tot wetenschappers voor een oplossing.


Dik en lastig leesbaar

Ben ik de enige die denkt dat het boek lastig leesbaar is? Bob Altemeyer 'vergat' als student gemakshalve dit boek door te ploeteren en viel vervolgens bij het mondelinge tentamen (dat had je in die tijd nog) door de mand. Als remedie mocht hij vervolgens een nota schrijven om aan te tonen, dat hij zich alsnog in het boek verdiept had.

Die nota zou zijn basis worden voor iets van veertig jaar moeizaam onderzoek. Zijn onderzoek resulteerde in een betrouwbare en goed gevalideerde maat om de problemen met de F-schaal voor eens en altijd op te lossen. Althans dat was de bedoeling.

We kennen zijn maat nu als de RWA-schaal (Right Wing Authoritarianism-schaal). Met de RWA-schaal an sich is geen enkel probleem, maar uit het vervolg van mijn verhaal zal blijken dat deze schaal iets anders meet, dan de oorspronkelijke F-schaal.

Ik kon via Amazon.com het boek tweedehands uit Amerika laten komen. Het blijkt het voormalige exemplaar te zijn van het Mt. Vernon College Library, 2100 Foxhall Rd., N.W, Washington D.C. Een universiteits-bibliotheek in de Amerikaanse hoofdstad. In de meer dan vijftig jaar dat men het boek bezat, is het tweemaal uitgeleend. Eerst in december 1972, daarna in augustus 1997. Mogelijk is het in de bibliotheek tussentijds nog wel eens ingekeken. Maar doordat het een zeldzaam dik boek is, dat ook nog eens weinig toegankelijk geschreven is, lijkt het niet plausibel dat iemand met inkijken, echt ver kon komen.

Toch is er op dit boek veel kritiek geleverd. Wat ik in de loop der jaren van die kritiek gezien heb, houdt niet altijd over. Soms lijken de aangevoerde bezwaren nogal gezocht. Het lijkt me plausibel dat veel mensen kritiek hebben geleverd, maar nooit de moeite hebben genomen het boek grondig door te nemen. Waarom zou je? Dat kost veel tijd, terwijl de bedoeling van kritiek doorgaans toch vooral is, jezelf als wetenschapper te profileren. (De rest van mijn verhaal zal dit punt overtuigend bevestigen.)


De beruchte F-schaal

De kritiek die geleverd is, had bijna altijd betrekking op de F-schaal. De F-schaal was door de auteurs bedoeld de aanleg voor fascisme te meten, zonder openlijk te vragen naar vooroordelen jegens minderheidsgroepen. Op die manier hoopten de auteurs aan te tonen, dat aanleg voor fascisme een persoonlijkheidskenmerk is.

Bepaalde personen hebben aanleg voor fascisme, andere mensen hebben dat niet. Een idee dat in 1950 zo revolutionair was, dat eigenlijk niemand eraan wilde. En misschien geldt dat punt ook nu nog wel. Het idee dat sommige mensen 'racistisch' zijn, maar anderen niet, is niet wat iedereen graag hoort.

De auteurs presenteerden de auteurs de F-schaal, waar ze officieel allemaal aan hadden meegewerkt, als het belangrijkste resultaat van het boek. Het draaide uiteindelijk allemaal om de F-schaal, beweerde Adorno. De F-schaal was de grote doorbraak in het onderzoek naar fascisme, vond hij.( En uiteraard was die F-schaal vooral zijn werk. In werkelijkheid raakte hij pas halverwege het project bij het onderzoek betrokken.) Door die manier van presenteren, lijkt het begrijpelijk dat de kritiek zich daarna vooral op de F-schaal richtte.

Wie echter de moeite neemt het boek beter door te lezen, ziet dat het boek al voordat het aan de behandeling van de F-schaal begint, twee belangrijke ontdekkingen heeft gerapporteerd. De tweede ontdekking is echter alleen zichtbaar voor de grondige lezer en ontging ook de auteurs zelf volledig. Kennelijk hebben ook zij nooit de moeite genomen elkaars hoofdstukken nauwkeurig door te ploeteren.


Bevooroordeeldheid (etnocentrisme): het fundament onder het empirische discriminatie-onderzoek

Het eerste belangrijke resultaat in het boek is het meetbaar maken van bevooroordeeldheid. Tegenwoordig noemen we dat ook wel: 'generalized prejudice'. Hoe moet je geneigdheid tot discriminatie meten? Dat is nog niet zo'n simpele vraag. Maak er echter van: hoe moet je het instemmen met vooroordelen meten en de vraag is opeens beantwoordbaar geworden.

Wie overigens vandaag de dag deze vraag (how to measure prejudice?) aan Google voorlegt, krijgt nog steeds een reeks onjuiste en misleidende links. We willen kennelijk heel hard roepen dat 'racisme' en 'discriminatie' volledig fout zijn, mits we ons maar niet in de kille feiten hoeven te verdiepen.

TAP is het eerste onderzoek dat ondubbelzinnig aantoonde dat je bevooroordeeldheid kunt meten door een reeks uiteenlopende vooroordelen aan de respondenten voor te leggen. De ontdekking wordt meestal toegeschreven aan Allport (1954, hier), die het resultaat beeldend verwoordde, maar die was toch echt een aantal jaren later en heeft dit zelf nooit aangetoond. De auteurs van TAP boekten deze historische doorbraak: de neiging tot discriminatie is een meetbaar persoonlijkheidskenmerk.

In werkelijkheid waren het echter niet alle auteurs. In werkelijkheid ging het om een enkele auteur. Levinson, de man die deze hoofdstukken schreef, was eerst begonnen anti-semitisme meetbaar te maken.

Nadat dat boven verwachting goed gelukt was, vroeg hij zich af, of het niet kon gaan om een algemener verschijnsel. Kon het niet zo zijn dat mensen die anti-semitisch waren, vaak ook niets moesten hebben van andere 'foute' en 'vreemde' groepen? Ons soort mensen is oké, maar Joden, kleurlingen, buitenlanders en dergelijke deugen niet? Was het instemmen met vooroordelen misschien een algemeen kenmerk van bepaalde mensen?

Levinson vond de term 'bevooroordeeldheid' te beperkt. Hij wilde benadrukken dat het niet alleen ging om een negatief oordeel over mensen van andere groepen, maar dat het ook kon gaan om een positief oordeel over de mensen van de eigen groep. Het idee: wij zijn oké, maar zij deugen niet. Hij prefereerde de minder bekende term: 'etnocentrisme'. Alles en iedereen beoordelen volgens de normen van je eigen groep.

Zijn etnocentrisme-maat (de E-schaal) bleek betrouwbaar te zijn. Verder leverden de verschillende subschalen van deze maat uitkomsten op die onderling allemaal hoog met elkaar correleerden. Welke subschalen je precies gebruikte, maakte dus voor het uiteindelijke resultaat niet uit. Alle subschalen maten dezelfde eigenschap. Wie bevooroordeeld was tegen de X, was dat doorgaans ook tegen de Y.

Levinson had een prachtig resultaat geboekt. Hij had als eerste aangetoond dat je bevooroordeeldheid kunt meten. Bevooroordeeldheid is niet beperkt tot afkeer van specifieke groepen, maar geldt voor alle 'anderen'. Bevooroordeeldheid is ook niet beperkt tot afkeer van 'foute' groepen, maar omvat ook voorkeur voor mensen van de 'eigen' groep. Verder is bevooroordeeldheid een meetbaar persoonskenmerk. Niet iedereen heeft evenveel. Sommige mensen bezitten veel, anderen hebben weinig of niets.

Het resultaat van Levinson, in 1950 gepubliceerd in TAP, vormt het solide fundament onder het empirische discriminatie- en agressie-onderzoek. Zonder dit resultaat is de rest van het verhaal niet denkbaar. Merkwaardig genoeg bleef dit resultaat echter grotendeels onopgemerkt en lijkt men zich nog steeds vaak de relevantie niet te realiseren.



Bevooroordeeldheid (generalized prejudice)
Bevooroordeeldheid is nooit beperkt tot een bepaalde selecte outgroup, maar generaliseert naar alle mogelijke 'vreemde' groepen.  Bevooroordeeldheid houdt ook in: positieve discriminatie van de leden van de eigen groep.  Maar het belangrijkste punt: bevooroordeeldheid is een meetbare eigenschap. Niet iedereen is even bevooroordeeld.  Je hebt mensen die het vrijwel niet zijn, je hebt mensen die het heel erg zijn en de meeste mensen zitten daar tussenin.




De 'mislukte' check met de PEC-schaal

Levinson hoopte met etnocentrisme de aanleg voor fascisme bepaald te hebben. Mensen die vooroordelen jegens andere groepen omarmen, zijn -- als je let op fascistische en rechtse propaganda -- de ideale aanhangers van de strongman. Maar om zeker te zijn, dat je inderdaad 'fascisme' meet, heb je een check nodig. Je hebt een tweede maat nodig om fascisme te meten, die hetzelfde resultaat oplevert.

Als tweede fascisme-maat nam Levinson het onderscheid tussen politiek links en rechts. De mensen die politiek rechts zitten, steunen de absolute vorst. Ze steunen de strongman. Je kunt dat meten door na te gaan of men wel of niet instemt met politiek rechtse standpunten. (Wat precies politiek links is, is vaak minder duidelijk.) Hij noemde deze vragenlijst: Politiek-Economisch Conservatisme (de PEC-schaal). Als de PEC-schaal dezelfde resultaten opleverde als de Etnocentrisme-schaal, ging het kennelijk inderdaad om de 'aanleg voor fascisme' die door beide maten gemeten was.

Levinson vond een duidelijke correlatie tussen etnocentrisme en Politiek-Economisch Conservatisme, maar een correlatie die lang niet perfect (één) was. Beide maten leken enigszins hetzelfde te meten, maar lang niet precies hetzelfde.

Hierna ging Levinson onderzoektechnisch de mist in. Hij realiseerde zich niet dat hij rekening moest houden met de lage (alfa-)betrouwbaarheid van de gebruikte PEC-schaal. Wanneer je meet met een betrouwbaarheid van bijvoorbeeld 0.50, dan kan in beginsel de correlatie met een andere variabele (die met dezelfde lage betrouwbaarheid gemeten is) nooit hoger uitvallen dan 0.50. Wanneer je in dat geval een correlatie van 0.50 vindt, betekent dat, dat beide variabelen -- mits je ze betrouwbaar zou meten -- perfect gecorreleerd zijn. Levinson concludeerde ten onrechte dat de E-schaal slechts beperkt correleerde met de PEC-schaal.

Wie zich realiseert dat de PEC-schaal zeer onbetrouwbaar was en dat ook de betrouwbaarheid van de E-schaal niet perfect was, ziet dat voor de onbetrouwbaarheid van beide schalen gecorrigeerd moet worden via de zogenaamde 'correctie voor attenuation'. Wie dat doet, vindt vervolgens een vrijwel perfect verband (een correlatie van bijna 1). Politiek rechts (PEC) en bevooroordeeldheid (de Etnocentrisme-schaal) leveren -- mits betrouwbaar gemeten -- vrijwel dezelfde resultaten op.


Hoe verder?

Men had 'etnocentrisme' boven alle twijfel meetbaar weten te maken, maar de check met PEC als tweede variabele om aanleg voor fascisme te meten was niet echt gelukt. Wat moet je in zo'n geval doen?

Wie rationeel denkt, zal proberen de aanleg voor fascisme een derde keer meetbaar te maken en dan op zo'n manier dat er geen twijfel kan bestaan, dat er inderdaad fascisme gemeten is. Je wilt dus een instrument bestaande uit meerdere subschalen die onderling duidelijk correleren.

Vervolgens moet je aantonen dat die derde maat inderdaad hetzelfde meet als de eerste maat (de Etnocentrisme-schaal). Anders zit je immers met het probleem dat je twee maten hebt voor hetzelfde die verschillende uitkomsten opleveren.

Het ging dus niet alleen om de succesvolle constructie van een nieuw meetinstrument voor fascisme, maar het ging er ook om te laten zien dat dat nieuwe meetinstrument dezelfde resultaten opleverde als de etnocentrisme-maat.

Wie echter slordig denkt, ziet wel het constructiepunt, maar mist het aantoonpunt. Of mist dat tweede punt niet volledig, maar ziet niet het grote belang ervan. Ik vrees, dat dat inderdaad is, wat er vervolgens gebeurde. De auterus van TAP realiseerden zich niet, dat alles stond en viel met de uitkomst van de aanstaande check.













Geen opmerkingen:

Een reactie posten