Stop discriminatie! Maar hoe? : augustus 2020

zondag 30 augustus 2020

Een 'anti-racist' die andere mensen beschuldigt van 'racisme', maar daar zelf kennelijk hoog op scoort

Laatst bijgewerkt: 30-8-2020 om 15.22

Ik kwam onlangs een merkwaardig opiniestuk tegen in de Volkskrant (18 augustus 2020). Het is afkomstig van Sybren Kooistra en getiteld: Laat je horen, maar verwacht tegenspraak (hier).

Maar laat ik beginnen bij het begin. Dit vreemde verhaal begint met een mijns inziens onberispelijke column van Max Pam (Tegen empathie, Volkskrant, 22 juli 2020, hier).

De column van Pam houdt in, dat we moeten uitkijken met empathie. Hij vermeldt in zijn column onder andere het boek Against Empathy (2016 ) van Paul Bloom.

Inhoudelijk gezien lijkt me dat terecht. Wanneer we beginnen af te gaan op onze gevoelens, is het een kwestie van tijd voordat de treinen gaan rijden. En dan moet je niet vragen, wat erin zit. De zooifactor (bevooroordeeldheid) en emotionaliteit zijn hecht verbonden. Het is niet zomaar, dat je de zooifactor ook kunt omschrijven via de as rationeel-irrationeel.

Die keurige column van Pam was voor Kooistra echter aanleiding de volgende tweet de wereld in te slingeren:

"Empathie (met zwarte mensen) is gevaarlijk. Het is de empathie van antiracisten die ze gewelddadig maakt. En de waardering voor zwarte kunstenaars is niet rationeel. Uw doorsnee racistische column in de @volkskrant van vandaag komt van Max Pam."

Onder het bericht is een plaatje geplakt van de column van Pam zoals die op internet verscheen, met een stukje tekst uit zijn column daarnaast. Het doel van dat alles is kennelijk de tweet wat aantrekkelijker te maken, want zonder motiverend plaatje is het lezen van zo'n tweet misschien wat veel gevraagd van de meeste twitteraars.

Die betiteling van zijn column als 'racistisch' schoot Pam in het verkeerde keelgat. De nazi's hebben onder zijn familie stevig huisgehouden en dan komt zo'n kwalijk label extra hard aan. Hij liet zijn advocaat aangifte doen wegens smaad. Dat leverde vervolgens een andere column van hem op, waarin hij zelf uitlegt, wat hij kwalijk vindt aan de bewering van Kooistra (hier).

Je zou denken: een storm in een glas water. Al die twitterende mensen staan bekend om hun wilde, extreme en agressieve uitspraken. Neem je ondoordachte bewering terug en bied je verontschuldigingen aan.

Maar zo blijkt dat dus niet te gaan. Daardoor werd ik in de Volkskrant van 18 augustus verrast op dat nogal chaotische verhaal van Sybren Kooistra. Eerst iemand in het wilde weg betichten van het schrijven van een 'racistische' column. Vervolgens niet publiekelijk je verontschuldigingen aanbieden, maar prompt in de Volkskrant uitgebreid gelegenheid krijgen, uit te venten dat je het gelijk toch echt helemaal aan je kant hebt.

Iemand die in het wilde weg extreme beschuldigingen publiceert en dan nog wel op Twitter, komt op mij over als een vrij agressieve roeptoeter. Kan ik gelijk hebben dat het om een extreem bevooroordeeld persoon gaat?

Qua opleiding (sociologie, politicologie, sociale geografie) en beroep (journalist, campagneleider, spindoctor) wel. Verder is het niet iemand die graag en veel lijkt te schrijven. Het is vooral iemand, net als Trump, die heel veel twittert.

Als Kooistra inderdaad een double-high (een extreem groepsmens, een extreem bevooroordeeld persoon) is, en alles duidt daarop, dan zou je verwachten dat er ook sprake moet zijn van dubbel gestoorde waarneming (DGW). Dus, laten we eens kijken.

Het eerste bestanddeel van DGW lijkt me wel aangetoond. In de column van Pam is volgens mij en anderen geen spoor van racisme te bekennen. Kooistra stelt dus dingen te zien, die er in werkelijkheid niet zijn.

Is ook het tweede bestanddeel van DGW aanwezig? Kunnen we aantonen dat Kooistra niet precies weet, wat Pam geschreven heeft?

Kooistra schrijft in zijn opiniestuk de volgende zin over de 'foute' column van Pam: "Daarin filosofeert hij [Max Pam] over het nut van empathie, beginnend en eindigend met zinnen over hoe witte mensen zich verhouden tot zwarte mensen in Nederland."

Laten we die zin eens onderzoeken.

Volgens mij schreef Pam niet over het nut van empathie, maar over het gevaar van empathie. Dat lijkt me nogal een verschil.

Begon en eindigde de column van Pam inderdaad met een zin, die betrekking had op de relatie tussen witte mensen en zwarte mensen in Nederland? Bij het lezen van de column is me dat niet opgevallen. Maar laten we kijken.

De eerste zin van de column van Pam luidt: "Onlangs schreef ik over het probleem van de empathie, dit naar aanleiding van de advocaat Natacha Harlequin, die had gezegd dat witte mensen niet kunnen voelen wat zwarte mensen voelen."

Gaat die zin over de relatie tussen witte Nederlanders en zwarte Nederlanders? Beweert Pam iets over die relatie? Kom nou. Die zin introduceert het onderwerp van de column: empathie. Dat is weer iets belangrijk anders, dan wat Kooistra beweert.

Ook de laatste zin van de column heeft eerder bij mij niets opgeroepen over de relatie tussen witte en zwarte mensen in Nederland. Maar laten we weer kijken. Om de zin te kunnen plaatsen, citeer ik de volledige laatste alinea van de column.

De laatste alinea van Pam luidt: "Compassie is inderdaad overal. Ik stemde af op de eerste aflevering van Zomergasten met de rapper Typhoon. Na vijf minuten wist ik al: hier zullen weinig mensen naar kijken, maar morgen zullen alle kranten er uitermate positief over schrijven."

Als we kijken naar de laatste zin van de column, dan gaat die over de beoordeling van Zomergasten. Volgens Pam zullen de kijkcijfers laag zijn, maar de kranten heel positief. Doe je dan een uitspraak over de relatie tussen witte en zwarte Nederlanders? Staat het tv-kijkend publiek voor 'wit Nederland' en de krantenredacties voor 'zwart Nederland'? Dat lijkt me nogal overtrokken. Ook deze bewering van Kooistra klopt dus niet.

Ik pak één enkele zin uit het verhaal van Kooistra. In die ene zin blijken drie beweringen te zitten, die niet kloppen met wat in de column van Pam staat. In één enkele zin drie onwaarheden produceren. Zelfs Trump zal dat niet altijd lukken.

Kooistra beweert eerst iets over de column van Pam, dat niet klopt: de column zou 'racistisch' zijn. De column die hij nauwkeurig gezien en gelezen zou moet hebben, alvorens daar allerhande uitspraken over te publiceren, is voor hem een gesloten boek gebleven. Kennelijk interesseert het de man geen sikkepit wat er echt in de column van Pam staat. Als hij maar kan roeptoeteren. Als hij maar het hoogste woord kan voeren.

Is dit de enige keer dat Kooistra iemand beschuldigt van 'racisme'. Afgaande op wat ik van de man kon vinden op internet is 'racisme' voor de man een soort stopwoord geworden. Overal denkt hij 'racisme' te zien om vervolgens degene die zich aan dat 'racisme' schuldig heeft gemaakt, luidkeels aan de schandpaal te nagelen. De strekking is in feite: iedereen is 'racistisch', behalve hij en zijn volgelingen/gelovigen. Althans, als we hem mogen geloven.

Wat mij verder opvalt is het enorme aantal tweets dat de man heeft geproduceerd. Volgens Twitter heeft hij afgerond 22.800 tweets geproduceerd in iets meer dan tien jaar tijd. Ik kom dan uit op iets van 2200 tweets per jaar. Dat is gemiddeld per dag een 6 tweets en dat gedurende meer dan 10 jaar. Dat grote aantal tweets per dag, betekent dus ook, dat er over de gemiddelde tweet niet al te lang wordt nagedacht. Het moet vooral: snel, snel. Het is schieten vanaf de heup.

We hebben hier iemand die zichzelf opwerpt als 'anti-racist'. Iemand die vervolgens overal 'racisme' en 'fascisme' denkt te zien. Maar ook iemand die in extreme mate lijdt aan dubbel gestoorde waarneming (DGW). Maar DGW en bevooroordeeldheid gaan samen op. Waar het een is, is ook het ander.

Een duidelijk teken dus dat we te maken hebben met een extreem bevooroordeeld iemand. In het Engels hebben ze daar een mooi woord voor: 'bigot'. In het Nederlands komt 'racist' misschien het dichtstbij.

Aan de andere kant moet je natuurlijk niet te snel willen zijn. Trek ik nu niet te gemakkelijk een conclusie? Laten we voor de zekerheid nog even checken.

Allereerst is er die grote mate van agressie. Iemand publiekelijk beschuldigen van het schrijven van een 'racistische' column. Verder is Pam tot nu toe bepaald niet het enige doelwit van de man. Wat de verwachte score op bevooroordeeldheid (de standaard maat voor agressie) betreft, lijkt er dus weinig twijfel mogelijk.

De volgende standaard-check is te kijken naar sociale dominantie en (rechter vleugel) autoritarisme. Die twee variabelen voorspellen samen vrijwel volledig bevooroordeeldheid. Als je kijkt naar het LinkedIn profiel van de man lijkt me weinig twijfel mogelijk over die sociale dominantie. Ook het autoritarisme druipt bijna van zijn opinie-artikel af. Ook deze check levert dus hetzelfde resultaat op.

Dan hebben we nog die concrete bewering van de man in dit geval. Hij ziet 'racisme', waar het niet is. Het is alsof je bijna midden in een Asch-experiment zit.

En alsof dat allemaal nog niet genoeg is, hebben we dan ook nog die extreme mate van DGW. In één zin drie onjuistheden de wereld inslingeren. Vrij naar de woorden van weerman Gerrit Hiemstra: Eén zin met 3 keer onzin. Wie kan daar overheen?

Hiemstra deed die uitspraak in reactie op een tweet van Baudet over het klimaat. Hij zag in de tweet van Baudet (ik overigens ook) 4 duidelijke onwaarheden. Dus inderdaad: zo bont als Baudet het maakt, lukt het Kooistra niet. (Zie voor een verslag van deze twitterfittie: https://www.thebestsocial.media/nl/gerrit-hiemstra-burnt-thierry-baudet-op-twitter-en-onzin-discussie-is-aan/.)

Is het toeval dat in dit verband de naam van Baudet opduikt? Ik denk van niet. De een poneert in één zin drie onwaarheden, de ander poneert in één tweet vier onwaarheden. Kennelijk is DGW inderdaad typerend voor rechtse roeptoeters.

Alle vier checks leveren dezelfde uitkomst. Er lijkt niet echt twijfel mogelijk: deze persoon die overal 'racisme' denkt te zien, scoort naar verwachting uitermate hoog op bevooroordeeldheid. De standaardmaat voor discriminatie en agressie.

Toch ben ik nog niet volledig tevreden. Als je de conclusie hierboven ziet, is het een vrij forse uitspraak. Laten we naar de tweet kijken, waarmee de vete begon. Voor het gemak herhaal ik die hier nog een keer.

"Empathie (met zwarte mensen) is gevaarlijk. Het is de empathie van antiracisten die ze gewelddadig maakt. En de waardering voor zwarte kunstenaars is niet rationeel. Uw doorsnee racistische column in de @volkskrant van vandaag komt van Max Pam."

Empathie is gevaarlijk, volgens mij en volgens Pam, maar Kooistra maakt er in zijn tweet iets heel anders van. Empathie (met zwarte mensen) zou gevaarlijk zijn. Nee, dus. Dan maak je van een neutrale uitspraak een discriminerende uitspraak. Iets dat Pam nooit gesteld heeft en ook nooit bedoeld heeft.

Ook de tweede zin van de tweet, is nooit in die vorm door Pam geformuleerd. Hetzelfde geldt voor de derde zin van de tweet.

Wat er dus gebeurt, lijkt duidelijk. Kooistra hoort iets, dat hem niet bevalt. Hij ziet empathie als iets heel moois en nu komt iemand vertellen, dat het helemaal niet zo mooi is. Vervolgens loopt het gal de man over. Als een soort vuurspuwende draak begint hij beweringen uit te kramen. Hij denkt iets te horen en te zien, maar wat hij denkt te horen en te zien, is er helemaal niet. Voor zijn idee is het standpunt dat Pam over het voetlicht probeert te brengen helemaal fout en moet het krachtdadig bestreden worden. Niet met zakelijke argumenten, maar met emotioneel geroeptoeter.

Als je dus afgaat op de tweet, reageert de man volstrekt emotioneel. Hij hoort vaag iets en onmiddellijk slaan alle stoppen door. En weet hij alles volstrekt zeker. Maar ging het bij Adolf echt anders?

De tweet suggereert dus dat hij de column niet echt verwerkt heeft, de column heeft zijn systeem 1 getriggerd en vervolgens begon het bekje te schuimbekken en onzin uit te kramen.

Maar een sterk ontwikkeld systeem 1 is een verdere aanwijzing voor extreme bevooroordeeldheid. Dat geeft dus in totaal vijf argumenten om te denken, dat we hier te maken hebben met een extreem bevooroordeelde persoonlijkheid.

Waarom is dit resultaat belangrijk voor deze blog? Uitgaande van wat we tot nu toe afgeleid hebben uit het Asch-onderzoek verwachten we voor (extreem) bevooroordeelde mensen, dat ze in situaties met publiek dingen zien die er niet zijn en niet waarnemen, wat er is. Dit concrete voorbeeld bevestigt die uitkomst. We hebben hier kennelijk een bevooroordeeld persoon, die ziet wat er niet is en die niet ziet, wat er wel is.

Ik beperk me nu weer even tot de onjuiste bewering over de 'racistische' column en de ene zin in de twee met drie onjuistheden over die column. In termen van DGW hebben we het dan over een foute bewering en het niet zien van wat er is.

Die twee punten kun je echter misschien ook onder dezelfde noemer brengen. We baseren immers de conclusie dat de persoon iets 'ziet' op zijn verhaal, dat niet klopt met wat er te zien valt. De conclusie dat deze persoon niet ziet, wat er is, baseren we echter ook op zijn verhaal (in dit geval: die ene zin), dat op drie plaatsen niet klopt, met wat er is.

Je kunt dus ook zeggen: de bewering over de 'racistische' column klopt niet met de feiten en die ene zin met drie onjuistheden, klopt ook niet met de feiten. Met andere woorden: de man produceert voortdurend een verhaal dat niet klopt met de feiten. Een verhaal dat los van de werkelijkheid staat.

Dat invalideert onze eerdere conclusie echter niet. Op grond van zijn verhaal is het immers plausibel dat de man inderdaad niet heeft waargenomen, wat er is. Maar deze manier van taalgebruik die de man hanteert, maakt het mogelijk zijn gedrag te verklaren via een enkel principe.

Deze persoon produceert kennelijk vooral woorden om sociaal indruk te maken. Anders geformuleerd: deze persoon produceert overwegend mands (propaganda, reclame) en geen tacts (beschrijvingen). Zijn doel is sociaal te scoren. Gegeven dat doel interesseert hij zich niet voor de feitelijke juistheid of onjuistheid van zijn uitspraken.

Voor Hitler gold bij zijn toespraken precies hetzelfde. Alleen het aantal nieuwe leden dat zich voor de NSDAP meldde, zag hij als criterium van succes. De juistheid of onjuistheid van wat hij beweerde, vond hij volstrekt irrelevant.

Maar als dat principe voor deze twitteraar opgaat, verwacht je dat dat het in het algemeen zal opgaan. DGW en bevooroordeeldheid kunnen dus vanuit hetzelfde principe worden verklaard. De bevooroordeelde persoon produceert woorden, die geen tacts zijn, maar mands. Het is allemaal propaganda en heeft niets van doen met dat wat werkelijk is. Er bestaat voor deze twitteraar geen enkele noodzaak zich druk te maken over iets als 'feitelijke juistheid', want dat is zijn doel niet.

Dat resultaat klopt met het -- volledig op empirisch onderzoek gebaseerde -- soortenmodel. Volgens het soortenmodel bestaat een moderne samenleving (zoals die ontstaan na de uitvinding van de landbouw) uit twee tegenovergestelde culturen. In de bèta-cultuur draait het bij uitspraken om feitelijke juistheid, in de alfa-cultuur gaat het slechts om sociale effect. In de ene cultuur moeten uitspraken kloppen met de harde werkelijkheid, in de andere cultuur moeten ze 'mooie' gevoelens (en soms minder mooie) oproepen bij het publiek.

Anders geformuleerd: wat deze persoon beweert, heeft geen feitelijke inhoud. Het is allemaal slechts sociaal geroeptoeter om aanhang en status te verwerven bij zijn publiek (zijn volgelingen/gelovigen).

Dat klinkt misschien alsof het allemaal ongevaarlijk is. Het is, historisch gezien, nog niet zo lang geleden dat zo'n zes miljoen Joden voortijdig aan hun einde kwamen door het sociale geroeptoeter van een andere, extreem bevooroordeelde persoon. De in feite overbodige wereldoorlog die door die persoon ontstond, kostte in totaal aan ongeveer 65 miljoen mensen het leven. Echt ongevaarlijk is geroeptoeter dus niet.

Aan de andere kant leert het empirische discriminatie- en agressie-onderzoek dat daar het probleem eigenlijk niet zit. Volksmenners zullen er altijd zijn. Pas op het moment dat ze een grote groep volgelingen/gelovigen achter zich weten te krijgen, loopt de situatie (vaak snel en volledig) uit de hand. Het probleem zit dus -- zo gezien -- niet bij de volksmenner, maar bij de volgelingen/gelovigen.

Het echte probleem is dus misschien niet, dat iemand onzin debiteert. Het echte probleem is dat veel mensen niet langer in staat zijn, die onzin als onzin te herkennen.

-----

Op 27-9-2020 in de zesde alinea van beneden de zin beginnend met "Het is allemaal propaganda" waarin de ontkenning was weggevallen, gecorrigeerd.

dinsdag 25 augustus 2020

Dubbel gestoorde waarneming (DGW) en bevooroordeeldheid zijn twee kanten van dezelfde medaille

Laatst bijgewerkt: 27-8-2020 om 22.24

Maar klopt het echt? Ik bedoel het verschijnsel: 'dubbel gestoorde waarneming' (DGW).

DGW is het verschijnsel dat extreem bevooroordeelde mensen geen idee hebben van wat ze precies gezien of waargenomen hebben. Hun blik is gericht op de groep (hun publiek), waardoor ze niet zien, wat zich voor hun ogen afspeelt. Het gevolg is dat ze niet alleen het onjuiste verhaal van de groep overnemen (de eerste storing in hun waarneming), maar ook niet waarnemen, wat er te zien valt (de tweede storing). Hun onjuiste verhaal is dus geen bewust liegen, maar een 'mooi' verhaal waarvan ze zichzelf de onjuistheid niet realiseren.

De basis voor het verschijnsel DGW zijn de kwantitatieve interview-data die Asch vermeld heeft in zijn beroemde artikel (1956) over conformiteit: A Minority of One Against a Unanimous Majority (pdf hier: http://psyc604.stasson.org/Asch1956.pdf).

Bij de analyse van de resultaten van Asch stuitte ik op een merkwaardig verschijnsel (zie mijn voorgaande blogposts). De mensen die voortdurend of bijna voortdurend met de groep meegaan (11 of 12 keer van de in totaal 12 mogelijke keren) blijken na afloop van het experiment geen enkel idee te hebben van het door hen aantal gemaakte fouten. Ze schatten doorgaans 0, 1 of 2 gemaakt te hebben, in werkelijkheid zijn het er 11 of 12. Ze schatten zichzelf in als heel goed, terwijl ze het in werkelijkheid heel slecht deden.

De mensen die voortdurend gewoon hun taak hebben uitgevoerd (0 fouten), weten dat ze het foutloos of vrijwel foutloos hebben gedaan. Het gemiddelde van hun schatting is 0.06 gebaseerd op 18 respondenten. Ze schatten zichzelf in als iets slechter dan ze in werkelijkheid waren.

Asch signaleert 'yielding without awareness', maar ziet niet precies wat hij heeft gevonden

Dit resultaat verklaart een merkwaardig punt in het verslag van Asch. Op basis van de gegeven antwoorden bij het interview na afloop verdeelde hij de mensen die twee keer of vaker meegegaan waren in hun antwoord met de groep, in drie categorieën. Een categorie die dacht dat zijn oordeel niet klopte, omdat het groepsoordeel natuurlijk superieur was. Een categorie die zag dat de groep een onjuist antwoord gaf, maar ten koste van alles niet uit de groep wilde vallen. En een categorie mensen die zich helemaal niet realiseerde dat men de groep volgde met zijn antwoord. Asch omschreef dat als: 'yielding without awareness'. Men was zich het volgen van de groep met zijn antwoord niet bewust.

Asch vond deze laatste categorie uiterst belangwekkend, maar vond het ook een dermate vreemd verschijnsel dat hij het niet zonder verder onderzoek wilde accepteren. Hij legde echter merkwaardig genoeg niet een nadrukkelijk verband met zijn gegevens betreffende het aantal keren dat men fout geantwoord had en de schatting van het gemaakte aantal fouten, die men gegeven had.

Het verslag van Asch levert dus in ieder geval op twee verschillende plaatsen informatie over DGW. Eerst via 'Table 12' (p. 35): een kruistabel van het aantal gemaakte fouten en het aantal geschatte fouten. Vervolgens via de categorisatie van de mensen die met de groep meegingen in drie categorieën (p. 41-50).

Asch omschreef 'yielding without awareness' als volgt (p. 41):

"Yielding at the 'perceptual' level.
Among the rarest, but not the less significant, of the reactions were those in which yielding occurred apparently without awareness."

Hij ziet 'yielding without awareness' dus als een verschijnsel dat ingrijpt op de perceptie. Mensen zien niet langer, wat er is. De waarneming is verstoord.

Het merkwaardige punt in het verhaal van Asch is dat hij 'yielding without awareness' niet koppelt aan de resultaten vermeld in 'Table 12' en dat hij het verschijnsel ook niet nadrukkelijk koppelt aan de mate waarin men met de groep meeging. De verklaring is vermoedelijk dat Asch vooraf geloofde dat iedereen het conflict tussen werkelijkheid en standpunt van de groep wel door zou hebben. Deze uitkomsten pasten niet goed bij dat geloof.

In het begin van zijn interview-verslag (p. 27) merkt hij op dat iedereen het conflict zich wel realiseerde. Hij schrijft: "All subjects noted the disagreement as soon as it occurred. They were also aware that the majority was unanimous and that they were in a minority of one. Their first reaction was one of puzzlement. The subjects felt that there was something wrong, but could not locate the source of the difficulty. Numerous statements testify to this."

Hij veronderstelt dat iedereen het wel door zal hebben en ziet dat vervolgens bevestigd door een aantal gesprekken. Hij ziet daardoor niet dat dit idee niet voor alle respondenten opgaat. Met andere woorden: door zijn geloof, zijn vooroordeel, zag hij niet duidelijk, wat hij precies had gevonden. Het fenomeen dat uit zijn gegevens en zijn verslag volgt, speelde ook hem parten.

Sociale wenselijkheid kan de gegevens over DGW niet verklaren

Weten de mensen met DGW werkelijk niet, hoe vaak ze een fout antwoord gaven of zeggen ze gewoon iets, dat 'mooi' (sociaal wenselijk) klinkt?

Stel je voor. Je hebt als proefpersoon meegedaan aan een Asch-experiment. Je volgde met je antwoorden voortdurend of bijna voortdurend de groep. Waarom deed je dat? Omdat je het belangrijk vindt, sociaal positief over te komen. Je dacht, dit is wat de groep gelooft. Ik ga daar niet tegenin, maar bevestig wat ze geloven.

Daarna neem je deel aan het interview. Maar je wilt natuurlijk nog steeds graag positief overkomen op andere mensen. In dit geval op je gesprekspartner, die de vragen stelt. Die gesprekspartner vraagt je: hoe vaak heb je fout geantwoord? Daarbij heeft hij van te voren nog eens uitgelegd wat hij precies bedoelt met 'fout' antwoorden. De lengte van de doellijn en de antwoordlijnen nameten met een lineaal en op die manier de juiste lengte bepalen.

Als je dus een goede indruk probeert te maken op je vragensteller, begrijp je waar de man (of vrouw) naar toe wil. Ja, je hebt inderdaad wel erg vaak (11 of 12 keer) een onjuist antwoord gegeven. Had je misschien beter niet kunnen doen, maar oké. Dat is immers, hoe je vragensteller de zaak ziet.

In werkelijkheid is dat echter niet, wat je zegt. Je zegt namelijk 0 of 1 fout gemaakt te hebben. Het antwoord dat je geeft, is in deze situatie, sociaal bekeken: uiterst ongelukkig. Het is een vreemd antwoord. Het wekt de suggestie dat je er niets van snapt.

Met andere woorden: het antwoord dat je geeft, kan onmogelijk verklaard worden door je drive om toch maar vooral een sociaal aangepast antwoord te geven. Want dan zou je precies de tegenovergestelde kant uitgaan met je antwoord.

DGW is functioneel voor groepsmensen

Maar als het antwoord dat je geeft, niet verklaard kan worden door sociale wenselijkheid, dan lijkt er maar één optie over te blijven. Je hebt echt geen flauw idee. Je hebt geen idee, dat je voortdurend of bijna voortdurend foute antwoorden gaf.

We kunnen de antwoorden die Asch kreeg, dus niet verklaren door sociale wenselijkheid. De enige overblijvende optie is dan: men had niet door dat men foute antwoorden gaf. Men realiseerde zich niet, dat men steeds het antwoord van de groep overnam. Men deed het wel, maar men had het niet door. Men deed, in Asch zijn termen, aan: 'yielding without awareness'.

Het gaat dus echt om 'dubbel gestoorde waarneming'. Eerst verkondigt men iets dat niet klopt, vervolgens blijkt men ook niet gezien te hebben, wat duidelijk waarneembaar was.

Hoe valt dat te begrijpen? Stel, je wilt scoren in de groep. Dat doe je niet door je mond te houden. Dat doe je door iets te roepen, dat bijval oplevert. Iets, dat goed valt. Als je dus wilt scoren, moet je snel zijn, want anders is iemand anders nog sneller en dan is je kans voorbij. Je moet dus echt klaar zitten om onmiddellijk verbaal in actie te kunnen komen. Niet denken, niet observeren, maar roepen en roeptoeteren.

Wanneer je je dus verplaatst in een extreem groepsmens, is het helemaal niet zo vreemd, om zo snel mogelijk iets te roepen en vooral je tijd niet te verdoen met observeren en nadenken. Op die manier bekeken is het verschijnsel 'dubbel gestoorde waarneming' zo gek nog niet. Want het gaat je niet om het waarnemen van iets, maar om het scoren in de groep.

Dat betekent, dat we twee soorten uitspraken hebben. Uitspraken die gebaseerd zijn op observaties. En uitspraken die bedoeld zijn om sociaal te scoren. In het Asch-experiment krijg je de opdracht observationele uitspraken te doen. Met die opdracht ga je akkoord. Vervolgens wordt het echter voor sommige mensen verleidelijk om sociaal te scoren.

Asch meet dus de mate waarin je weerstand kunt bieden aan de neiging om sociaal te scoren. En dat blijkt inderdaad precies hetzelfde te zijn als 'bevooroordeeldheid'. (Ik zet dat woord tussen enkele aanhalingstekens om aan te geven dat het om een meetbare variabele gaat en niet om een of ander abstract woord.)

Het idee dat we twee verschillende soorten uitspraken hanteren, heeft Skinner ook in Verbal Behavior (1957) gedaan, maar toen nog niet erg expliciet. Hij zag die twee totaal verschillende categorieën op dat moment nog niet duidelijk als de twee grote bouwstenen van menselijke taal. Observationele uitspraken benoemde hij als 'tacts'. Met zo'n uitspraak legde je 'contact' met de harde wereld. Uitspraken die sociaal bedoeld waren om te zorgen dat je iets kreeg, benoemde hij als 'mands' (als afkorting van 'demand', vragen).

Als je het bekijkt vanuit de optiek van een extreem groepsmens, is 'dubbel gestoorde waarneming' vermoedelijk heel functioneel. Maar is het inderdaad zo, dat alleen extreme groepsmensen het verschijnsel vertonen of komt het ook voor bij meer gematigde groepsmensen?

Relevantie van de relatie tussen DGW en bevooroordeeldheid

Hoe ontstond de voorgaande vraag? Ik vind in de krant een opinie-artikel. De schrijver beweerde eerder op Twitter 'racisme' te zien in een column van Max Pam. Pam zelf, ik en anderen zagen dat beweerde racisme echter niet in de column.

Die opmerking schoot Pam in het verkeerde keelgat en hij liet zijn advocaat aangifte doen wegens smaad. De ijverige twitteraar krijgt vervolgens in de krant nog eens volop gelegenheid zijn wilde bewering te verdedigen en te herhalen.

Wat me opvalt aan het opinie-artikel van de twitteraar is de chaotische en associatieve betoogtrant. Ik denk dus (rechter vleugel) autoritarisme te zien in combinatie met sociale dominantie. Met andere woorden: ik denk een double-high of 'men of words' te zien. De meest bevooroordeelde mensen die er op Gods aardbodem rondlopen.

Iets rapporteren, dat er niet is. Iemand beschuldigen van iets extreems zonder enige aanleiding. Een chaotische redeneerstijl hanteren. Als het inderdaad om een extreem groepsmens gaat, zou je DGW verwachten. Valt dat in dit geval aan te tonen?

Dat blijkt niet zo moeilijk te zijn. De schrijver beweert in één zin drie zaken over de column van Pam. Alle drie beweringen blijken na onderzoek onjuist te zijn. In één zin drie onjuistheden de wereld inslingeren. Zelfs iemand als Trump lukt dat niet altijd.

Als ik mijn verhaal vervolgens probeer op te schrijven, wil ik de conclusie trekken uit de door mij waargenomen DGW dat het om een extreem bevooroordeeld persoon moet gaan. Die conclusie klopt in dit geval vermoedelijk wel, maar die redenering klopt -- strikt genomen -- niet.

We hebben immers tot nu toe alleen het omgekeerde aangetoond. Mensen die extreem vaak met de groep meegingen in het Asch-experiment (dus extreem bevooroordeeld zijn), vertonen DGW. Het is echter goed mogelijk dat ook mensen die niet extreem bevooroordeeld zijn DGW vertonen.

Dus, hoe zit dit? Vertonen alleen extreem bevooroordeelde mensen DGW of is het een verschijnsel dat bij alle bevooroordeelde mensen in meer of mindere mate voorkomt?

DGW opnieuw onderzocht

De eenvoudigste manier om dit te onderzoeken, is opnieuw te kijken naar de interviewgegevens van Asch. Maar nu kijken we niet slechts naar de groep mensen met 11 en 12 fouten, maar naar alle respondenten die fouten gemaakt hebben. Het gaat dus om alle respondenten met 1 tot 12 fouten. Mensen die zich in enigerlei mate conformeren aan de groep, dus meer of minder bevooroordeeld zijn.

Om dit goed te kunnen doen, heb ik de gegevens van 'Table 12' en 'Table 13' van Asch ingevoerd in mijn statistiekprogramma.

Wat bedoelen we in dit verband precies met 'DGW'? De eerste storing in de waarneming meten we via het aantal gemaakte fouten. Die fout ontstaat door het antwoord van de groep over te nemen, terwijl voor je ogen zichtbaar is, dat dat onzin is. Vervolgens krijg je na afloop van het Asch-experiment de vraag, hoeveel foute antwoorden je gegeven denkt te hebben. Daarbij is nog eens precies uitgelegde wat bedoeld wordt met een 'fout' antwoord.

Wanneer je vier keer met de groep meegegaan bent, heb je dus vier keer een fout antwoord gegeven. Wanneer je dat echter in het interview na afloop precies weet, was je je dus kennelijk wel bewust van je fout. In dat geval heb je dus geen dubbel gestoorde waarneming. Je wist precies wat je zag, maar je vond het slimmer om met de groep mee te gaan. Het verschil tussen het aantal fouten en je schatting van het aantal fouten, is dus de maat voor DGW die we hanteren.

In beginsel is het dan mogelijk dat sommige mensen hun aantal fouten te hoog inschatten en anderen te laag. In het ene geval krijg je een negatieve waarde, in het andere geval een positieve waarde. Als je die zou optellen, vallen die tegen elkaar weg. Om dat te voorkomen, kun je dus consequent de absolute waarde gebruiken.

In werkelijkheid doet dit probleem zich bij de groepsmensen (1-12 fouten) in de Asch-data niet voor. Iedereen schatte zijn aantal fouten (veel) lager in, dan het werkelijk was. Er kunnen echter ook gevallen zijn, waarin negatieve waarden optreden en dan is het hanteren van de absolute waarde misschien toch beter.

Om mijn analysemethode duidelijk te krijgen en te kunnen testen, heb ik me in eerste instantie gericht op het aantal keren dat men dacht het oneens geweest te zijn met de groep ('Table 13').

Hoe vaak was men het oneens met de groep en wat schatte men?

In vorige blogposts heb ik laten zien dat extreme groepsmensen (11 en 12 fouten) vrij precies weten hoe vaak ze het oneens waren met de groep. Taakmensen (0 fouten) weten dit veel minder precies, maar gemiddeld genomen, weten ze dit toch ook nog vrij goed.

Wat levert deze analyse voor alle groepsmensen op? Ik heb eerst de correlatie berekend tussen het aantal keren dat men het oneens was met de groep en het aantal keren dat men schatte het oneens geweest te zijn met de groep. Ik vind een correlatie van 0.83 gebaseerd op 34 respondenten.

Dat betekent dus dat groepsmensen een heel goed idee hebben over hoe vaak ze zijn afgeweken van de groep. Dat klopt ook met mijn eerdere analyse. Groepsmensen focussen op de groep en weten daardoor ook precies hoe vaak ze de groep niet volgden.

De tweede correlatie die ik vanuit deze gegevens berekende, was tussen het aantal keren dat men het oneens was met de groep en de absolute fout die men maakte bij de schatting van dat aantal keren. Deze correlatie (weer op basis van 34 respondenten) bedroeg 0.57.

Wat betekent dat? Naarmate mensen het vaker oneens zijn met de groep (minder bevooroordeeld zijn, meer van een taakmens hebben) weten ze minder goed hoe vaak ze precies zijn afgeweken van de groep.

Deze analyse van 'Table 13' bevestigt dus, wat we al dachten, maar nu geldt de conclusie voor alle groepsmensen (1-12 fouten). De eerdere conclusie was gebaseerd op alleen de extreme groepsmensen (11 en 12 fouten) en daardoor belangrijk beperkter.

Hoe veel fouten maakte men en wat schatte men?

De volgende analyse heeft betrekking op het aantal fouten en het geschatte aantal fouten ('Table 12' van Asch) bij alle groepsmensen (1-12 fouten). Ik voer dezelfde stappen nog een keer uit, maar nu op deze gegevens.

De correlatie tussen het aantal fouten en het geschatte aantal fouten bedraagt 0.29 op basis van 40 respondenten. Met andere woorden: groepsmensen hebben vrijwel geen idee van het aantal fouten dat ze werkelijk maken. Ze weten vrijwel perfect hoe vaak ze afwijken van de groep, maar van het aantal fouten dat ze hebben gemaakt, hebben ze amper benul.

Deze correlatie van 0.29 kun je ook nog vergelijken met de eerdere correlatie van 0.83. Wat je dan ziet, is dat groepsmensen heel goed kunnen schatten hoe vaak ze zijn afgeweken van de groep, maar geen idee hebben van het aantal fouten dat ze gemaakt hebben. Ze doen hun benaming 'groepsmensen' dus echt eer aan.

Goed, maar waar het ons vooral om ging, was DGW. Als maat daarvoor zouden we het absolute verschil tussen het aantal fouten en de schatting daarvan, hanteren. Wat vinden we voor de correlatie tussen DGW en het aantal fouten?

Ik vind een correlatie van 0.90 gebaseerd weer op 40 respondenten. Met andere woorden: DGW en bevooroordeeldheid zijn vrijwel hetzelfde. Iemand die bevooroordeeld is, vertoont ook DGW en omgekeerd. Naarmate men meer bevooroordeeld is, neemt ook de mate van DGW toe.

Conclusie

Bevooroordeeldheid en DGW zijn een innig koppel. Waar de een is, is ook de ander. Anders geformuleerd: gelovigen (bevooroordeelde mensen) vertellen niet alleen een verhaal, dat niet klopt, ze zien ook niet, wat er is.

DGW en bevooroordeeldheid zijn overwegend hetzelfde. Het is verleidelijk om te denken dat DGW een nieuwe manier is om bevooroordeeldheid vast te stellen. Op basis van de gegevens van Asch kunnen we dat echter niet hard maken, omdat de bepaling van DGW ook gebaseerd is op het aantal gemaakte fouten. Het gaat immers om het absolute verschil tussen aantal fouten en de schatting daarvan. Via deze opzet kan DGW dus niet zelfstandig worden waargenomen.

De ervaring die ik inmiddels heb opgedaan door het analyseren van het eerder aangeduide opinie-artikel suggereert echter dat je enerzijds een ongefundeerde claim kunt aantonen, waarna je vervolgens kunt zoeken naar evidentie voor het niet goed hebben waargenomen van dat, waar men het over heeft. Ik hoop daar in een volgende post uitgebreider over te berichten.

zondag 23 augustus 2020

Dubbel gestoorde waarneming (DGW): twee voorbeelden

In mijn vorige blogpost kon ik twee doorbraken rapporteren. Allereerst blijkt conformiteit (het meegaan met de groep in een Asch-experiment) hetzelfde te zijn als bevooroordeeldheid, de zooifactor.

Asch komt op basis van de interviews na afloop tot een indeling in drie categorieën. Het soortenmodel, dat op basis van empirisch onderzoek verklaart waarom mensen bevooroordeeld zijn, voorspelt dezelfde drie categorieën. Dat lijkt alleen mogelijk als het in beide gevallen om dezelfde variabele gaat.

De tweede doorbraak is het verschijnsel van 'dubbel gestoorde waarneming' (DGW) en de tegenhanger: 'dubbel werkende waarneming' (DWW).

Extreem bevooroordeelde mensen (mensen met 11 of 12 fouten in het Asch-experiment) vertonen DGW. Dat bleek uit een heranalyse van de interview-gegevens in het artikel van Asch. Allereerst rapporteren deze mensen niet wat ze zien, maar wat de groep zegt, dat men ziet. Vervolgens blijken ze ook niet waargenomen te hebben, wat ze te zien kregen. De blik is zo volledig gericht op scoren in de groep, dat men geen aandacht meer besteedt aan wat men kan waarnemen.

Bij niet of nauwelijks bevooroordeelde mensen (mensen met 0 of 1 fout in het Asch-experiment) treedt een tegenovergesteld effect op. Men focust bewust op wat men moet waarnemen (systeem 2). Vervolgens blijkt men echter ook nog een redelijk idee te hebben van de antwoorden die de groep gaf. Kennelijk zijn die automatisch verwerkt door het automatisch werkende systeem 1. Men hanteert dus dubbel werkende waarneming, men neemt gelijktijdig via beide systemen verschillende zaken waar.

Strikt genomen is het natuurlijk wat griezelig om op basis van een enkele bron te besluiten tot het bestaan van iets als DGW, dat toch als behoorlijk bizar overkomt. Valt er meer evidentie voor te vinden?

Laten we even reflecteren. Waarom begonnen we aan de lastige en moeizame analyse van het Asch-artikel? De reden was de grote populariteit van het boek De meeste mensen deugen van Rutger Bregman. Op basis van wat we denken te weten, geldt: de meeste mensen deugen niet en in doorsnee deugen ze heel erg niet. Waardoor ontstaat die grote populariteit van dit boek dan?

Mijn verklaring was geloof, bevooroordeeldheid. Gelovigen zien zaken, die er niet zijn. In dat kader gaf ik drie voorbeelden (hier).

Het eerste voorbeeld was het boek van Bregman. De lezers omarmen zijn 'mooie' verhaal. Ze geloven het. Ze nemen het over. Ze 'zien' dus iets, dat er niet is.

Maar als we beter kijken, zien we nog iets. Deze mensen, die in het boek van Bregman geloven, zien ook niet, wat er wel is. Er is nogal wat evidentie dat veel mensen niet deugen en dat mensen vaak heel erg niet deugen. Die evidentie zien mensen die zijn boodschap geloven, doorgaans echter niet.

Samenvattend: mensen die geloven in de boodschap van Bregman, dragen uit iets te zien dat er niet is. Tegelijkertijd, zien ze ook niet, wat er wel is. Dit eerste voorbeeld lijkt dus te kloppen met het resultaat dat ik uit de gegevens van Asch afleidde.

Mijn tweede voorbeeld was een bedacht voorbeeld, om te laten zien dat we in beginsel allemaal wel eens in de verleiding kunnen komen, iets te 'zien' dat er niet echt is. Voor dat bedachte voorbeeld, ben ik niet uitgegaan van zeer bevooroordeelde mensen. Het doel was te laten zien, dat iedereen wel eens in de verleiding komt, iets te zien, dat er niet is. Ik veronderstel dus niet speciaal een bevooroordeeld persoon.

Mijn derde voorbeeld was uit het volle leven. Een medisch team krijgt van iemand te horen dat het in dit geval 'vermoedelijk om epilepsie' gaat. Men doet uitgebreid en langdurige kostbaar onderzoek. Al dat onderzoek heeft negatieve uitkomsten. Men vindt geen afwijkingen. Ondanks dat, weet men het daarna 'vrijwel zeker'. Het moet bijna zeker 'epilepsie' zijn.

Door een toeval wordt een specialist van een andere kliniek met deze diagnose geconfronteerd. Die vindt het maar een vreemd verhaal en begint vragen te stellen. Al snel zegt hij: stop maar, ik weet wat het is. Het kan geen epilepsie zijn en ik weet ondertussen ook wat het wel is. Maar als u helemaal zeker wilt zijn, kunt u zelf nog een test uitvoeren. De test bevestigt dat het om 'lage bloeddruk' gaat, iets dat in mijn dossier stond en ik mijn hele leven lang al heb gehad.

Het medische team dat tot de foute diagnose kwam, had verzuimd te vragen, wat er precies gebeurd was. Daardoor had men belangrijke verschijnselen gemist waaruit bleek, dat het onmogelijk om epilepsie kon gaan.

Ook in dit praktijkgeval zien we dus dubbel gestoorde waarneming (DGW). Eerst omarmt men te snel en te gemakkelijk een onjuiste bewering. Vervolgens ziet men zaken niet meer, die er wel waren.

Deze twee voorbeelden bevestigen het verschijnsel DGW. Het verschijnsel 'dubbel gestoorde waarneming' treedt inderdaad in werkelijkheid soms op.

zondag 16 augustus 2020

Is conformiteit (meegaan met de groep in het Asch-experiment) hetzelfde als bevooroordeeldheid?

Laatst bijgewerkt: 23-8-2020 om 0.55

In mijn vorige blogpost besprak ik het onderzoek van Asch naar conformiteit (pdf van zijn artikel: hier). De grote ontdekking die hij deed, was dat het meegaan met de groep, het produceren van onzin-antwoorden onder invloed van de groep, een persoonsvariabele is. Sommige mensen doen het voortdurend, anderen nooit, de meesten zitten daar ergens tussenin. Iedereen heeft in beginsel een vast getal dat aangeeft, waar hij precies zit.

Asch kon de neiging om met de groep mee te gaan, niet een klein beetje meten, maar kon het met slechts 12 'kritische' items nauwkeurig meten. De betrouwbaarheid (coëfficiënt alfa) die ik kon berekenen uit zijn gegevens, was 0.89. De score op deze 12 items wordt voor 89% bepaald door de persoonsvariabele, die gemeten wordt en bevat slechts 11% toeval.

De grote vraag: is conformiteit hetzelfde als bevooroordeeldheid, de zooifactor?

De grote vraag is natuurlijk: welke variabele heeft Asch precies gemeten? Gaat het bij de Asch-experimenten inderdaad, zoals je zou verwachten, om bevooroordeeldheid?

De eenvoudigste oplossing zou empirisch onderzoek zijn. Iemand herhaalt het Asch-experiment en meet daarvoor of daarna de mate van bevooroordeeldheid ('generalized prejudice') van de proefpersonen. De correlatie, gecorrigeerd voor onbetrouwbaarheid, levert het antwoord. Vervolgens is er nog een onafhankelijk ander onderzoek nodig, dat hetzelfde oplevert om helemaal zeker te zijn.

Helaas heb ik het eerste onderzoek, ondanks eindeloos zoeken, tot nu toe niet kunnen vinden. Laat staan het tweede. Sociaal-psychologen vinden dit kennelijk een foute vraag of zien misschien het probleem helemaal niet. Een andere mogelijkheid is dat ik op een of andere manier niet goed gezocht heb.

Het merkwaardige is dat Asch in zijn artikel (1956) het probleem wel zag. Hij besteedt maar liefst anderhalve bladzij, overwegend gezet in een kleine letter, aan de vraag, hoe dit probleem het beste aangepakt kan worden (p. 51-52). Hij schrijft: 'The striking individual differences leave us therefore with an unsolved problem that requires investigation' (p. 51).

Inmiddels zijn we bijna 65 jaar verder en is het probleem nog nooit aangepakt, laat staan opgelost. Sterker nog: sociaal-psychologen lijken het probleem volledig te hebben verbannen uit hun bewustzijn. Misschien een extra reden om het probleem nu wel aan te pakken en op te lossen.

Wie verder leest, zal zien dat mijn poging een onverwachte bijvangst levert. De interviewgegevens van Asch tonen bij heranalyse twee verschijnselen, die tot nu toe misschien wel verondersteld werden, maar bij mijn weten nog nooit aangetoond waren. Het gaat om, althans zo heb ik ze benoemd: 'dubbel werkende waarneming' (DWW) en 'dubbel gestoorde waarneming' (DGW).

DWW en DGW verklaren een resultaat dat Asch waarnam en beschreef, maar niet kon en wilde geloven. Als het echt zo was, moest het eerst maar eens grondig onderzocht en aangetoond worden in verder onderzoek. Het vreemde fenomeen dat Asch waarnam en niet goed kon plaatsen, omschreef hij als 'yielding without awareness' (de groep volgen zonder zich dat bewust te zijn).

Een tweede consequentie van DWW en DGW is dat het omarmen van vooroordelen (de meningen van een groep) in beginsel een vol-automatisch proces is, in ieder geval bij extreem bevooroordeelde personen, dat niet door bewust denken gecontroleerd wordt.

Terug naar de hoofdvraag. 'Conformiteit' is de naam die we hanteren voor dat wat Asch gemeten heeft. Je volgt met je antwoord de groep ook al kun je zien, dat het antwoord van de groep niet klopt. Maar welke variabele is dat precies? Gaat het inderdaad om bevooroordeeldheid, de zooifactor?

De twee soorten mensen die extreem scoren, bepalen de Asch-variabele

Om daarachter te komen, is het voldoende om naar het begin- en eindpunt van die variabele te kijken. Aan de beginkant heb je de mensen met 0 fouten, aan het eindpunt heb je de mensen met 11 en 12 fouten. Bij 12 'kritische' items had je dan dus alles of bijna alles fout. Het verschil tussen beide soorten mensen is de variabele, die we zoeken.

Uit de resultaten van Asch blijkt dat beide extreme soorten mensen behoorlijk vaak voorkomen. In de categorie met 0 fouten zit 24% van de proefpersonen. In de categorie met 9-12 fouten zit 18% van de proefpersonen. Wanneer we die laatste categorie inperken tot 11 en 12 fouten, blijft er nog steeds 8,1% over. Geen grote groep, maar voor ons doel vermoedelijk toereikend.

Het eerste punt van verschil dat ik dacht te zien, is dat de mensen met 0 fouten zich keurig houden aan hun opdracht, terwijl de mensen met 11 en 12 fouten de hele opdracht onmiddellijk lijken te vergeten. Het is alsof ze de opdracht nooit gehoord hebben.

Is die verklaring mogelijk? Nee, want in de controlegroep trad het effect niet op. Ook in de controlegroep hebben natuurlijk mensen gezeten, die hoog scoorden op conformiteit. In de controlegroep hoorde men echter niet de antwoorden van de andere 'groepsleden'. Iedereen noteerde steeds zelf zijn antwoord op papier. Je wist dus niet wat je buurman geantwoord had.

Bij deze afgedwongen zelfwerkzaamheid deden ook de mensen, die anders 11 en 12 fouten gehaald zouden hebben, kennelijk normaal hun taak. Dat wil zeggen: ze maakten niet of amper fouten. Ze deden gewoon wat ze moesten doen.

Het schijnbaar vergeten van de instructie is dus volledig het gevolg van de foute antwoorden die men hoort. De foute antwoorden hebben een dramatische uitwerking op bepaalde mensen. Het resultaat is dat ze 11 of 12 fouten halen. Het is dus niet zo, dat de instructie niet goed begrepen is of vergeten wordt. Het zijn echt de foute antwoorden die men hoort, waardoor de fouten ontstaan.

Het tweede punt van verschil, dat ik dacht te zien, is dat de mensen met 0 fouten hardnekkig focusten op de taak, die ze moeten uitvoeren en zich niet lieten afleiden door de foute antwoorden, die ze hoorden. De mensen met 11 en 12 fouten daarentegen lieten zich voortdurend of bijna voortdurend afleiden door de foute antwoorden die ze hoorden en namen die foute antwoorden ook nog eens volledig over.

--------------------
Ik schrijf: ze namen die foute antwoorden ook nog eens 'volledig' over. Klopt dat? Asch vermeldt namelijk iets merkwaardigs. Sommige mensen kozen, wanneer dat mogelijk was, een compromis-antwoord. Als het juiste antwoord de kortste lijn was en de groep antwoordde met de langste lijn, dan losten sommige proefpersonen het probleem op door met hun antwoord tussen beide antwoorden in te gaan zitten. Ze kozen als antwoord de qua lengte 'middelste' lijn.

Als je het logisch bekijkt, is dat een vreemde keus. Aan de ene kant klopt je antwoord niet met wat je ziet. Aan de andere kant ga je ook niet met de groep mee. Je kiest dus een oplossing die -- op welke manier je het ook bekijkt -- altijd fout is.

Aan de andere kant is het menselijk gezien, een begrijpelijke reactie. Door wat je ziet, word je de ene kant uitgetrokken. Door de groep word je de andere kant uitgetrokken. Wat moet je doen? Het conflict dat ontstaat, los je op door het midden te kiezen. Je kiest de compromis-oplossing.

Het kiezen van compromis-antwoorden bleek echter vooral te gebeuren door mensen die niet extreem scoorden. Dus door mensen in het middengebied van de verdeling. Mensen die kennelijk beide kanten van het probleem zien. Omdat wij ons beperken tot de mensen die extreem scoren, gaat het dus niet om compromis-antwoorden. De mensen die voortdurend of bijna voortdurend met de groep meegingen, gingen dus steeds volledig met de groep mee.
--------------------

Hoe kunnen we het voorgaande samenvatten? Het kan niet liggen aan het niet begrijpen of opeens vergeten van de instructie. Het effect in het Asch-experiment, ontstaat volledig door de foute antwoorden die men hoort.

Wat is dan precies het verschil tussen de mensen met 0 fouten en de mensen met 11-12 fouten? Het verschil zit volledig in de reactie op die foute antwoorden. Het ene soort mens focust volledig op de taak die men gekregen heeft en wil die zo goed mogelijk doen. Men laat zich dus niet afleiden door de foute antwoorden die men hoort.

Het andere soort mens wordt door de foute antwoorden die men hoort, diepgaand beïnvloed. Men vergeet als het ware onmiddellijk de taak die men moet doen. De foute antwoorden die men hoort, werken als een soort commando. Of men wil of niet, men moet aan dat commando gehoorzamen.

Kunnen we het eenvoudiger formuleren? De een soort mens focust hardnekkig op de taak die men gekregen heeft, de andere soort mens focust volledig op het zo gunstig mogelijk overkomen in de groep. Die twee extreme soorten mens kunnen we omschrijven als 'taakmensen' en 'extreme groepsmensen'.

Asch heeft een situatie geschapen waarin men aan de ene kant een objectieve taak moet uitvoeren. Aan de andere kant bevinden mensen zich ook in een groep, althans zo lijkt het voor de proefpersonen. Die groep geeft soms steeds dezelfde foute informatie over wat het antwoord moet zijn. In die situatie moet je dus kiezen: welk informatiekanaal geef je prioriteit. Vertrouw je op je ogen en verstand? Of vertrouw je op wat de groep zegt? Wie van de twee ga je volgen en gehoorzamen?

Als je het zo opschrijft, gaat het dus om 'volgen en gehoorzamen'. Geloof je in de almacht van objectieve feiten? Of geloof je in de almacht van de groep? Als jij gelooft dat 2+2=4, dan heb je objectief gezien vermoedelijk gelijk. Maar als de groep heilig gelooft dat het antwoord 5 is, kan je 'foute' geloof je soms misschien wel de kop kosten. Beide antwoord-strategieën zijn in de praktijk dus verdedigbaar.

Maar dat is in grote lijn precies wat het -- volledig op empirisch onderzoek gebaseerde -- soortenmodel stelt. In samenlevingen, zoals die ontstaan zijn na de uitvinding van de landbouw, heb je twee tegengestelde culturen. De leden van de bèta-cultuur zorgen voor de productie en omarmen objectieve feiten, omdat ze voor hun overleven daarvan volledig afhankelijk zijn. De leden van de alfa-cultuur oefenen de macht uit en omarmen subjectieve gevoelens en meningen, omdat ze voor hun overleven afhankelijk zijn van hun status in de groep. De factor die het verschil vormt tussen beide culturen is bevooroordeeldheid, de zooifactor.

Asch heeft met zijn experiment een situatie geschapen, waarin de proefpersoon moet kiezen tussen een objectief feit (dat hij ziet en waarneemt) en de mening van de groep die met dat objectieve feit in strijd is. Met andere woorden: je bent geneigd te denken dat Asch bevooroordeeldheid gemeten moet hebben. Dat lijkt bijna niet te kunnen missen, maar we zullen zien.

In het voorgaande heb ik geen nieuwe gegevens gepresenteerd. Ik ben alleen nagegaan wat een proefpersoon in het Asch-experiment precies moet doen. Wat is precies het probleem, waarmee hij geconfronteerd wordt? Op basis daarvan kom je tot de conclusie: Asch meet kennelijk het verschil tussen taakmensen en extreme groepsmensen. Met andere woorden: je zou denken dat het om bevooroordeeldheid moet gaan.

Wat betekent het als je hoog scoort op conformiteit? Het betekent, dat je automatisch en volledig het foute verhaal van de groep overneemt.

Het belangrijkste resultaat van Asch was, dat hij liet zien dat het volgen van de groep een persoonsvariabele is. De een heeft het niet, de ander wel, de meesten zitten daar tussenin. Nu hebben we ons echter gericht op de inhoud van die variabele. Wat betekent het als je hoog scoort op conformiteit? Hoe je het ook draait of keert, het betekent, dat je automatisch en volledig het foute verhaal van de groep overneemt. Zelfs als voor je ogen zichtbaar is, dat dat verhaal van geen kant klopt.

Dat is nogal een heftige bewering. Klopt die ook helemaal? Dat het foute verhaal van de groep voortdurend of bijna voortdurend volledig wordt overgenomen, natuurlijk wel. Maar is het ook iets dat 'automatisch' gebeurt? Om die vraag te beantwoorden is het noodzakelijk ons te verdiepen in het tweede deel van het Asch-artikel.

Taakmensen richten zich op de taak, groepsmensen op de groep

Het tweede deel van het Asch-artikel bespreekt de resultaten van de interviews die Asch en zijn medewerkers met een aantal van de proefpersonen na afloop van het experiment hadden. Het ging om vragen als: hadden ze het probleem door?, waarom gingen ze wel of niet met de groep mee? Het verslag begint op pagina 24 en eindigt op pagina 54. Het is dus een 31, soms dicht bedrukte, bladzijden lang.

Die 31 bladzijden zijn lastig interpreteerbaar. Ze geven wel een beeld, maar het beeld is moeilijk samen te vatten in concrete punten. Er is echter één uitzondering. De respondenten kregen (soms) twee vragen voorgelegd, waarvan de uitkomsten in tabelvorm staan vermeld. Eigenlijk gaat het om twee scatter-diagrammen waarvan de gegevens in tabelvorm zijn weergegeven ('Table 12' en 'Table 13', p. 35).

De twee vragen waar het om gaat, vroegen de respondent te schatten, hoe vaak men een fout antwoord had gegeven. En dezelfde vraag werd ook nog eens andersom geformuleerd: hoe vaak dacht men afgeweken te zijn van de groep?

De tabellen 12 en 13 in het Asch-artikel bevatten de uitkomsten op deze twee vragen. Op de horizontale as is het aantal werkelijk gemaakte fouten weergegeven (en/of het aantal keer dat men werkelijk afweek van de groep). Op de verticale as zijn de geschatte aantallen weergegeven. In de cellen van de tabel zelf staat het gevonden aantal respondenten.

De 18 mensen die 0 fouten hebben gemaakt, schatten gemiddeld dat ze 0.1 fout hebben gemaakt. Ze weten dus dat ze geen of vrijwel geen fouten hebben gemaakt.

De mensen met 11 en 12 fouten, focusten natuurlijk op de groep. De vergelijkbare vraag in hun geval is dus: hoe vaak zijn ze afgeweken van de groep? In dit geval beschikken we slechts over het antwoord van één persoon met 11 fouten. Deze persoon schat dat hij met zijn antwoorden eenmaal is afgeweken van de groep. Zijn schatting klopt dus perfect.

Eén persoon is natuurlijk wat erg weinig. Uit het verloop van het scatterdiagram ('Table 13') blijkt dat iemand met 12 fouten alleen 0 of 1 kan schatten. Volgens de gegevens in het scatterdiagram hebben mensen met 11 en 12 fouten een vrijwel perfect idee van het aantal keer dat ze met hun antwoord afweken van de groep.

Samenvattend, we vinden voor beide extreme soorten mensen, dat men weet, hoe vaak men met zijn antwoord afweek van de norm die men hanteerde. De mensen met 0 fouten weten dat ze ongeveer 0 fouten hebben gemaakt. De mensen met 11 en 12 fouten weten dat ze nooit of vrijwel nooit zijn afgeweken van de groep.

Het ene soort mens wil de taak zo goed mogelijk doen, het andere soort mens wil de interactie met de groep zo goed mogelijk doen.

Dit bevestigt, wat we al veronderstelden. Het ene soort mens richt zich vooral op de objectieve taak, het andere soort mens richt zich vooral op het volgen van de groep. Het ene soort mens wil de taak objectief gezien zo goed mogelijk doen, het andere soort mens wil zijn interactie met de groep zo goed mogelijk doen. Met andere woorden: men wil voor alles aansluiting bij de groep en daar zo hoog mogelijk in komen.

Het tweede deel van het Asch-artikel bevestigt met deze kwantitatieve data het idee van 'taakmensen' en 'extreme groepsmensen'.

Dubbel werkende waarneming (DWW) en dubbel gestoorde waarneming (DGW)

Nu komt er een punt waarop beide extreme soorten mensen verschillen. Wat weet men precies over dat waar men niet op gefocust heeft? Wat weten de taakmensen over de mate waarin ze de groep hebben gevolgd? Wat weten de extreme groepsmensen over de mate waarin ze de taak hebben uitgevoerd?

Asch vroeg de mensen met 0 fouten dus ook hoe vaak ze het oneens waren geweest met de groep? Op dit punt blijken de 14 respondenten die deze vraag hebben beantwoord, nogal van mening te verschillen. Hun schattingen lopen uiteen van 4 tot 17. Gemiddeld komen ze uit op 10.7. In werkelijkheid waren ze het 12 keer oneens met de groep. Gemiddeld onderschatten ze dus de mate waarin ze met hun antwoorden van de groep zijn afgeweken een klein beetje. In doorsnee zitten ze echter vlakbij.

Laten we nu kijken naar de mensen die steeds of bijna steeds met de groep meegingen (11 of 12 fouten). Deze mensen hebben bijna volledig en voortdurend gefocust op de groep. Wat weten zij over het aantal fouten dat ze hebben gemaakt?

Er zijn 3 respondenten die deze vraag beantwoord hebben. Ze hadden in werkelijkheid: 11, 12 en 12 fouten. Ze schatten het aantal fouten dat ze hebben gemaakt als respectievelijk: 2, 1 en 0. Deze mensen hebben dus geen enkel idee van aantal fouten, dat ze werkelijk gemaakt hebben. Kennelijk hebben ze inderdaad voortdurend en volledig gefocust op de groep en de informatie die steeds zichtbaar voor hun ogen op het bord stond, niet verwerkt.

Een aantal van drie respondenten is natuurlijk niet veel. Ook in dit geval bevestigt de informatie in het scatterdiagram ('Table 13') dat mensen met 11 en 12 fouten zullen schatten 0 of 1 keer fout geantwoord te hebben. Ze hebben dus geen idee hebben van het aantal fouten dat ze werkelijk gemaakt hebben. De informatie die steeds voor hun ogen zichtbaar op het bord stond gedurende de beantwoording van het item, is kennelijk volledig niet verwerkt.

Wat betekent dit? De taakmensen weten in doorsnee hoe vaak ze zijn afgeweken van de groep. De extreme groepsmensen hebben echter geen enkel idee over wat ze precies gezien hebben. De taakmensen hebben automatisch geregistreerd dat ze met hun antwoord afweken van de groep. De groepsmensen hebben niet geregistreerd dat hun antwoorden objectief gezien fout waren.

De taakmensen weten in doorsnee hoe vaak ze zijn afgeweken van de groep. De extreme groepsmensen hebben geen enkel idee over wat ze precies gezien hebben.

De kennelijke verklaring is dat het verwerken van de foute antwoorden via het automatische systeem gaat (systeem 1, het emotionele systeem van 'snel denken'), terwijl het zien van de juiste lengte verloopt via het niet-automatische systeem 2 van bewust denken. Ook wel aangeduid als 'traag denken'.

Dit tweede deel van het Asch-onderzoek, het verslag van de interviews na afloop, maakt hiermee duidelijk dat taakmensen systeem 2 hanteren, maar dat tegelijkertijd systeem 1 bij hen ook nog werkt. Ze horen automatisch dat het groepsantwoord niet klopt met het antwoord dat zij geven.

De extreme groepsmensen hanteren daarentegen, zoals je zou verwachten, systeem 1 voor hun interactie met de groep, maar laten hun systeem 2 uitgeschakeld. Ze gebruiken het systeem van het bewuste denken niet. Ze zien niet, wat er wel is.

Vanuit de optiek van een extreem groepsmens niet zo vreemd. Bewuste waarneming leidt tot kennis. Maar die kennis kan gemakkelijk interfereren met het volgen van de groep. Wie in een groep wil passen, moet vooral niet afwijken door iets te verkondigen, dat voor het idee van de groepsgenoten vreemd of onbekend is. Verder kost bewuste waarneming kostbare denktijd, waardoor men niet meer onmiddellijk kan reageren op wat er in de groep gebeurt. Het uitschakelen van de bewuste waarneming (het 'trage denken') heeft dus voordelen wanneer men voortdurend in een machtige groep leeft.

Doordat extreme groepsmensen meegaan met de foute groepsantwoorden, zien ze dingen die er niet zijn. Dat betekent: wat ze zeggen, klopt niet met de werkelijkheid. Tegelijkertijd zien ze de werkelijkheid, die voor hun ogen staat, niet. Dat wil zeggen: ze zien die werkelijkheid misschien nog wel, maar ze verwerken die informatie niet. De informatie dringt niet meer door tot hun bewustzijn. Ze lijden aan dubbel gestoorde waarneming (DGW). Ze 'zien' dingen die er niet zijn en de dingen die er wel zijn, zien ze niet.

Nemen deze extreme groepsmensen dan helemaal niet waar? We hebben het over het waarnemen van de objectieve werkelijkheid. Hun systeem 1 om de sociale werkelijkheid waar te nemen en te manipuleren, draait op volle toeren. Hun systeem 2 om de objectieve werkelijkheid te voorspellen werkt echter niet of slechts matig, doordat het standaard uit staat. Het gevolg is dat ze dit lange termijn denken ook niet beschikbaar hebben om de sociale werkelijkheid te voorspellen.

Taakmensen daarentegen beschrijven eerst correct wat ze zien met hun ogen. Tegelijkertijd blijken ze ook nog op een lager niveau het antwoord van de groepsleden te registreren. Hun waarneming is niet gestoord, maar werkt dubbel. Aan de ene kant gebruiken ze hun ogen en verwerken de informatie daarvan bewust. Aan de andere werkt op de achtergrond hun emotionele systeem automatisch door. Ze hebben dubbel werkende waarneming (DWW). Ze nemen waar op twee niveaus. Ze zien wat er is en horen ondertussen ook nog, wat er door de groep beweerd wordt.

Eerder wierp ik de vraag op of het overnemen van het foute verhaal van de groep automatisch gaat. Extreme groepsmensen hanteren niet het systeem van 'traag denken', zagen we. Hun interactie met de groep verloopt via het systeem voor 'snel denken' (babbelen). Maar dat is een automatisch werkend systeem gebaseerd op emoties. Het overnemen van het foute verhaal van de groep is dus een automatisch proces. Extreme groepsmensen kunnen normaal niet anders, omdat hun systeem voor traag denken uitgeschakeld staat.

Het omarmen van foute informatie gaat bij extreme groepsmensen automatisch. Tegelijkertijd ziet men niet meer, wat er wel is. Men heeft DGW. Men is volledig los van de objectieve werkelijkheid. Of zoals vroeger werd gezegd: men is los van God.

De driedeling van Asch bevestigt het soortenmodel: conformiteit is bevooroordeeldheid

In het verslag van Asch vormen 'Table 12' en 'Table 13' belangrijke bronnen doordat ze kwantitatieve informatie geven over de interviews na afloop. Vervolgens vermeldt Asch echter voor ons nog meer interessante informatie.

Hij vraagt de respondenten waarom ze wel of niet meegingen met de groep. De mensen die meegingen met de groep ('yielding') geven daarvoor nogal uiteenlopende antwoorden. Op basis van die antwoorden verdeelt Asch ze in drie verschillende categorieën.

Allereerst is er een categorie, die zichzelf ervan probeert te overtuigen, dat men het kennelijk verkeerd ziet. Men denkt te zien dat het antwoord A moet zijn. De groep zegt B. Men lost het probleem op door zichzelf te vertellen, dat men het kennelijk verkeerd zag, de groep kan zich nu eenmaal niet vergissen.

Asch noemt dit: yielding at the level of judgment. Men kent aan het groepsoordeel prioriteit toe, boven wat men zelf ziet. Men wijzigt zijn oordeel onder invloed van de groep, die zich volgens het idee van deze respondenten onmogelijk kan vergissen. Men ziet de groep als absolute autoriteit.

Ten tweede zijn er mensen die zien, dat het antwoord van de groep fout is, maar tot iedere prijs niet uit de groep willen vallen. Daarom gaan ze met hun antwoord bewust met de groep mee. Asch noemt dit: yielding at the level of action. De respondenten zien dat A moet zijn, maar zeggen bewust B om niet uit de groep te vallen.

De meest extreme categorie die met de groep meeging, zag het probleem echter helemaal niet. Had men iets fout gedaan? Dat kon niet, want men had steeds zo goed mogelijk geantwoord. Men zag kortom het probleem niet. Afgaande op het verslag van Asch was dit de kleinste van de drie categorieën. Je zou deze categorie yielding without awareness kunnen noemen.

Asch schrijft over deze mensen (p. 42):

'Among the rarest, but not the less significant, of the reactions were those in which yielding occurred apparently without awareness [cursivering MvE]. Previously we have described the case of one such subject who yielded on all trials but one, but who asserted with every appearance of genuineness that he never reported an answer he believed to be wrong [. . .]. The most noteworthy feature was the placidity of the subject; it appeared that his lack of awareness enabled him to maintain an attitude of complacency and frankness, only mildly troubled by the suspicion that something unknown to him had occurred.
The writer has not himself observed other cases as extreme as this, although a few were reported by his associates. In these instances there appeared to be a genuine lack of awareness of the degree of yielding, evidenced by an insistent rejection of its possibility.'

Deze indeling in drie categorieën van Asch levert belangrijke informatie voor de vraag: welke variabele mat Asch precies? Volgens het soortenmodel bestaan de leden van de alfa-cultuur (de machtige groep) namelijk uit drie verschillende soorten mensen. Allereerst heb je de gewone (niet sociaal-dominante) volgelingen/gelovigen. Dit is de machtsbasis van de strongman. Zijn voetvolk. Daarna krijg je de 'men of action' (wel sociaal dominant, maar niet volgeling/gelovige). Dit zijn de officieren en generaals van de strongman. Zij zorgen dat er daadwerkelijk zaken gerealiseerd worden. De middenstand van de alfa-cultuur. Tenslotte krijg je de strongman met zijn elite. De echte alfa's, de predikers, de 'men of words' ('double-highs', dus: sociaal dominant en volgeling/gelovige).

De driedeling van Asch stemt overeen met de driedeling van het soortenmodel. Dat is alleen mogelijk als het om dezelfde variabele gaat.

Zonder dat Asch iets afweet van het soortenmodel, komt hij hier met drie soorten groepsmensen. De mensen die de groep als autoriteit zien, de mensen die heel goed zien dat het antwoord van de groep onzin is, maar ondanks dat, toch meegaan met de groep, omdat ze nu eenmaal beslist niet uit de groep willen vallen. Tenslotte de mensen die zo automatisch met de groep meegaan, dat ze het zelf niet meer doorhebben en zich de fysische werkelijkheid ook niet langer bewust zijn of deze relevant vinden. Met andere woorden: Asch beschrijft respectievelijk: gewone volgelingen/gelovigen, 'men of action' en 'men of words'.

Deze driedeling van Asch levert daarmee specifieke informatie dat conformiteit en bevooroordeeldheid hetzelfde zijn. Het is vrijwel ondenkbaar dat Asch toevallig tot precies dezelfde indeling zou kunnen als de indeling die het soortenmodel levert. Het gaat kennelijk om dezelfde variabele.

Conclusie

Hoe valt het voorgaande samen te vatten?

Laten we beginnen met de hoofdvraag. Zijn conformiteit en bevooroordeeldheid hetzelfde? Gegeven het feit dat Asch de indeling vindt, die het soortenmodel oplevert, lijkt er op dit punt geen verdere twijfel mogelijk. (Het soortenmodel verklaart waarom drie van de vier soorten mensen bevooroordeeld zijn en één soort niet.) Het Asch-experiment is een andere manier -- naast de vele manieren die al bekend zijn -- om bevooroordeeldheid te meten.

Natuurlijk is het mogelijk dat een maat gebaseerd op 'kritische' items enigszins andere uitkomsten levert dan een maat gebaseerd op een reeks vooroordelen. Iedere meetmethode zal in de praktijk enige unieke variantie toevoegen. Maar dat het in wezen om dezelfde variabele gaat, lijkt buiten kijf.

Wat betekent dat? Dat betekent dat Asch laat zien, hoe vooroordelen ontstaan en worden overgenomen. Het foute onzin-antwoord krijgt zijn emotionele lading doordat alle leden van de groep het zeggen. Om die reden moet het wel 'waar' zijn. Om die reden is het een heilig dogma. Het Asch-experiment leert ons hoe bevooroordeeldheid werkt.

Een andere definitie voor bevooroordeeldheid die het voorgaande levert is: taakmens versus extreem groepsmens. Doe je je objectieve taak zo goed mogelijk of volg je voortdurend volledig en automatisch het oordeel van de groep?

Dan is er een tweede resultaat. Taakmensen hebben dubbel werkende waarneming (DWW). Extreme groepsmensen hebben dubbel gestoorde waarneming (DGW). Taakmensen nemen bewust waar, wat er is en nemen tegelijkertijd nog waar, wat hun emotionele systeem voelt. Extreme groepsmensen verkondigen eerst een fout verhaal van de groep en zien tegelijkertijd niet, wat er wel is. Ze zijn volledig losgeraakt van de objectieve werkelijkheid. Ze leven volledig in de sociale werkelijkheid van de groep.

Het derde resultaat is misschien het meest verontrustend. Het omarmen van foute informatie (vooroordelen) door extreme groepsmensen gaat automatisch en onbewust. Een grasmaaier maait gras. Een extreem groepsmens omarmt foute informatie, zodra die door de groep wordt aangeboden. Er vindt geen enkele vorm van toetsing plaats. Het feit dat de groep het vindt, is voldoende. Extreme groepsmensen (alfa's, double-highs) leven als het ware op, van, met en via vooroordelen. Het is hun manier van bestaan.

maandag 3 augustus 2020

De onbekende ontdekking van Asch: mensen zien dingen die er niet zijn, maar de een veel vaker dan de ander

Laatst bijgewerkt: 7-8-2020 om 1.00

Mijn vorige blogpost gaf drie voorbeelden van dingen zien, die er niet zijn. Het eerste voorbeeld was het boek van Rutger Bregman: De meeste mensen deugen. Het idee dat de meeste mensen deugen vinden we mooi en geloven we graag. Zijn boek vliegt over de toonbank. De werkelijkheid is helaas een stuk minder opwekkend.

Het tweede voorbeeld was bedacht. Je begeleider wil een bepaald antwoord horen. Je weet of zou kunnen weten, dat het antwoord niet helemaal klopt met de werkelijkheid. Maar je wilt graag een positieve beoordeling, dus doe je niet al te moeilijk.

Het derde voorbeeld was uit het volle leven. Een medisch team weet het onmiddellijk helemaal zeker. Dat moet het zijn. Een aantal maanden later blijkt het toch echt iets totaal anders te zijn. De medische literatuur over diagnosticeren en de problemen daarmee, staan vol met dit soort voorbeelden.

Hoe kan het dat een heel medisch team maanden door holt in een richting, waarvan je onmiddellijk had kunnen weten dat het de verkeerde was?

De conformiteits-experimenten van Solomon Asch

Het mechanisme voor wat er misgaat, is blootgelegd door Solomon Asch in 1956 (hier). De titel van zijn verslag is: A Minority of One Against a Unanimous Majority. Een onderzoek dat in deze blog al vele malen eerder is aangehaald, maar nog nooit diepgaand is besproken. De reden daarvoor volgt hierna.

Asch heeft zijn onderzoek grondig aangepakt en uitgebreid beschreven. Het verslag telt 70 bladzijden waarvan vele met een extra klein lettertje, zodat er meer tekst op kon. Voordat je een beetje weet wat erin staat, ben je een behoorlijke tijd verder.

Daar komt nog iets bij. Asch moet zijn boodschap verkopen en die boodschap was en is soms best heftig. Hij probeerde dus zijn boodschap zo te brengen, dat de scherpe kantjes wat vermeden werden. Hij probeert het positieve te benadrukken, zodra hij nogal verontrustende uitkomsten vindt. Als lezer moet je dus voortdurend je best doen, te achterhalen wat hij werkelijk heeft gevonden.

Het resultaat is dat iedereen wel een klein beetje weet of denkt te weten, wat Asch heeft gevonden, maar dat vrijwel niemand zijn verslag echt heeft doorgeworsteld. Iets dat gezien de lengte en schrijfstijl ook niet snel valt te doen.

De grote vraag is dus: wat heeft Asch precies gevonden? Wie verder leest, zal zien, dat dat belangrijk anders is dan wat men doorgaans denkt en schrijft. Althans als ik afga op de stukken waar Google naar verwijst bij 'Asch experiment'.

Vaak zien we dingen die er niet zijn

Het eerste resultaat van Asch. Wanneer proefpersonen een eenvoudige beoordelingstaak krijgen, nadat ze eerst het eensluidende, foute antwoord van een aantal andere mensen hebben gehoord, gaat het mis. Niet altijd en niet bij iedereen in dezelfde mate, maar gemiddeld genomen toch wel erg vaak.

De taak die Asch hanteerde, is simpel. Je moet een lijntje links vergelijken met drie lijntjes rechts (voor een plaatje zie hier: het onderschrift klopt niet helemaal, Asch gebruikte de cijfers: 1, 2 en 3.). Eén van de lijntjes rechts heeft dezelfde lengte als het lijntje links. De proefpersoon moet het nummer van het juiste lijntje zeggen zodra hij aan de beurt is. Hem is verteld dat het om een waarnemingsexperiment gaat en dat het er slechts om gaat, wat hij ziet. Een verhaal dat dus in zekere zin ook nog klopt. De proefleider noteert de antwoorden die gegeven worden.

De afstand tussen de doellijn links en de antwoorden rechts is altijd 40 inch (ongeveer een meter). In het klaslokaal zitten de 8 studenten in 2 rijen van 4. De antwoorden worden gegeven in de volgorde waarin men zit. De student die -- zonder dat hij dat weet -- getest wordt, zit 'toevallig' altijd op de een na laatste (zevende) plaats.

Als mensen niet beïnvloed worden door andere mensen, doen ze de taak bijna altijd goed. Slechts in minder dan één procent (0,7) van de gevallen ging het mis. Op de honderd keer gaat het 99 keer goed.

Als mensen echter eerst horen wat de andere mensen in de 'groep' antwoorden, verandert het verhaal. Zelfs als ze die mensen niet kennen, nooit eerder gezien hebben en het niet om 'experts' gaat. De enige voorwaarde is dat de mensen in de 'groep' allemaal hetzelfde foute antwoord geven. De taak van Asch blijkt nu opeens een zeer moeilijke taak te zijn.

In totaal kregen de 123 proefpersonen die Asch gebruikte, ieder 12 'kritische' items voorgelegd (beoordelingen waarbij de overige leden van de groep hetzelfde foute antwoord gaven). Dat geeft in totaal 1476 kritische oordelen. Hiervan gingen er 542 fout. Van iedere tien kritische oordelen gingen er bijna vier (36,7%) fout.

Het antwoord dat men zes keer hoort, voordat men zelf antwoord moet geven, leidt ertoe dat men meer dan 50 keer zoveel fouten maakt als anders. Een simpele taak die een mens normaal bijna nooit fout doet, gaat nu opeens bijna de helft van de keren (4 van de 10 keer) fout. De antwoorden van de 'groep' hebben een dramatische uitwerking op wat de proefpersonen zeggen te zien.

In normaal psychologisch onderzoek wordt het effect van een behandeling (het verschil in gemiddelde met de controlegroep) uitgedrukt in standaarddeviaties van de controlegroep. Als je dat bij het onderzoek van Asch ook doet, wat vind je dan?

De controlegroep had gemiddeld 0.08 foute antwoorden, de experimentele groep had gemiddeld 4.41 foute antwoorden. Een verschil van 4.33. De standaarddeviatie van de controlegroep is 0.36. Dat levert een effect op van 12.0 standaarddeviaties. In de psychologie geldt een verschil van 0.5 standaarddeviatie als groot. Het effect dat we vinden voor het onderzoek van Asch is 24 keer zo groot. Het horen van de foute antwoorden levert dus een onvoorstelbaar groot effect op.

Met andere woorden: hoe wij over de wereld denken, laten we vaak niet bepalen door die wereld, maar door het verhaal van andere mensen. Wat wij zeggen te zien, ontlenen we niet aan onze ogen, maar aan de mensen om ons heen, die vertellen hoe het volgens hen zit.

Als de taak moeilijker wordt, zien we nog vaker dingen die er niet zijn

Als bij een simpele taak het effect al zo sterk is, dat we in bijna de helft van de gevallen dingen zien die er niet zijn, wat gebeurt er dan als de taak moeilijker is? Bij een taak die echt goed kijken en diep nadenken vereist?

Ook met betrekking tot deze vraag levert het onderzoek van Asch informatie. In totaal gebruikte hij 12 'kritische' items. In werkelijkheid waren dit drie verschillende items, die ieder vier keer werden gebruikt in de totale 'test'. Hoewel deze drie items ogenschijnlijk vrij gelijk zijn, bleek de moeilijkheid toch duidelijk te verschillen. Het gemakkelijkste item leverde 28 procent fouten. Het 'middelste' item leverde 35 procent fouten. Het moeilijkste item leverde 48 procent fouten.

Statistisch gezien zegt dat strikt genomen nog niet alles. Het kan immers zijn dat de verschillen per item voor de vier keer dat een item werd gebruikt, groot zijn. Om die mogelijkheid uit te sluiten heb ik de correlatie berekend tussen het gemiddelde van ieder item en het percentage fouten per afname. Dit levert een correlatie op van 0.82 voor de 12 afnames. De item-moeilijkheid verklaart maar liefst 67 procent van de totale variantie in deze uitkomsten. De moeilijkheid van de items bepaalt voor twee derde hoe vaak een item bij een afname fout wordt gemaakt.

Voor de mensen die liever een klassieke significantietest willen, volgt die hier. Een 1-weg variantieanalyse (3 items met ieder 4 afnames) levert een p-waarde van 0.007 op (bij een F van 8,9). Ook op die manier berekend, gaat het dus om een (zeer) significant verschil tussen de drie items. Het moeilijke item wordt belangrijk minder goed gemaakt dan het makkelijkste.

Het moeilijkste item leverde bijna twee (1.7) keer zoveel fouten als het makkelijkste. Kennelijk is het dus zo dat als een taak iets lastiger wordt, de kans op een fout antwoord snel groter wordt. Bij complexe taken treedt het probleem -- we zien iets, dat er niet is -- nog veel vaker op dan bij eenvoudige taken.

De reactie op de 'groep' blijft hetzelfde

Asch verwachtte verder dat naarmate de situatie langer duurt, mensen vaker zullen bezwijken voor de druk van de groep. In dit geval was er natuurlijk niet sprake van een echte groep en werd er door de mensen die aanwezig waren verder ook op geen enkele manier druk uitgeoefend. Het enige wat men deed was bij sommige items allemaal hetzelfde onjuiste antwoord geven. Maar naarmate de situatie langer duurt, zou je het afwijken van de groep als het ware steeds meer beu kunnen worden en daarom zou je tenslotte steeds vaker met de groep mee kunnen gaan.

Uit de gegevens van Asch blijkt niets van een dergelijk effect. De eerste helft van de 12 kritische items was volledig gelijk aan de tweede helft. Zijn 123 proefpersonen scoorden op beide helften echter niet duidelijk verschillend (t-toets, gepaarde waarnemingen). De eerste testhelft leverde 35,23 procent foute antwoorden. De tweede helft 38,21 procent. Onder invloed van de situatie veranderen mensen kennelijk niet in hun manier van reageren op dit soort problemen.

Het onbekende resultaat van Asch: conformiteit varieert per persoon en is goed meetbaar

De volgende vraag is natuurlijk: treden de fouten bij iedereen in dezelfde mate op of gaat het vooral om bepaalde mensen? Asch vond dat ongeveer een kwart (24%) van de mensen zich door de antwoorden van de groep nooit van de wijs liet brengen. Een ander kwart volgde -- volgens hem -- voortdurend of bijna voortdurend de groep. De overige mensen zaten tussen beide uitersten in.

In totaal is dus ongeveer drie vierde van de bevolking vatbaar voor het probleem, uitgaande van de simpele taak die Asch gebruikte. Bij een complexe taak zal die drie vierde dus vermoedelijk snel oplopen naar 90% en mogelijk meer.

Is het meegaan met de groep een kwestie van toeval of gaat het vooral om bepaalde mensen? Asch kon laten zien dat toeval amper een rol speelt, het gaat steeds om dezelfde mensen. Sommige mensen zitten zo in elkaar dat ze zich voortdurend automatisch conformeren aan het groepsstandpunt. Anderen zitten zo in elkaar dat ze voortdurend gewoon hun taak blijven doen en zich van het groepsstandpunt niets aantrekken. Weer anderen zitten tussen beide uitersten in.

Daarbij ligt de verhouding tussen wel en niet meegaan met de groep voor iedere persoon vast. Iedereen heeft dus een bepaald getal tussen 0 en 100 procent dat aangeeft, hoe vaak men de groep zal volgen.

De 12 kritische items die Asch gebruikte, kan men opvatten als een test. Wat is de betrouwbaarheid van die test? Uit de gegevens die Asch vermeldt in zijn verslag, kon ik de betrouwbaarheid berekenen. Zijn 'test' blijkt een betrouwbaarheid (coëfficiënt alfa) van 0.89 te hebben.

Hij vermeldt ook een tabel ('Table 10' op p. 20) op basis waarvan de correlatie tussen de eerste helft en de tweede helft van de 12 kritische items berekend kan worden. Dit levert 0.82 op. Na correctie via de formule voor testverlenging levert dit voor de totale test 0.90 op. Dus een vrijwel gelijke waarde als de eerder berekende (alfa)betrouwbaarheid.

Tot nu toe is niet algemeen bekend dat Asch een persoonsvariabele mat. Asch heeft dit resultaat in zijn artikel wel nadrukkelijk vermeld, maar om een of andere reden sloeg dit kennelijk niet echt aan bij zijn publiek. Een merkwaardig verschijnsel waar ik in een volgende blogpost verder op in hoop te gaan.

Asch vermeldt niet een duidelijke waarde voor de betrouwbaarheid van zijn kritische items. Hij vermeldt wel een waarde, kennelijk voor iets als de correlatie tussen beide testhelften, maar hanteert hierbij een nogal onbekende index (een 'Sheppard U', p. 20). Via Google kon ik daar geen verdere informatie over vinden.

Bronnen op internet die het onderzoek van Asch samenvatten, vermelden vaak niet dat hij een persoonsvariabele vond, laat staan dat men iets over de betrouwbaarheid daarvan vermeldt.

Wat betekent die hoge betrouwbaarheid? Betrouwbaarheid kun je op drie verschillende manieren interpreteren. De empirische definitie van (alfa-)betrouwbaarheid is de correlatie tussen de oude en de nieuwe scores, wanneer je een andere even lange test met soortgelijke items afneemt bij dezelfde personen. Bij het herhalen van de test met andere items zou je dus opnieuw vrijwel dezelfde uitkomsten vinden.

De tweede manier om betrouwbaarheid te interpreteren is uitgaan van de theoretische definitie. Een betrouwbaarheid van 0.89 betekent dat 89% van de variantie in de testscore veroorzaakt wordt door de eigenschap die de test meet en dat slechts 11% toeval (ruis) is. Het wel of niet meegaan met de groep wordt dus vrijwel volledig bepaald door de persoonseigenschap die gemeten wordt.

Er is echter nog een derde manier om naar die hoge betrouwbaarheid te kijken. Deze manier gaat terug op de berekeningsformule. De hoge betrouwbaarheid betekent dat de verschillen tussen de onderzochte mensen groot moeten zijn. Anders zou je immers vooral ruis meten en zou je betrouwbaarheid laag uitvallen.

Welke frequentieverdeling vindt Asch precies?

Klopt dat in dit geval? Wat vond Asch precies op dit punt? Zijn verhaal op dit punt is moeilijk te volgen en klopt niet helemaal (p. 11, onderaan). Hij schrijft:

'The distribution of errors departs from the normal curve often obtained in psychological measurement, being more akin to a J curve. But it differs in a fundamental respect from the J curves of conformity reported by F. H. Allport and his students. Unlike the latter, the mode occurs not at a point determined by convention or by the pressure of a group, but rather at the truth value, that is to say, at the opposite extreme from the majority position.'

Hij vindt helemaal geen J-curve (eerder een L-curve: een hoge toren met een lange staart). En is het inderdaad zo dat de meest voorkomende waarde de 'truth value' is? Dat hangt er ook vanaf, hoe breed je de kolommen van je frequentieverdeling maakt, lijkt me. Is het dan inderdaad zo dat er helemaal geen normale verdeling gevonden wordt?

De vraag is eigenlijk: hoe moet je zijn uitkomsten handzaam weergeven? Ik ben zo vrij geweest zijn uitkomsten opnieuw samen te vatten.

Ik hanteer vier categorieën (1, 2, 3 en 4) voor de frekwentieverdeling. In de eerste categorie zitten alle mensen die de 12 items foutloos maakten. In de tweede categorie zitten alle mensen met 1-4 fouten. In de derde met 5-8 fouten. In de vierde met 9-12 fouten.

Om goed te begrijpen wat het effect is van de foute antwoorden die de andere 'groepsleden' geven, moeten we eerst naar de uitkomsten van de controlegroep kijken (waarin die foute antwoorden dus niet gegeven werden). In de eerste categorie zit 95%. In de tweede zit 5%. De overige twee categorieën zijn leeg. Vrijwel iedereen zit bij de controlegroep dus in de eerste categorie: men maakte 0 fouten. In de tweede categorie zit bijna niemand.

Laten we nu naar de resultaten van de experimentele groep kijken. In de eerste categorie zit 24%. Dit zijn de mensen die geen enkel item fout hadden. In de tweede categorie zit 33%. Deze mensen hadden maximaal vier fouten. In de derde categorie zit 25% met maximaal 8 fouten. In de vierde categorie zit de resterende 18%.

De meeste mensen zitten dus in de tweede categorie. De eerste en de derde categorie bevatten beide ongeveer een kwart van de mensen. De laatste categorie bevat iets minder dan een vijfde.

Asch vindt voor de verdeling van de experimentele groep een L-curve. Dat komt doordat de mensen die fouten maken uitgespreid zijn over 12 categorieën. Alle mensen die geen fouten hebben gemaakt, zitten samen gepropt in de 0-categorie, die daardoor het hoogste is.

Maar als je de uitkomsten verdeelt in vier categorieën die lopen van 0 fouten tot 8-12 fouten, dan zie je dat de tweede categorie de meeste mensen bevat. Verder zie je dat de verdeling niet echt normaal is (in de midden hoog en aan de kanten laag), maar meer lijkt op een rechte verdeling. Alle vier categorieën komen ongeveer even vaak voor.

Wat zouden we vinden, wanneer iedere proefpersoon via zuiver toeval zou besluiten om wel of niet met de groep mee te gaan? Mijn statistiekprogramma levert via een binomiaalverdeling (12 keer trekken met een kans van .367 op een fout) de uitkomsten voor 1000 gesimuleerde personen. De frequentieverdeling laat zien dat vrijwel iedereen dan in categorie 2 en 3 zou vallen. Categorie 1 en 4 zouden bijna volledig leeg zijn.

Het idee dat Asch in zijn artikel propageert, mensen zouden bij de kritische items in een derde van de gevallen met de groep meegaan, klopt dus niet helemaal. Je doet dan alsof iedereen op dit punt hetzelfde is. Maar als dat zo was, zouden we in categorie 1 en 4 niemand vinden.

Het horen van de zes foute antwoorden voordat men aan de beurt is, leidt er dus toe dat de respondenten volledig verspreid worden over de vier categorieën. De kritische items van Asch werken als een soort sorteermachine. Mensen worden systematisch verdeeld over alle vier categorieën. Daarbij weet de machine vrijwel feilloos in welke categorie iemand thuis hoort, want toeval speelt bij het sorteren, gezien de hoge betrouwbaarheid van de test, amper een rol.

Je zou het verhaal ook korter kunnen formuleren. Ik ga uit van het aantal fouten (0-12). De controlegroep van Asch heeft een standaarddeviatie van 0.36 fout. De spreiding in de uitkomsten is afgerond ongeveer nul. De experimentele groep, die te kampen had met foute antwoorden, had een standaarddeviatie van 3.84. Meer dan 10 keer zo groot. De spreiding in de experimentele groep is dus enorm.

Wat zou de spreiding zijn als alle mensen op dit punt gelijk zouden zijn? Wanneer iedereen op basis van zuiver toeval in 36,7% van de gevallen zou besluiten met de groep mee te gaan? De simulatie geeft voor de standaarddeviatie 1.69 fout. Door de systematische verschillen tussen mensen is de standaarddeviatie in werkelijkheid maar liefst 2,3 keer zo groot. Die grote verschillen tussen mensen op dit punt kunnen onmogelijk toeval zijn.

Conclusie

De ontdekking van Asch is dus niet dat mensen vaak met de groep meegaan, want dat was al bekend voor zijn artikel verscheen. Zijn grote ontdekking is dat het zich conformeren aan het antwoord van de 'groep', vrijwel volledig bepaald wordt door een persoonseigenschap.

Het vermogen om dingen te zien die er niet zijn, is een persoonskenmerk dat nauwkeurig en betrouwbaar gemeten kan worden. Verder is het een kenmerk waarop mensen -- merkwaardig genoeg -- extreem verschillen. Sommige mensen scoren maximaal (9-12 fouten), anderen scoren minimaal (0 fouten), ruim de helft zit tussen beide uitersten in.

Maar om welke eigenschap gaat het precies? Welke eigenschap bepaalt of je wel of niet meegaat met de groep? Welke eigenschap bepaalt of je dingen zegt te zien, die er niet zijn? Ik zou denken dat het om bevooroordeeldheid moet gaan, maar is dat inderdaad zo?