Diskussion,  Psychologie

Wie sinnvoll sind Intelligenztests im kulturellen Vergleich?

chickeniqtestDer Entwicklungspsychologe Heiner Rindermann von der TU Chemnitz hat 2007 eine länderübergreifende Vergleichsstudie im European Journal of Personality veröffentlich. Schaut man in die Ranking-Tabelle, die er aus den Intelligenz-Mittelwertskurven abgeleitet hat, dann findet man zum Beispiel einen Wert, der sich „All Cognitive Ability Sum“ nennt, also Durchschnitt der kognitiven Fähigkeiten. Weil es länderübergreifend kein ausreichend verfügbares Datenmaterial in Form von Intelligenztests gibt, bedient sich Rindermann hier eines Kunstgriff: Die weltweit durchgeführten PISA- und TIMMS-Studien würden nur zu einem geringen Teil spezifisches Wissen in den Domänen Lesen, Mathematik und Naturwissenschaften erfassen, sondern im Wesentlichen allgemeine Intelligenz messen. Diese „Schulleistungsstudien in unterschiedlichen Altersstufen“ würden damit „empirisch weitgehend das Gleiche und das Gleiche wie Intelligenztests erfassen[1].

Die von Rindermann aus den Rohdaten errechneten IQ-Werte differieren höchst signifikant. Hong Kong führt mit einem Schnitt von 108, während der „Greenwich-IQ“ in Groß-Britannien wie übrigens auch in Deutschland bei 102 liegt. Aber Entwicklungsländer wie Burundi, Bhutan, Elfenbeinküste, Gambia, Gabun liegen z.T. mehr als 30 Punkte darunter – und für Haiti gibt es sogar nur einen mittleren IQ von 59! Auch in der großen Studie von Richard Lynn und Tatu Vanhanen erreichten die Einwohner Haitis im Durchschnitt nur einen IQ von 72[2].

Manchmal wäre es gut, sich in aller Bescheidenheit der operationalistischen Definition Edwin G. Borings zu erinnern: „Intelligence is what is measured by intelligence tests.[3] Rindermann vermutet hier dagegen gleich genetische Unterschiede[4] und verweist wie auch Lynn und Vanhanen auf die positive Korrelation der Höhe des Bruttosozialprodukts mit dem IQ. Dazu fällt mir einer der vielleicht letzten Universalgelehrten, der Paläontologe Stephen Jay Gould ein. Der hatte schon 1981 in seiner Grundsatzkritik an faktorenanalytisch ermittelten Intelligenzmodellen genüsslich darauf verwiesen, dass auch das Alter mit dem Benzinpreis positiv korreliert, ohne dass jemand auf die verwegene Idee käme, das eine sei die Ursache des anderen[5].chickentraincat7[1]

Man könnte es bei Rindermann dabei bewenden lassen, den Stichwortgeber Sarrazins als unbelehrbaren Wichtigtuer abzutun, der nicht einmal merkt, dass er Äpfel mit Birnen vergleicht und zu unzulässigen Vereinfachungen greift.[6] Doch vielleicht sollte man seine methodisch fragwürdigen[7] vergleichenden Studien einmal gegen den Strich gebürstet lesen. Denn eigentlich liegt doch die Annahme nahe, dass herkömmliche Intelligenztests eine Sozialisation in westlichen Kulturen voraussetzen. Nicht von ungefähr werden solche Tests in der Regel an Schulnoten validiert. Je stärker ein Intelligenztest mit den Schulnoten korreliert, als desto aussagefähiger gilt er.

Das ist historisch bedingt. Anfang des vorigen Jahrhunderts wurde Alfred Binet in Frankreich beauftragt, ein praktisches soziales Problem zu lösen. Mit wachsender Bedeutung der öffentlichen Erziehung wurden zugleich die Unzulänglichkeiten des französischen Schulsystems offenbar. Nicht nur, dass einige Kinder langsamer als andere lernten, manche, die eigentlich völlig normal waren, schienen überhaupt nicht vom Unterricht zu profitieren. An eine grundlegende Reform des Unterrichts dachte damals freilich niemand. Wie auch heute noch oft suchte man die Hauptursache bei den Schülern. Binet und seine Mitarbeiter sollten ein Verfahren entwickeln, um möglichst frühzeitig langsam lernende Schüler zu identifizieren. So hätte man diesen bereits im Frühstadium eine besondere Förderung zukommen lassen können und zugleich die Möglichkeit eröffnet, die übrigen effizienter zu beschulen.

Die Forscher beobachteten den Unterricht, studierten die Schulbücher, sprachen mit den Lehrern und versuchten so herauszufinden, welche verschiedenen Kenntnisse und Fähigkeiten für den Schulerfolg ausschlaggebend waren. Dazu gehörten etwa das Verständnis für graphische Symbole wie Buchstaben oder Zahlen, also musste die Symbolerkennungsrate getestet werden. Doch die Kenntnis von Symbolen reichte für Schulkinder nicht aus, auch deren Anwendung bei der Manipulation, Speicherung und Wiedergabe großer Mengen von Informationen gehörte dazu, erst recht das Umsortieren von Informationen nach bestimmten Erfordernissen des Augenblicks. So sollte jedes einzelne Kind in der Lage sein, Informationen zu verwenden, um Probleme zu lösen, die nicht seinem alltäglichen Erfahrungshorizont entsprangen.

Nach diesen Überlegungen wurden Testaufgaben konstruiert, um kindliche Gedächtnisleistungen zu prüfen, die Fähigkeit, Bewegungsabläufe durchzuführen, Wortbedeutungen zu finden, plausible Ereignisabläufe aus einer zufälligen Reihenfolge von Bildsequenzen zu konstruieren, fehlende Bausteine in graphischen Entwürfen zu erkennen und zu vielen anderen Tätigkeitsfeldern schulischen Lernens. Nicht nur das Gelingen von Informationsverarbeitung sollte geprüft werden, sondern auch die Bedingungen für Konzentrationsfähigkeit, Aufmerksamkeitskontrolle und gelungene Unterrichtsdisziplin. Da sich schnell herausstellte, dass man dabei das Alter der Schüler nicht außer Acht lassen konnte, konstruierte Binet zusammen mit Theodore Simon spezielle Aufgaben für jede Klassenstufe.

Der Binet-Simon-Test von 1905 war eine epochale Leistung, und der Grundgedanke solcher Testverfahren ist seit den Zeiten von Binet und Simon der gleiche geblieben: Analysiere die Formen kulturell erwünschter Tätigkeiten und Kenntnisse, die zum Schulerfolg notwendig sind, und vergleiche die Leistungen von Kindern, um herauszufinden, wie viel davon sie erreicht haben. Mehr wollte Binet nicht, zu dessen Ehrenrettung man sagen muss, dass er vor einer Ausdehnung seines speziellen Testverfahrens für Schulkinder auf allgemeine Zwecke stets gewarnt hat. Im schulischen Rahmen sind solche Tests auch ein durchaus sinnvolles Verfahren, um denjenigen Kindern, die deutlich geringere Leistungen als für die Altersgruppe erwartet gezeigt haben, die Chance zu eröffnen, die kulturell erwünschten schulischen Ziele doch noch zu erreichen.

Der Begründer der Differentiellen Psychologie, der Hamburger Psychologe William Stern, adaptierte das französische Verfahren und entwarf für den deutschen Sprachraum ebenfalls Aufgaben für Kinder unterschiedlichen Alters. Dann teilte er das nach der Methode Binets mathematisch ermittelte ‚Intelligenzalter‘ durch das Lebensalter und erfand so den „Intelligenzquotienten“. Lewis Terman von der Stanford University entfernte dann nur noch die lästigen Kommastellen, in dem er vorschlug, das Ergebnis mit 100 zu multiplizieren. So entstand der Stanford-Binet-Test.

Charles Spearman
Charles Spearman war der festen Überzeugung, dass die von ihm gemessene Allgemeinenergie des Gehirns angeboren sei.

Zu einem allgemeinen Maß für Begabung und intellektuelle Fähigkeiten wurde der so ermittelte IQ allerdings erst durch die vom Experimentalpsychologen Charles Spearman erstmals eingesetzte mathematische Methode der Faktorenanalyse[8], die Spearmans größter Kritiker, der Ingenieur Leon Louis Thurstone, zur sog. Multiplen Faktorenanalyse erweitert hatte[9]. Beide Wissenschaftler leiteten aus einem rein mathematisch ermittelten Zahlenwerk die Ausprägungsgrade intellektueller Fähigkeiten (‚Faktorenladungen‘) ab, sei es, wie bei Spearman, eine (angeborene) allgemeine Intelligenz, der sog. g-Faktor mit zusätzlichen spezifischen Faktoren oder, wie bei Thurstone, die Existenz von sieben relativ unabhängigen geistigen Grundfähigkeiten (primary mental abilities): Zahlenverständnis, Sprachverständnis, Raumvorstellung, Gedächtnis, schlussfolgerndes Denken, Wortflüssigkeit und Auffassungsgeschwindigkeit. Spearman wiederum hielt „g“ für eine Art Energie (mental energie), die wie ein Treibstoff funktioniert. Für jede spezifische Fähigkeit gäbe es einen bestimmten Hirnbereich, den „g“ mit Energie versorge. Er verglich diese mit Motoren und „g“ mit dem dafür nötigen Treibstoff. Für ihn stand es außer Frage, dass die Physiologie eines Tages eine solche Hirnenergie finden würde.

„Der Bildungseffekt beschränkt sich auf einen spezifischen Faktor und berührt den allgemeinen nicht; physiologisch gesehen werden bestimmte Nervenzellen an bestimmte Handlungsarten gewöhnt, obwohl die freie Energie des Hirns ist davon nicht betroffen (…) Obwohl die Entwicklung spezifischer Fähigkeiten zweifellos im großen Umfang von Milieueinflüssen abhängt. wird die der allgemeinen Fähigkeit fast völlig von der Vererbung regiert.“ (Ch. Spearman, The Heredity of Abilities. Eugenics Review 1914, S. 233f)[10]

Die Faktorenanalyse ist eine Methode, mit der eine Vielzahl von Korrelationen zwischen beobachtbaren Variablen auf eine kleinere Anzahl von Variablen zurückgeführt wird. Sie kann große Datenmenge vereinfachen und hat den Anspruch, Ursachen zu verstehen, indem sie uns Hinweise auf Informationen jenseits der Mathematik liefert. Faktoren als solche sind mathematische Abstraktionen, keine Kausalitäten oder Fähigkeiten, die irgendwo im Gehirn ansässig sind. Das heißt, die von Spearman oder Thurstone vorgestellten Lösungen sind lediglich zwei von theoretisch unendlich vielen gleichwertigen Lösungen, da die Faktoren wie ein räumliches Koordinatensystem behandelt, in das die „Faktorenladungen“ als Vektoren projiziert und beliebig im Raum gedreht werden können. Durch die Drehung ändern sich allerdings die Ladungen der Tests auf die einzelnen Faktoren und somit ihre inhaltliche Interpretierbarkeit.

Faktorenanalyse

Die Position der Faktorenachsen ist demnach theorieabhängig und nicht mathematisch notwendig. Bei diesem Ansatz beeinflussen die Vorannahmen die Ergebnisse: aus den theoretisch unendlich vielen Lösungen der Faktorenanalyse sucht man sich das Ergebnis aus, das einem am besten in die Theorie passt; im einen Fall einen Hauptfaktor oder – wie bei Thurstone – sieben Primärfaktoren, die per definitionem maximalen Erklärungswert besitzen. In so einer Korrelationsmatrix werden also die Hauptkomponente oder auch die Primärfaktoren fälschlicherweise als unzweideutige Kausalinterpretation verdinglicht. Mit anderen Worten: Das, was untersucht wird, wird in Wirklichkeit schon a priori angenommen [11]. Fast jedes Intelligenzmodell ließe sich mit dieser Methode theoretisch rechtfertigen, da die Grundgleichungen der Faktorenanalyse zugleich Definition und einzige Messmöglichkeit sind. [12] Ihre zahlenmäßige Bestimmung mithilfe einer Faktorenanalyse „ist demnach ein Analogon zur Eichung eines Messinstruments (…); wobei jedoch nach erfolgter Eichung auf die Messung selbst verzichtet wurde.“ [13] Folgerichtig ging Peter Orlik schon vor 43 Jahre davon aus, dass die Frage, ob faktorenanalytisch ermittelte Ergebnisse richtig oder falsch seien, prinzipiell unentscheidbar ist. [14]

Totgesagte leben bekanntlich länger. Ungeachtet der Kritik an faktorenanalytisch begründeten Intelligenzmodellen zeichnen diese Grundannahmen bis heute alle derzeit üblichen Tests aus, die in der Regel auf den sog. Wechsler-Skalen beruhen, die David Wechsler erstmals 1932 vorstellte und 1939 einer Testbatterie zugrunde legte, aus der der heutige HAWIK (Hamburg-Wechsler-Intelligenztest für Kinder) direkt, indirekt aber auch der Kaufman-abc, das Adaptive Intelligenz Diagnostikum (AID) und das Prüfsystem für Schul- und Bildungsberatung (PSB) von Wolfgang Horn hervorgegangen sind. Wechslers Intelligenzmodell fußt im Wesentlichen auf Thurstones Annahmen, gibt aber zugleich die Vorstellung einer allgemeinen Intelligenz im Sinne Spearmans nicht auf. Der IQ der Wechsler scales ist der gegenwärtig allgemein gebräuchliche Abweichungskoeffizient mit einem Mittelwert von 100 und einer Standardabweichung von 15.

Ein klassisches Beispiel dafür, wie verzerrend bei der Überprüfung intellektueller Fähigkeiten kulturelle Besonderheiten wirken können, gibt ein Forschungsbericht aus dem Jahr 1968: Die Forschergruppe um die amerikanischen Psychologen Michael Cole und Jeremy Glick benutzte dabei eine Sortieraufgabe von Objekten (in der Piaget-Tradition) bei Angehörigen des Kpelle-Stammes in Liberia [15]. Diese Objekte (Nahrungsmittel, Werkzeuge, Nahrungsbehälter und Kleidung) können sowohl anhand linguistischer Kategorien sortiert werden als auch anhand funktionaler Zusammenhänge. Im ersten Fall (der als der kognitiv reifere gilt) werden abstrakte Kategorien zur Ordnung benutzt (so bilden etwa Brot, Gemüse und Obst eine Kategorie der Nahrungsmittel; Topf, Tasse, Fass, eine zweite der Gefäße). Im zweiten Fall werden die funktionalen Handlungszusammenhänge zum Kategorisieren verwendet (es werden z. B. Kartoffel, Topf und Messer einander zugeordnet, weil man mit dem Messer die Kartoffel schält und sie im Topf kocht). Bei den Kpelle überwog die funktionale Kategorisierung, was auf eine relativ „unreife“ Intelligenzstruktur deutete. Glick fiel aber auf, dass einige Probanden ihre Antworten damit begründeten, dass „ein weiser Mann es jedenfalls so tun würde“. Als Glick daraufhin fragte, was denn stattdessen ein Dummkopf (fool) täte, erhielt er erstaunlicherweise die abstrakten Kategorien. Die Kpelle sortierten die Gegenstände in ordentlichen, akkuraten Reihen nach westlichem Muster. Sie konnten diese also sehr wohl „denken“, hielten sie jedoch nicht für intelligent, sondern für „einfältig“ (foolish). [16]

Dabei ist seit 50 Jahren bekannt, dass es keine unverzerrten IQ-Tests gibt. Das gilt übrigens insbesondere für die sprachfreien Intelligenztests! So hat die Entwicklungspsychologin Patricia Greenfield von der University of California vor einigen Jahren festgestellt: „I think it is important to point out that nonverbal tests or visual tests are the most culture-bound of all. They are not ‚culture free‘ and they are not ‚culture fair‘, in fact they are less fair than verbal tests.“. [17]

Für den bedeutenden amerikanischen Spezialisten für cross cultural research, den an der University of California in San Diego lehrenden Psychologen Michael Cole, ist allein die Vorstellung einer „kulturfreien“ Intelligenz ein Widerspruch in sich. [18] Cole hat 1998 in einem Arbeitspapier ein Gedankenexperiment angestellt, wie ein afrikanischer Alfred Binet einen Test für eine „bush school“ des Kpelle-Stammes konstruieren würde. [19] Menschen im ländlichen Liberia bestreiten ihren Lebensunterhalt durch den Anbau von Reis und andere Pflanzen, die sie – sofern zu beschaffen – mit Fleisch und Fisch ergänzen. Reisanbau ist eine körperlich schwere Arbeit, deren Erfolg viel Kenntnisse und Planung erfordert, aber technologisch mit einfachen Mitteln zu bewerkstelligen ist. Man braucht eine Machete, um das Unterholz zu roden, Feuer zum Verbrennen von trockenem Buschwerk, Lianen, um Pfähle zu Zäunen zu verbinden, die Wildtiere abhalten, und vielleicht noch eine Steinschleuder, um sie zu vertreiben. Wenn auch die Werkzeuge simpel sind, so erfordert ihr sachgerechter Einsatz viel Wissen und Erfahrung. [20] Bei den Kpelle gibt es eine klare Arbeitsteilung: Die Männer jagen, halten den Busch niedrig, die Frauen bestreiten den Großteil des Fischfangs und pflanzen die Samen, während die Kinder die kleinen Pflänzchen hüten. Lassen wir einmal die wenigen Spezialisten (Schmiede, Weber, Knochenleser usw.) außer acht, so kennt jeder Stammesangehörige viel genauer als ein Durchschnittsamerikaner oder –europäer seinen Platz in der Stammesökonomie und die jeweils erforderlichen Kenntnisse und Aufgaben.

Africa, Liberia, Kpelle tribe: portrait of two boys, one smiling, one staring.Natürlich besteht auch das Leben der Kpelle aus mehr als Reisanbau und dem Weben von Kleidung. Nicht anders als bei uns ist die Vertrautheit mit den sozialen Verhältnissen ein ausschlaggebender Faktor, vor allem, weil in der Kpelle-Gesellschaft ein komplexes Netz sozialer Beziehungen kontrolliert, in welchem Ausmaß die vorhandenen sozialen Ressourcen für den Einzelnen verfügbar sind. Unser afrikanischer Binet wird bei seiner Testkonstruktion wohl kaum alle für die erwachsenen Kpelle relevanten Aktivitäten miteinbeziehen können. Aus anthropologischer Sicht wäre es sinnvoll, sich für diesen Zweck mit den Schulen oder allgemein gesprochen: mit der institutionalisierten Weitergabe von als wertvoll erachtetem Wissen an die nächste Generation zu befassen. Tatsächlich gibt es in Liberia für diesen Zweck sog. „bush schools“. Hier lernen die Jüngeren drei bis vier Jahre lang abseits vom Dorf in einer Art Camp unter Anleitung der Dorfältesten, einer Art Schamanen, was sie für ihr künftiges Leben wissen müssen: Wie sie das Feld bestellen, Häuser bauen, Wild aufspüren und zahlreiche andere Aktivitäten der Erwachsenen bewältigen. Aber sie werden auch mit der Überlieferung, esoterischem Wissen und den für den Zusammenhalt der Gemeinschaft wichtigen kultischen Handlungen, Mythen und Riten vertraut gemacht. [21]

Was würde der afrikanische Binet nun für seine Testitems auswählen? Alles sowieso nicht, denn das wäre weder testökonomisch noch sinnvoll. Sicher nicht Busch schneiden oder die Reisaussaat, weil es sich hier um allgemein verfügbare Kenntnisse handelt. Auch die Sprache erlernen die Kleinen außerhalb des Unterrichts. Er müsste alles ausschließen, was die Schüler schon vor oder außerhalb der Schule lernen, denn er möchte ja herausfinden, wer den ökonomisch und sozial relevanten Wissensstoff langsamer begreift als andere. Also würde er sich auf die Aktivitäten stützen, bei denen sich bestimmte Kinder von anderen unterscheiden, weil sie einiges viel später begreifen, und manches erst im späteren Leben. Dazu würden vielleicht Anweisungen zählen, wie man ein Haus baut, oder wie man Pflanzenblätter identifiziert, die als Medizin genutzt werden. Sicher würde er sich auch mit der Methode befassen, wie das Wissen der Gemeinschaft, ihre Regeln und Gebräuche in Form von Geschichten und Tänzen überliefert werden.

Also würde er vielleicht Test-Items konstruieren, mit denen die Namen von Blättern abgefragt werden können. Und da die überlieferten Geschichten und auch Gesprächsbeiträge der Kpelle oft Rätsel enthalten, auch Testaufgaben, die den Grad des Rätselverständnisses – und der Rätsellösung bzw. deren Interpretation ermitteln. Der richtige Gebrauch ritueller Handlungen wäre ebenso ein Thema wie Stärke und Schliff einer guten Machete. Dann wären da noch die besonderen Berufe wie Knochenleser, Schmied, Weber, Hebamme oder Jäger, die eine Fülle von Spezialfragen lieferten – etwa, wie man die Qualität von Jagdinstrumenten oder Kleidung beurteilt usw. Die Crux ist nur: Aus Sicht der Kpelle handelt es sich hier ausnahmslos um Fähigkeiten, die einen Stammesangehörigen nicht sonderlich interessieren.

So gilt bei den Kpelle ein gutes Gedächtnis in Gesprächen als Zeichen geistiger Kompetenz. Mit dem Begriff Intelligenz könnten die Kpelle dagegen wenig anfangen. Klugheit gilt bei Ihnen als nichts, was einen Menschen besonders auszeichnet, zumal sich der Begriff auch semantisch von unserem unterscheidet. „This point was made very explicitly by a Kpelle anthropological acquaintance of mine who was versed in the more esoteric aspects of Kpelle secret societies and medicine (or magic, according to Ame- rican stereotypes). We had been talking about what it means to be intelligent in Kpelle society (the most appropriate term is translated as «clever»). „Can you be a clever farmer?“ I asked. ‚No,‘ came the reply. ‚You can be a hardworking farmer, or you can be a lucky farmer, but we couldn’t say that someone is a clever farmer. Everyone knows how to farm. We use «clever» when we talk about the way someone gets other people to help him. Some people always win arguments. Some people know how to deal with stran- gers. Some people know powerful medicine. These are the things we talk about as clever.‘“ [22]

Ähnlich verhält es sich mit den Rätseln in der Kommunikation der Kpelle: Es reicht nicht, dass man weiß, was ein Rätsel ist. Jeder weiß, was ein Rätsel ist. Wichtig ist es vielmehr, zu wissen, wie jemand Rätsel im Zusammenleben mit anderen verwendet. Rätsel sind eine Ressource in einer Vielzahl von sozialen Interaktionen und definieren den Status und die Rechte des Sprechers.

Sowohl aus praktischen wie aus theoretischen Gründen dürfte es hier unmöglich sein, einen Test zu konstruieren, der mit einem herkömmlichen Intelligenztest europäischer Prägung kompatibel wäre. Es genügt auch nicht, die Testaufgaben sprachfrei zu gestalten, um einen Test auch kulturfrei nennen zu können. Kultur beinhaltet viel mehr als nur Sprache. Mit seinem Culture Fair Test (CFT) hatte Raymond Cattell beabsichtigt, Menschen aus dem nichtwestlichen Kulturkreis aufgrund der Sprachfreiheit des Tests weniger zu benachteiligen. Nur hat er dabei übersehen, dass kulturfaire Tests nicht machbar sind. Menschen aus nicht-westlichen Kulturen schneiden beim CFT, bei Raven’s Progressive Matrices oder auch beim Snijders-Oomen Nicht-verbale Intelligenztest (SON-R) signifikant schlechter ab als Europäer oder US-Amerikaner.6[1]

Es sind nämlich gewisse Vorkenntnisse nötig, um die Testaufgaben richtig zu lösen. In den USA und Europa lernen Kinder früh – ja, man könnte mit Blick auf neuere deutsche Mathe-Grundschulbücher sarkastisch anmerken: inzwischen werden sie geradezu darauf gedrillt! – Vergleiche zu machen, Unterschiede zu suchen, Dinge zu ordnen, logische Reihen zu bilden. Kinder, die anders sozialisiert wurden, haben andere Denkmuster und sind dann möglicherweise in einer Schule westlichen Typs (ganz besonders in einer deutschen Schule), aber auch bei (sprachfreien) Intelligenztests, sehr benachteiligt. Nicht nur die sogenannten kulturfreien Tests benachteiligen Personen aus Minderheitengruppen. Praktisch alle Intelligenz-Testbatterien setzen eine gewisse Vertrautheit mit der abendländischen Logik voraus – so z.B. Kenntnisse des Symmetrieprinzips, des Bewegungsprinzips des Uhrzeigers, Gesetze perspektivischer Abbildung, Kenntnisse des Kongruenzprinzips und anderer euklidischer Axiome. Wer damit nicht von Kindesbeinen an vertraut ist, hat vielleicht zwangsläufig die schlechteren Karten.

Als Arbeitshypothese könnte man formulieren: Wo das abstrakte, schlussfolgernde Denken in der Alltagskultur nicht verankert ist, dort werden meist auch entsprechende Arbeitsaufgaben schlechter bewältigt, z.B. einige Subtests der ‚Skala ganzheitlichen Denkens‘ und der ‚Fertigkeitsskala‘ beim Kaufman-abc, aber auch eine Reihe von Subtests im nonverbalen und z.T. auch im Verbalteil des HAWIK. Sollte es da nicht zu denken geben, dass in der gesamten Karibik Menschen, die mit an westlichen Kulturtechniken angelehnten Intelligenztests getestet wurden, im Mittel mit etwa 72 IQ-Punkten gut 30 Punkte unter dem Durchschnittseuropäer liegen? Kann man daraus wirklich den Schluss ziehen, sie seien alle „dümmer“, pardon: intellektuell weniger leistungsfähig resp. entwickelt – zumal ja auch das BSP entsprechend niedriger ist und sich womöglich sogar eine Korrelation zwischen löcherigen Schuhsohlen und verminderter intellektueller Leistungsfähigkeit errechnen lässt?

Borings ironischer Kommentar, Intelligenz sei, was der Test misst, könnte uns dabei helfen, die Kirche im Dorf zu lassen. Wir sollten nie vergessen, dass der IQ allenfalls ein Maß dafür sein kann, inwieweit eine Testperson bei günstigen Testbedingungen in der Lage ist, in einem begrenzten Zeitrahmen geeignete Lösungsstrategien für Testaufgaben zu entwickeln, die sich an Erfolgskriterien und Leistungsstandards nordamerikanischer oder westeuropäischer Schulen und Universitäten orientieren, an basic skills, die allgemein als wichtig oder gar unabdingbar für die berufliche und soziale Kompetenz gelten. Er ist jedoch kein geeigneter Indikator für und erst recht kein Urteil über das Vorhandensein oder den Ausprägungsgrad intellektueller Fähigkeiten oder mentaler Stärken oder Schwächen der Testperson.

 

PDF-Download: Wie sinnvoll sind Intelligenztests im kulturellen Vergleich

 

Anmerkungen

[1] Rindermann, H.: Was messen internationale Schulleistungsstudien? Schulleistungen, Schülerfähigkeiten, kognitive Fähigkeiten, Wissen oder allgemeine Intelligenz? Psychologische Rundschau, 57, S. 69–86, Zitat S. 81; Rindermann, H., The g-factor of International Cognitive Ability Comparisons: The Homogenity of Results in PISA, TIMSS, PIRLS and IQ-Tests Across Nations. In: European Journal of Personality, 21 ( 2007), S. 667–706.
[2] Lynn, R. and Vanhanen, T., IQ and the Wealth of Nations. Westport , CT: Praeger, 2002.
[3] Boring, E. G., Intelligence as the Tests test it. In: The New Republic, 34 (1923), S. 35-36
[4] Auch an anderer Stelle äußerte er die Überzeugung: „Aufgrund vieler Zwillings-, Adoptions- und Patchworkfamilienstudien aus unterschiedlichsten Ländern wissen wir, dass sich Intelligenzunterschiede von Menschen zu fünfzig bis achtzig Prozent durch genetische Faktoren aufklären lassen …“ (Rindermann, H., Rost, D., Was ist dran an Sarrazins Thesen. In: FAZ, 7.9.2010)
[5] Gould, S. J., The Mismeasurement of Man. New York: W.W. Norton & Co 1981. (zit. nach der deutsche Übersetzung: Der falsch vermessene Mensch, 1988, S. 266)
[6] „Menschen mit bestimmter genetischer Ausstattung suchen sich eine andere Umwelt aus und beeinflussen auch ihre Umwelt in einer bestimmten Form, wie es ihren Genen eher entspricht und wie sie sich auch dann besser entwickeln können. Also, zum Beispiel Intelligentere gehen eher länger in die Schule, auf Universitäten, und die weniger Intelligenten, die meiden eher solche Umwelten.“ (H. Rindermann in einem Interview mit Deutschlandradio Kultur am 4.12.07)
[7] vgl. die Kritik von Baumert, J., Brunner, M., Lüdtke, O., Trautwein, U., Was messen internationale Schulleistungsstudien? – Resultate kumulativer Wissenserwerbsprozesse. In: Psychologische Rundschau. Bd. 58, 2 (2007), S. 118-128. Ihre sorgfältige Analyse der Studien Rindermanns führt sie zum Fazit: „Die These Heiner Rindermanns, dass internationale Schulleistungsstudien und Intelligenztests ‚eine empirisch einheitliche und bildungsabhängige kognitive Fähigkeit‘ (S. 70) erfassen, die mit allgemeiner Intelligenz (g) praktisch identisch sei (S. 81–82), ist nicht haltbar.“ (a.a.O, S. 126) Im Hinblick auf Rindermanns methodischen Ansatz können sie sich deshalb den Hinweis auf ein Bonmot Abraham Maslows nicht verkneifen: „Wer als einziges Werkzeug nur über einen Hammer verfügt, sieht in jedem Problem einen Nagel“. (a.a.O., S. 119)
[8] Genauer gesagt, das Verfahren der tetradischen Differenzen – ein Vorläufer der Faktorenanalyse
[9] Nicht zuletzt deshalb, um Spearmans hierarchisches Intelligenzmodell (g-Faktor) als methodisches Artefakt zu entlarven
[10] zit. nach Gould, a.a.O., S. 298
[11] So Gould, a.a.O.; den mathematischen Beweis der Artefakte der Faktorenanalyse hat der heute an der Universität Trier lehrende Psychologe Karl Theo Kalveram schon als junger Assistent in Marburg angetreten. Vgl. Kalveram, K. T., Über Faktorenanalyse. Kritik eines theoretischen Konzepts und seine mathematische Neuformulierung. Archiv f. Psychologie, 122 (1970), S. 92-118; ders., Probleme der Selektion in der Faktorenanalyse. In: ebd., S. 199-230
[12] Kalveram, K. T., Über Faktorenanalyse, a.a.O., S. 109
[13] ebd, S. 110
[14] Orlik, P., Das Dilemma der Faktorenanalyse – Zeichen einer Aufbaukrise in der modernen Psychologie. In: Psychologische Beiträge, 10 (1967), S. 87-98
[15] Aus Gründen, die hier nicht interessieren, ist der Kpelle-Stamm ausgesprochen gut erforscht. Vgl. z.B. Cole, M., Gay, J. Glick, J.A., Sharp, D.W., The Cultural Context of Learning and Thinking: New York: Basic Books 1971; Bellman, B.L.,
Village of Curers and Assassins: On the Production of Fala Kpelle Cosmological Categories: Den Haag: Mouton 1975; Cole, M., Gay, J. Glick, J.A., Sharp, D.W., The Cultural Context of Learning and Thinking: New York: Basic Books 1971
[16] Glick, J., Cognitive style among the Kpelle of Liberia. Paper presented at the Meeting on Cross-Cultural Cognitive Studies, American Educational Research Association, Chicago (Februar 1968), referiert in: Lutz H. Eckensberger & Ingrid Plath, Möglichkeiten und Grenzen des „variablenorientierten“ Kulturvergleichs. In: Kaelble, H. & Schriewer, J. (Hrsg.), Vergleich und Transfer – Komparatistik in den Sozial-, Geschichts- und Kulturwissenschaften. Frankfurt am Main, New York: Campus 2002; s. auch Greenfield, Patricia M. , YOU CAN’T TAKE IT WITH YOU: Why Ability As- sessments Don’t Cross Cultures. American Psychologist, October Vol. 52, 10 (1997), S. 1115-1124
[17] Patricia M. Greenfield, zit. nach: Benson, E., Intelligence Across Cultures. Monitor on Psychology Vol. 34, 2 (Februar 2003) , S. 56
[18] „…that the notion of culture-free intelligence is a contradiction in terms.“ Zit. nach Cole, M., The Illusion of Culture-free Intelligence Testing. Unveröffentlichtes Paper (1998)
[19] Cole, M., a.a.O.
[20] Gay, J. (1973). Red Dust on the Green Leaves, zit. nach Cole, M., a.a.O.
[21] Cole, M., Gay, J. Glick, J.A., Sharp, D.W., The Cultural Context of Learning and Thinking, zit. nach Cole, M., a.a.O.
[22] Cole, M., a.a.O.

© 2010 Rainer Schmidt

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.