Die Persönlichkeit des Gesprächspartners auf dem Smartphone angezeigt bekommen. Realität? Science Fiction? Hier stehts!

Kann man von Sprache mittels KI auf die Persönlichkeit schließen?

tl;dr: Eine funktionierende Analyse von Persönlichkeit auf Basis von künstlicher Intelligenz über die Sprache rückt langsam näher. Aktuell gibt es zwar noch keine glaubhaft validierten Systeme. International existieren jedoch bereits diverse Prototypen, die zum Teil erstaunlich gut funktionieren. Bis das Zeug in Deutschland vernünftig in der Praxis nutzbar ist, vergeht allerdings noch ein kleines bisschen Zeit. Ein paar Gedanken über die mannigfaltigen Implikationen einer solchen Technologie wären aber sicherlich keine schlechte Idee.

Stellt Euch vor, ihr könntet Euch während eines Telefongesprächs in Echtzeit eine Analyse Eures Gegenübers auf dem Smartphone anzeigen lassen. Beziehungsstatus, Alter, politische Orientierung, Religiosität, sexuelle Präferenzen. Dazu ein Persönlichkeitsprofil. Emotionale Stabilität, Offenheit, Extraversion, Verträglichkeit, Gewissenhaftigkeit, Ehrlichkeit, Bescheidenheit. Das ist ein zugleich aufregender wie beunruhigender Gedanke, finde ich, und gar nicht mehr weit von der Realität entfernt. Um eine Übersicht des Stands dieser Technologie geht es in diesem Beitrag. Ich möchte Euch den Status Quo der sprachbasierten Ermittlung von Persönlichkeitseigenschaften mittels künstlicher Intelligenz vorstellen.

Ein komischer Artikel in der FAZ

Nach einigen Impulsen aus unterschiedlichsten Richtungen hat mich ein neulich erschienener FAZ-Artikel einmal mehr auf das Thema gestoßen: „Vorstellungsgespräche mit KI – Wenn Computer Bewerber aussuchen“ [1]. In diesem Artikel fanden sich diverse Aussagen, bei denen ich spontan dachte: was für ein Quatsch. Und damit haben wir ein Thema!

In Deutschland für Furore gesorgt hat in diesem Zusammenhang vor allem das Unternehmen Precire aus Aachen. Die gaben bis vor kurzem noch an, dass sie bereits heute aus Sprachproben die Persönlichkeit von Menschen zum Zwecke der Personalauswahl valide schätzen können. Das behaupten sie mittlerweile nicht mehr. Da hat sich so einiges relativiert. In Kürze:

  1. Das ganze Vorgehen von Precire weicht ebenso merkwürdig wie unerklärlich von etablierten Standards der Psychologie ab.

  2. Es konnte kein haltbarer Nachweis erbracht werden, dass sich Jobleistung mittels Precire-Analysen vorhersagen lässt. Das ist eine harte Ansage, weil damit die Unternehmensgrundlage wackelt.

  3. Precire hat ziemlich böse Prügel bezogen, etwa in Form des Big Brother Awards [2] und vernichtender Berichterstattung, stellvertretend [3].

  4. Der Geschäftsführer von Precire, Thomas Belker, ist merkwürdiger Weise im kürzlich gegründeten HR Tech Ethikbeirat [4]. Das verstehe, wer will.

Uwe Kanning deutlich widersprechen? Eigentlich ungern, aber ...

Das alles ist auch deshalb ein bisschen bedauerlich, weil durch diese recht weit verbreitete Geschichte die Glaubwürdigkeit von KI-basierten HR-Tools in Deutschland nach meinem Eindruck generalisiert Schaden genommen hat. Das wird der Sachlage nicht gerecht, denn es existieren heute durchaus Prototypen, mit deren Hilfe man Persönlichkeit KI-basiert über die Sprache schätzen kann und die für Unternehmen auf längere Sicht für viele verschiedene Anwendungsfragen relevant sein werden. Insofern ist es aber wenig verwunderlich, dass ich dem Kollegen Uwe Kanning (Deutschlands renommiertester Eignungsdiagnostiker), den ich sonst ausgesprochen toll finde [5], in einigen Punkten deutlich widersprechen möchte.

Zunächst mal musste ich beim folgenden Zitat aus dem FAZ-Artikel hart schlucken: „Das heißt, dass ich über einen bestimmten Algorithmus vielleicht 10 Prozent der Gewissenhaftigkeit eines Menschen erfassen kann. 100 Prozent wären das Ergebnis eines Persönlichkeitsfragebogens.“ Das ist so formuliert aus meiner Sicht, nunja, Quatsch.

Erstens messen Persönlichkeitsfragebögen natürlich nicht 100 Prozent. Die Dinger sind ja nicht perfekt konstruiert. Und wovon eigentlich 100 Prozent? Merkwürdig.

Hinzu kommt zweitens, dass Selbstauskünfte nicht immer eine besonders gute Informationsquelle sind. Bewusste (explizite) und unbewusste (implizite) Motive sind beispielsweise ein vollkommen unterschiedliches Paar Schuhe und hängen kaum zusammen. Explizite Motive umfassen bewusste Entscheidungen für etwas und erklären, wie gerne ich mich bestimmten Situationen aussetze. Implizite Motive sagen vorher, wie lange ich etwas machen werde, wieviel Spaß mir etwas macht.

Außerdem ist es drittens ein Riesenunterschied, was Menschen über sich selbst in Fragebögen ankreuzen und wie sie sich de facto verhalten. Dazu vielleicht eine kleine Anekdote: das Fachmagazin Science publizierte 2015 eine bemerkenswerte Studie. Befragt man amerikanische Konservative und Liberale, dann berichten Konservative für sich ein deutlich höheres Glücksempfinden. Beim tatsächlich beobachtbaren Verhalten ist das jedoch – hart nachgewiesen in verschiedenen Laborexperimenten – genau umgekehrt: Liberale erweisen sich im tatsächlichen Verhalten als glücklicher im Vergleich zu Konservativen [6]. Lustig, ne? Insofern können wir das „100 Prozent wären das Ergebnis eines Persönlichkeitsfragebogens“ schon mal getrost vergessen.

Aber auch die Aussage, dass ein gewisser „Algorithmus vielleicht 10 Prozent der Gewissenhaftigkeit eines Menschen erfassen kann“, würde ich ganz erheblich in Zweifel ziehen. 2007 hat eine Gruppe rund um Francois Mairesse von der University of Sheffield – und übrigens unter Mitwirkung des deutschstämmigen Psychologen Matthias Mehl von der University of Arizona – im Journal of Artificial Intelligence eine komplett automatisierte Persönlichkeitsschätzung vorgelegt ([7] Vorsicht, harter Tobak). Bis vor einigen Jahren konnte man mit der dort entwickelten Technologie „Personality Recognizer“ sogar noch eigene Texte eingeben und automatisiert auswerten lassen (davon gibt’s leider nur noch die Webseite für historisch Interessierte [8]). Sehr cooles Zeug, finde ich, wenn auch die Effekte damals noch etwas mickrig ausfielen. 10 Prozent passen da grob durchaus. Aber 12 Jahre sind im digitalen Zeitalter eine kleine Ewigkeit und seitdem hat sich eine Menge getan.

Kleiner Einschub zwischendurch: Es gibt noch einen weiteren Grund, weshalb man sich nicht alleinig auf die althergebrachten Selbstauskünfte zur Persönlichkeit stürzen sollte. Bereits 2008 und mehr oder weniger parallel zur obigen Informatikergruppe hat die Sozialpsychologin Lisa Fast von der University of California die Entdeckung gemacht, dass Sprache durchaus viele Informationen über Persönlichkeit transportiert (schaut gerne nach [9]). Wer sich da weiter einlesen möchte, dem sei die tolle Übersicht über sprachbasierte Erfassung von Persönlichkeit in der digitalen Welt des diesbezüglichen Veteranen James Pennebaker empfohlen [10].

Was ist heute der Stand der Dinge?

Aber zurück zu den Informatikfreaks rund um unseren Francois Mairesse. Da geht’s nämlich spannend weiter. Zwar kümmern sich Informatikgurus leider nicht so richtig um Kennwerte, die im HR von Interesse sind. Prädiktive Validitäten und so. Glücklicher Weise haben sich jedoch kürzlich gleich zwei ziemlich brilliante Teams auf Mairesse berufen, die Technologie intensiv weiterentwickelt und echt beeindruckende Erkenntnisse aus dem Hut gezaubert. Noch beschränkt sich das auf die Ebene des CEO, aber das wird mit der Zeit schon.

Das erste Team um Shavon Malhotra von der University of Waterloo hat sich den „Personality Recognizer“ geschnappt, aufgebohrt und über Expertenschätzungen validiert. Ergebnis: die Korrelationen zwischen den sprachbasierten KI-Scores für Extraversion und dem Urteil externer Experten lagen bei 0.81 im Falle von Analystenschätzungen bzw. bei 0.65 bei Psychologen. Das ist ziemlich beeindruckend.

Damit ist das Team dann losgezogen und hat sich angeschaut, wie sich das alles so auf die M&A-Aktivitäten der zugehörigen Konzerne auswirkt. Besonders schön fand ich dabei zwei Erkenntnisse:

1. Die Firmen von extrovertierten CEOs engagieren sich eher in Akquisitionen.

2. Firmen mit extrovertierten CEOs sind bei Akquisitionen erfolgreicher.

Yeah! Das ist ein wirklich toller Artikel. Schaut ihn Euch gerne an [11] und besucht vielleicht ausnahmsweise auch mal die zugehörige Artikelhomepage des Journals ASQ. Wenn ihr auf der dortigen Seite nämlich die als ähnlich angezeigten Artikel durchstöbert, finden sich noch viele weitere spannende Befunde [12]. Das ganze Feld brummt gerade so richtig.

Besonders erwähnenswert ist in diesem Zusammenhang noch ein Ergebnis des zweiten versprochenen Teams aus dem Strategic Management Journal von 2019 [13], das ebenfalls ein sprachbasiertes KI-Tool zur Persönlichkeitsschätzung von CEOs entwickelt und aufwändig validiert hat. Da sich die Ergebnisse strukturell ähneln, verzichte ich auf weiteren Inhalt. Wer Bock hat, schaue sich schnell den Artikel an. Viel Spaß!

Also alles Quatsch? Das Fazit

Insgesamt würde ich festhalten, dass man bereits heute mittels KI unter sehr engen Randbedingungen von der Sprache eines Menschen auf dessen Persönlichkeit schließen kann. Wir reden da jedoch über weltweit führende Spitzenforschung, eingeschränkte Testgüte und Prototypen von begrenzter Nutzbarkeit.

Parallel rennen in Deutschland Firmen und Menschen herum, die vorgeben, weiter zu sein als besagte Spitzenforschung. Neben Precire beispielsweise auch 100 Worte [14]. Wenn Ihr mich fragt: ich glaube, dass die ihren Mund noch deutlich zu voll nehmen. Aber vielleicht liege ich ja falsch. Konkrete Daten stehen derzeit noch nicht so zur Verfügung, dass man sich ein vernünftiges Urteil bilden könnte. Ich drücke jedenfalls die Daumen und würde mich freuen, wenn ich mich irre. Dann würde ich solche Entwicklungen gerne selbst ausprobieren.

IBM beschäftigt sich auch mit dem Thema [15]. Klasse daran finde ich, dass die sehr transparent offenlegen, was sie so treiben. Eine Demo darf man ausprobieren und IBM legt dar, wie erfolgreich die Vorhersagen sind und auf wen sie sich beziehen. Das macht auf mich einen sehr guten Eindruck. Man muss sich aber schon etwas durchklicken, um herauszufinden, dass das Angebot im Prinzip noch weitgehend invalide Kaffeesatzleserei ist [16]. Quantitativ landen wir da bei den 10 Prozent von Uwe Kanning. Die bunte, eindrucksvolle Demo passt da in meinen Augen noch nicht so richtig zu.

Ganz generell fände ich auch ein paar ethische Gedanken nicht so schlecht, denn die Implikationen von solchen Technologien sind ja ziemlich weitreichend. Überhaupt fehlen noch tiefer gehende Gedanken für Anwendungen samt einer ethischen Einordnung. Klasse Thema. Der Schritt zu einer eigenen App fürs Smartphone, mit deren Hilfe jeder Anrufer relativ schnell, vollumfänglich und automatisiert diagnostiziert werden kann, ist schließlich nicht mehr groß. Hinzu kommt, dass nicht alle Konstrukte so niedlich sind wie Extraversion. Spätestens bei klar negativ konnotierten Persönlichkeitseigenschaften wie der dunklen Triade (Psychopathie, Narzissmus und Machiavellismus) drängen sich eine Menge Fragen auf. Doch auch an dieser Front rührt sich mittlerweile eine ganze Menge. Den HR-Tech-Ethikbeirat hatte ich oben ja schon mal erwähnt und verlinkt. Da sind viele Leute mit Weitsicht drin. Auch die DGFP macht sich im Rahmen eine Verhaltenskodex People Analytics intensive Gedanken. Hinzu mindestens eine breite Industrieinitiative, die sich über solche Fragen den Kopf zerbricht. Ja, bitte! Wir sind gespannt.

Ausblick – Wie geht es weiter?

So. Das war die Premiere als XING Insider mit Gedanken zur KI-basierten Messung von Persönlichkeit über die Sprache. Ich hoffe, Ihr konntet Euch einen einigermaßen differenzierten Eindruck über Technologien bilden, die uns in Zukunft sicher noch aufmischen werden. Ein bisschen beknackt ist die Themenwahl ja schon, das muss ich zugeben. Ehrlicher Weise fällt mir nämlich erst jetzt, wo der Beitrag fertig ist, auf, dass das Haltbarkeitsdatum eines solchen Themas extrem kurz oder gar bereits abgelaufen sein könnte. Seufz. Aber: Der Anfang ist gemacht, nächsten Monat geht’s weiter und ich würde mich freuen, wenn Ihr wieder dabei seid. Dabei habt Ihr die Wahl zwischen zwei Themen:

  1. Intensiv anknüpfen: Lasst uns über Persönlichkeitsschätzungen mittels Social Media quatschen!

  2. Blick schweifen lassen: Der Quatsch, der sich authentische Führung nennt, muss mal als solcher klar benannt werden!

Was möchtet Ihr lesen? Schreibt gerne einen Kommentar oder hinterlasst nur eine Zahl für eine der beiden Alternativen. Ich freue mich in jedem Fall über Feedback und bedanke mich herzlich für Eure Zeit. Bis demnächst!!!

Viele Grüße

Ralf

www.ralf-lanwehr.de

_______________________________________

Mehr von Ralf Lanwehr gibt’s bei den NEW WORK SESSIONS in Montabaur. Am 27. Februar 2020 ist einer der vielen prominenten Teilnehmer des Events, das wir in Kooperation mit der Akademie Deutscher Genossenschaften (ADG) auf die Beine stellen.

Es geht um Partizipation, Kooperation, Kollaboration, inspirierende New Work-Konzepte und die genossenschaftlichen Idee von von Schulze-Delitzsch und Raiffeisen – ein Tag voller Impulse, Austausch und spannenden Sessions. Mehr Informationen und Tickets gibt es unter diesem Link.

________________________________________

Quellen

  1. https://www.faz.net/aktuell/karriere-hochschule/buero-co/vorstellungsgespraech-mit-ki-wenn-computer-bewerber-aussuchen-16507199.html?printPagedArticle=true#pageIndex_2

  2. https://bigbrotherawards.de/2019/kommunikation-precire-technologies-gmbh

  3. https://www.mba-journal.de/wp-content/uploads/2016/01/Sprachtest.pdf

  4. https://www.ethikbeirat-hrtech.de/

  5. Webseite von Uwe Kanning an der FH Osnabrück: https://www.hs-osnabrueck.de/de/prof-dr-uwe-p-kanning/#c82397 Uwe produziert ansonsten bei YouTube die Reihe „15 Minuten Wirtschaftspsychologie“. Die finde ich total klasse und schaue mir das tatsächlich an, wenn ich darüber stolpere. Hier: https://www.youtube.com/channel/UCi1_qDKslpMp_lF1JWxSFsg. Mein Lieblingsvideo dreht sich um das Erlernen von Führung über Pferdetrainings. Da habe ich mehrfach laut gelacht.

  6. Wojcik S.P., Hovasapian A., Graham J., Motyl M., Ditto P.H. (2015). Conservatives report, but liberals display, greater happiness. Science, 347, 1243–1246.

  7. Mairesse, F., Walker, M., Mehl, M., & Moore, R. (2007). Using linguistic cues for the automatic recognition of personality in conversation and text. Journal of Artificial Intelligence Research, 30, 457–500.

  8. http://farm2.user.srcf.net/research/personality/recognizer

  9. Fast, L.G., Funder, D.C. (2008) Personality as manifest in word use: Correlations with self-report, acquaintance-report, and behavior. Journal of Personality and Social Psychology, 94 (2), 334-346.

  10. Boyd, R.L. & Pennebaker, J.W. (2017). Language-based personality: A new approach to personality in a digital world. Current Opinions in Behavioral Sciences, 18, 63–68.

  11. Malhotra, S., Reus, T. H., Zhu, P., & Roelofsen, E. M. (2018). The Acquisitive Nature of Extraverted CEOs. Administrative Science Quarterly, 63(2), 370–408.

  12. https://journals.sagepub.com/doi/10.1177/0001839217712240

  13. Harrison, J.S., Thurgood, G.R., Boivie, S., & Pfarrer, M.D. (2019). Measuring CEO personality: Developing, validating, and testing a linguistic tool. Strategic Management Journal, 40 (8), 1316-1330.

  14. https://www.100worte.de/

  15. https://www.ibm.com/watson/services/personality-insights/

  16. https://cloud.ibm.com/docs/services/personality-insights?topic=personality-insights-science#science

Ralf Lanwehr schreibt über Führung & Transformation

Ralf beschäftigt sich mit harten Fakten zu weichen Themen aus dem Dreieck Psychologie-BWL-Mathe. Er berät DAX-Vorstände, trainert Führungskräfte und coacht Bundesligatrainer. Die eigene Karriere als Kicker blieb trotz seiner Zeit als Stürmer in der 3. mosambikanischen Liga verdientermaßen aus.

Artikelsammlung ansehen