Vorhersage des Geschlechts anhand der Gehirnwellen

In der Zeitschrift „Nature“ wurde ein interessanter Artikel veröffentlicht, in dem es darum geht, ob man das Geschlecht einer Person an den Gehirnwellen erkennen kann. Dazu wurde eine AI auf entsprechende Muster angesetzt und ausgewertet, welche Unterschiede diese fand:

Aus dem Abstract:

We have excellent skills to extract sex from visual assessment of human faces, but assessing sex from human brain rhythms seems impossible. Using deep convolutional neural networks, with unique potential to find subtle differences in apparent similar patterns, we explore if brain rhythms from either sex contain sex specific information. Here we show, in a ground truth scenario, that a deep neural net can predict sex from scalp electroencephalograms with an accuracy of >80% (p < 10−5), revealing that brain rhythms are sex specific. Further, we extracted sex-specific features from the deep net filter layers, showing that fast beta activity (20–25 Hz) and its spatial distribution is a main distinctive attribute. This demonstrates the ability of deep nets to detect features in spatiotemporal data unnoticed by visual assessment, and to assist in knowledge discovery. We anticipate that this approach may also be successfully applied to other specialties where spatiotemporal data is abundant, including neurology, cardiology and neuropsychology.

Quelle: Predicting sex from brain rhythms with deep learning

Vielleicht zunächst etwas zur Methode, um die es da geht, aus der Wikipedia:

Die Elektroenzephalografie (EEG, von altgriechisch ἐγκέφαλος enképhalos, deutsch ‚Gehirn‘, γράφειν gráphein, deutsch ‚schreiben‘) ist eine Methode der medizinischen Diagnostik und der neurologischen Forschung zur Messung der summierten elektrischen Aktivität des Gehirns durch Aufzeichnung der Spannungsschwankungen an der Kopfoberfläche. Das Elektroenzephalogramm (ebenfalls EEG abgekürzt) ist die grafische Darstellung dieser Schwankungen. Das EEG ist neben der Elektroneurografie (ENG) und der Elektromyografie (EMG) eine standardmäßige Untersuchungsmethode in der Neurologie.

Ursache dieser Potentialschwankungen sind physiologische Vorgänge einzelner Gehirnzellen, die durch ihre elektrischen Zustandsänderungen zur Informationsverarbeitung des Gehirns beitragen. Entsprechend ihrer spezifischen räumlichen Anordnung addieren sich die von einzelnen Neuronen erzeugten Potentiale auf, so dass sich über den gesamten Kopf verteilte Potentialänderungen messen lassen.

Zur klinischen Bewertung wird eine Aufzeichnung in mindestens zwölf Kanälen von verschiedenen Elektrodenkombinationen benötigt.

Die Ortsauflösung des üblichen EEGs liegt bei mehreren Zentimetern. Wenn eine höhere Ortsauflösung benötigt wird, so müssen die Elektroden nach neurochirurgischer Eröffnung des Schädels direkt auf die zu untersuchende Hirnrinde aufgelegt werden. Das ist jedoch nur in Sonderfällen z. B. vor epilepsiechirurgischen Eingriffen erforderlich. In diesem Falle spricht man von einem Elektrocorticogramm (ECoG; in deutscher Schreibung Elektrokortikogramm). Das ECoG ermöglicht eine räumliche Auflösung von unter 1 cm und bietet zusätzlich die Möglichkeit, durch selektive elektrische Reizung einer der Elektroden die Funktion der darunterliegenden Hirnrinde zu testen. Dies kann für den Neurochirurgen z. B. bei Eingriffen in der Nähe der Sprachregion von größter Wichtigkeit sein, um zu entscheiden, welche Teile er entfernen darf, ohne eine Funktionseinbuße fürchten zu müssen (vgl. Wachkraniotomie). Eine noch detailliertere Erfassung von Einzelzellaktivität ist nur im Tierexperiment möglich.

Die resultierenden Daten können von geübten Spezialisten auf auffällige Muster untersucht werden. Es gibt aber auch umfangreiche Software-Pakete zur automatischen Signalanalyse. Eine weitverbreitete Methode zur Analyse des EEGs ist die Fouriertransformation der Daten vom Zeitbereich (also der gewohnten Darstellung von Spannungsänderungen im Verlauf der Zeit) in den sogenannten Frequenzbereich. Die so gewonnene Darstellung erlaubt die schnelle Bestimmung von rhythmischer Aktivität.

Bei diesen Mustern treten also Unterschiede auf, die man mittels einer AI ermitteln kann. So etwas sieht dann wohl so aus:

 

 

Gehirnwellen Unterschiede Mann Frau

Gehirnwellen Unterschiede Mann Frau

Für einen Laien dürften da viele Bilder recht gleich aussehen, aber die Computer haben dann einige Unterschiede erkannt, die eine Zuordnung ermöglichen:

While not all details of the features used for classification by the deep net have been revealed, our data show that differences in brain rhythms between sexes are mainly in the beta frequency range (cf. Figs 3 and 4). Women are generally better at recognizing emotions and expressing themselves than men34, in part also reflected in differences in responses from the mu-rhythm as a presumed read-out of the mirror neuron system35, and modulations of beta activity during wakefulness have been associated with cognition and emotionally positive or negative tasks36. The discovery from the deep net that information in the beta-range differs between the sexes supports these observations. However, which particular spatiotemporal characteristics of the beta-rhythm differentiate remains enigmatic, and was not further explored.

Die Unterschiede lassen sich demnach auch mal wieder klassischen Geschlechterunterschieden im Schnitt zuordnen.

Es zeigt sich immer wieder, dass erhebliche Unterschiede zwischen den Geschlechtern im Gehirn feststellbar sind. Die Behauptung, dass sich dies nicht auch im Denken niedergeschlagen hat, erscheint damit auch immer absurder.

Ich finde die Anwendung von „Deep Learning“ in dem Bereich sehr interessant. Ich glaube damit werden in Zukunft noch viel mehr Unterschiede aufgezeigt werden, die ansonsten schwer zu bestimmen sind.

Siehe auch:

 

 

17 Gedanken zu “Vorhersage des Geschlechts anhand der Gehirnwellen

  1. Hat alles nix zu sagen weil die Gehirnwellen ja schon im Mutterleib patriarchal verformt werden.
    Ob man Feminist_*Innen auch an den Gehirnwellen erkennen kann?
    Nr.5 hat eindeutig einen an der Waffel, könnte also ein lila Pudel sein und Nr.7 ist bestimmt eine RadFem.

    • Zitat: „Geistige Arbeit ziehe wichtige Energie aus den Eierstöcken ins Gehirn“. Nach meiner Beobachtung ist es eher umgekehrt: Die Eierstöcke entziehen dem Gehirn wichtige Energie zum klar denken. Zu beobachten bei Merkel und allen Feministinnen.

  2. Ich vermute man wird auch einen Handwerker und einen Schriftsteller mit der Methode unterscheiden können (wahrscheinlich weniger akkurat).

    Der klassische Gegenargumente werden sein, ob man zur Frau oder zum Handwerker gemacht wird oder ob eine gewisse Struktur von Anfang an vorhanden ist, die sich dann mehr oder weniger stark durch Umwelteinflüsse verändert. Manche werden das eine oder das andere stärker betonen und je nachdem dafür argumentieren. Das Ergebniss der Studie gibt in diesem Streit daher leider noch nicht sehr viele neue Erkenntnisse. Da in der Studie, dass „mean age 43.38 (18.42 SD) yrs.; range 18–98 y; 47% males“ ist.

    Dennoch eine schöne Studie. Man müsste nun mal schaun ob man und wieviel der Strukturen in der frühen Kindheit vorhanden sind. Dies könnte weitere Erkenntnisse geben. Ich bin gespannt.

  3. The total number of parameters was 9,051,902.

    und

    The input matrix for the net was a 24 (EEG-channels) × 256 (2 s × 128Hz)

    We trained the neural network using 40 non-overlapping EEG segments of 2 s duration with eyes closed from every subject. In total, EEGs from 1000 adults were used for the training set (40 epochs × 1000 subjects = 40000 epochs of 2 s with 47% being males).

    D.h. die Größe der Trainingsdaten ist 40*1000*256 bzw. 40*1000*24, je nachdem ob einen EEG Channel als ein Datum sieht oder die zeitliche Auflösung von 256 Datenpunkten pro Channel. Nehmen wir vorteilhafterweise die 256 Datenpunkte. Dann ist die Gesamtgröße der Trainingsdaten 40*1000*256=10.240.000.
    Gelernt von einem Netz mit ~9.000.000 Parametern. Wenn ihr mich fragt, das passt so gar nicht zusammen, ein starkes Missverhältnis von Anzahl Parametern zu Größe der Trainingsdaten. Ich würde vermuten, das Netz hat die Daten einfach auswendig gelernt. Die 83% Genauigkeit sind unter diesen Gesichtspunkten ziemlich mager.

    Normalerweise sagt man als Daumenregel mind. 10 mal so viele Daten wie das Netz Parameter hat.

    Wenn man, was eigentlich mehr Sinn macht, einen EEG Channel als ein Datum ansieht ist das Missverhältnis sogar noch krasser: 40*1000*24=960.000.
    D.h. Größe der Trainingsdaten ca. 1 Million, gelernt von einem Netz mit 9 Millionen Parameter! Das passt einfach nicht. Die müssten VIEL mehr Trainigsdaten verwenden, alternativ das Netz kleiner machen.

    Using different hyperparameters, e.g. larger filter sizes (3 × 2 or 4 × 2 patches) or lower numbers of convolutional layers (four or three layers instead of 6 layers), resulted in inferior prediction accuracies of 61–69% and 63–74%, respectively.

    Pfff, ja klar wenn man das Netz so groß macht dass es die Daten einfach auswendig lernt…

    • Ach Mist, jetzt ist mir die Formatierung kaputt gegangen. Der englische text hätte in quote-Tags gehört.

      @topic:
      Und dabei ist noch gar nicht berücksichtigt, dass sie je 40 EEGs von DERSELBEN Person verwenden. Damit ist die Anzahl der Trainingsdaten noch einmal deutlich kleiner. Ich kann mir das nur so erklären, dass die Leute beim Nature Review wenig Ahnung von Neuronalen Netzen hatten.

      Sie zitieren ja ImageNet als Inspiration. Wenn man in der Computer Vision community erzählt dass man auf 1000 Bildern trainiert, dann wird man ausgelacht. Die erfolgreichen CNNs (z.b. zur Objekerkennung) trainieren auf MILLIONEN von Bildern, welche noch dazu eine wesentlich höhere Auflösung haben als die mickrigen 24 x 256 die hier verwendet wurden.

      • Ja, der Trainingsatz ist für neuronale Netze nicht sonderlich hoch. Jedoch haben sie sperate Trainings und Testsätze verwendet um die accurancy zu bestimmen.

        „Training and testing the accuracy of the data was done on large separate, independent datasets, therefore cross validation was deemed not necessary. The independent test set comprised 308 cases“

        oder was habe ich übersehen ?

        • Jedoch haben sie sperate Trainings und Testsätze verwendet um die accurancy zu bestimmen.

          Ja stimmt schon, allerdings:

          Training and testing the accuracy of the data was done on large separate, independent datasets, therefore cross validation was deemed not necessary.

          Es ändert nichts daran dass die Datensätze aus meiner Sicht viel zu klein sind. Bei einem so mächtigen Netz und so wenig Daten sind die Ergebnisse reine Kaffesatzleserei. Da hilft es gar nichts wenn man ein „separates“ Testset hat.
          Bzw. GERADE in so einem Fall (wenig Daten) wäre cross-validation angebracht. Deren Argumentation dass sie „große“ Datensätze haben und deshalb keine cross-validation brauchen kann ich nicht nachvollziehen.


        • Jedoch haben sie sperate Trainings und Testsätze verwendet um die accurancy zu bestimmen.

          Nachtrag: Das Problem bei einem mächtigen Netz und wenig Daten besteht darin, dass die Test-Ergebnisse sehr anfällig auf die spezifischen Datensamples im Testset sind. D.h. wenn die Samples im Testset zufällig (!) ähnlich wie die Samples im Trainingsset sind, bekommt man gute Ergebnisse. Wenn nicht, nicht. Mit anderen Worten, es ist durch „Testset-Engineering“ ohne weiteres möglich, ein massives Auswendiglernen/Overfitting zu verstecken. Über die TATSÄCHLICHE Fähigkeit des Netzes das Geschlecht anhand des EEG zu erkennen kann in diesem Fall dann keine vernünftige Aussage getroffen werden.
          Und siehe da, wie die vorhandenen Daten in Trainings- und Testset aufgeteilt wurden erfährt man nicht. Cross-Validation wurde genau deswegen entwickelt, um diese Problematik zu umgehen: Man macht keine fixe Aufteilung in z.B 70% Training, 30% Test, sondern wählt jeweils ZUFÄLLIG Subsets als Trainings- bzw. Validationset.

          • Ja, wenn man „sicher“ sein möchte das mein Modell gut ist mache ich auch ehr Cross-Validation. Zumindest bekäme man eine wesentlich bessern Eindruck wo die Accurancy liegt. Sonst springt das schon manchmal ein paar Prozentpunkte je nach Trainings und Testset. Das stimmt.

            Irgend eine Idee warum sie es hier nicht gemacht haben könnten ? (abgesehen von böser Intention)

          • Ich denke sie sind sich des Problems gar nicht bewusst. Deep Learning ist gerade „in“, und da haben sie es halt auch mal ausprobiert. Das ist ja durchaus in Ordnung, und man muss anerkennen dass sie das Modell, das Trainingssetup usw. korrekt beschrieben haben – besser als so manches paper aus der deep learning community.
            Aber wenn man auf den hype-train aufspringt, dann sollte man es auch richtig machen. Depp learning mit zuwenig Daten funktioniert einfach nicht.


            I think AI is akin to building a rocket ship. You need a huge engine and a lot of fuel. If you have a large engine and a tiny amount of fuel, you won’t make it to orbit. If you have a tiny engine and a ton of fuel, you can’t even lift off. To build a rocket you need a huge engine and a lot of fuel.

            The analogy to deep learning is that the rocket engine is the deep learning models and the fuel is the huge amounts of data we can feed to these algorithms.

            Andrew Ng, u.a. google brain.

            Es ist kein Zufall dass der große Boom bei deep learning ab ca 2012 stattfand. Zu diesem Zeitpunkt waren erstmals die Datenmengen UND die Rechenleistung die man braucht um die Daten zu verarbeiten vorhanden. Die Modelle für neuronale Netze gibt es seit den 80ern, aber erst als die Datenmengen und die nötige Rechenleistung vorhanden war hat das Konzept abgehoben.

  4. Pingback: Neue Studie: Geschlechtsunterschiede im Gehirn | Agens e.V.

  5. Pingback: Sexuelle Orientierung und Neurokognitive Eigenschaften | Alles Evolution

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google Foto

Du kommentierst mit Deinem Google-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.