Primäres Ziel ist die Nutzung von Klassifikationsbaumanalysen auf der Basis von unterschiedlichen geschlechtertheoretischen Ansätzen für die Identifikation von intersektionalen Subgruppen, die eine besonders hohe oder geringe Prävalenz von gesundheitsbezogenen Zielgrößen aufweisen.
Mittels eines Algorithmus-gesteuerten Klassifizierungsprozesses werden Subgruppen identifiziert, die besonders hohe oder geringe Prävalenzen einer gesundheitsbezogenen Zielgröße aufweisen. Verschiedene zentrale geschlechtertheoretische Konzepte können durch unterschiedliche Verwendung der (binären) Geschlechtervariable und weiteren lösungsorientierten Geschlechtervariablen operationalisiert werden. Durch die zusätzliche Berücksichtigung einer Vielzahl von Differenzkategorien kann zudem Intersektionalität im Zusammenhang mit Geschlecht erfasst werden. So können beispielsweise die Ergebnisse eines Modells, welches die binäre Geschlechtervariable sowie weitere Differenzkategorien enthält (Modell „Biologisches Geschlecht“), mit den Ergebnissen aus einem Modell verglichen werden, bei dem statt der binären Geschlechtervariable lösungsorientierte Geschlechtervariablen miteinbezogen werden (Modell „Geschlechtergleichstellung“). Darüber hinaus kann auch ein Modell zum Vergleich herangezogen werden, welches neben Differenzkategorien sowohl die binäre Geschlechtervariable als auch lösungsorientierte Geschlechtervariablen beinhaltet (Modell „Geschlechtergerechtigkeit“).
Die explorativen Ergebnisse unterschiedlicher Kombinationen aus binärer Geschlechtervariable, Differenzkategorien und lösungsorientierten Geschlechtervariablen können anschließend miteinander verglichen werden. Diese Gegenüberstellung kann dabei unterstützen zu erkennen, ob und ggf. wie sich ihre Ergebnisse von einer häufig als Standard durchgeführten geschlechterstratifizierten Analyse als Grundlage einer geschlechtervergleichenden Darstellung unterscheiden. Alternativ kann ein spezifischer Theoriebezug im Vorlauf zur statistischen Analyse hergestellt werden, indem der gesamte Analyseprozess in eine bestimmte Geschlechtertheorie bzw. -perspektive eingebettet wird. Entsprechend kann den Forderungen einer stärker von geschlechtertheoretischen Konzepten geleiteten epidemiologischen Forschung nachgekommen werden.
Durch Anwendung einer intersektionalitäts-informierten und geschlechtersensiblen Analysestrategie, kann der Transfer von Theorie in die statistische Analyse gestärkt werden: In Abhängigkeit der Operationalisierung des geschlechtertheoretischen Konzeptes durch die spezifische Auswahl der Variablen, die in der Analyse eingesetzt werden, kann durch eine verbesserte Möglichkeit der Bezugnahme auf zentrale geschlechtertheoretische Konzepte die Interpretation der Ergebnisse quantitativer Analysen erleichtert werden.
Die Klassifikationsbaumanalyse eignet sich vor allem für explorative deskriptive Analysen, wenn eine Vielzahl von Differenzkategorien und lösungsorientierten Geschlechtervariablen berücksichtigt werden soll, ohne vorab Annahmen über besonders betroffene Subgruppen treffen zu können.
Fehlende Werte in den Daten sowie Ausreißer haben keinen erheblichen Einfluss auf den Klassifizierungsprozess.
Es können eine Vielzahl von Differenzkategorien und lösungsorientierten Geschlechtervariablen in die multivariable Analyse integriert werden, auch wenn diese stark miteinander korreliert sind, da das Verfahren frei von Annahmen über deren Wahrscheinlichkeitsverteilung ist.
Die Ergebnisse sind in den meisten Fällen leicht zu interpretieren und eignen sich zur Übermittlung an Entscheidungsträger:innen, z.B. wenn es um eine Diskussion über die Konzeption von gesundheitsbezogenen Interventionen und die Ressourcenallokation geht.
Als ein statistisches Verfahren aus dem Bereich des maschinellen Lernens besteht die Gefahr einer Überanpassung an den verwendeten Datensatz. Techniken wie beispielsweise das „Pruning“, welche im Anschluss an den Klassifizierungsprozess angewendet werden, können einer möglichen Überanpassung entgegenwirken.
Die Interpretierbarkeit von großen Klassifikationsbäumen kann eine Herausforderung darstellen.
Weiterführende Literatur
Autor:innen:
Emily Mena, Gabriele Bolte (Universität Bremen, Institut für Public Health und Pflegeforschung, Abteilung Sozialepidemiologie) im Namen des Verbundprojektes AdvanceGender
Zitiervorschlag: Mena E, Bolte G. Geschlechtersensible Identifikation von intersektionalen Subgruppen mit Klassifikationsbäumen. In: AdvanceGender Study Group (Hrsg.). Optionen für eine geschlechtersensible und intersektionalitäts-informierte Forschung und Gesundheitsberichterstattung; 2022. (www.advancegender.info)
Version: 1.0 (Datum: 04.01.2022)