Klinische Notizen von psychiatrischen Patien*innen sind eine reiche Ressource, um psychische Störungen besser zu verstehen und bessere Phänotypen zu entwickeln. In einem Masterprojekt am Hasso-Plattner-Institut im Wintersemester 19/20 verwendeten wir die Verarbeitung natürlicher Sprache auf klinischen Notizen aus elektronischen Gesundheitsakten (EHR) des Mount Sinai Krankenhaussystems, um aussagekräftige sprachbasierte Repräsentationen von Patient*innen mit Depression zu entwickeln. Mit unüberwachtem maschinellem Lernen zielten wir darauf ab, Kategorien zu finden, die näher an den zugrunde liegenden Mechanismen liegen, sowie Unterkategorien, die über Behandlungsentscheidungen informieren könnten. In einem Folgeprojekt arbeiten wir nun daran, mit Hilfe von Natural Language Processing (NLP) geschlechtsspezifische Unterschiede in klinischen Beschreibungen von psychischen Erkrankungen zu erforschen. Es ist bekannt, dass psychiatrische Symptome je nach Geschlecht oder ethnischem Hintergrund der Patient*innen entweder unterschiedlich sind oder von Ärzt*innen unterschiedlich wahrgenommen werden. In Krankenhäusern notieren die Ärzt*innen diese Symptome in klinischen Notizen. Die Anwendung von Natural Language Processing auf diese Notizen ermöglicht es, Beschreibungen von psychischen Zuständen in großem Umfang zwischen den Geschlechtern und ethnischen Gruppen zu vergleichen. Diese Informationen könnten in Zukunft den Diagnoseprozess von psychischen Erkrankungen informieren und verbessern.