banner
Heim / Blog / Bewertung von Klassifikatoren für maschinelles Lernen zur Entscheidungsunterstützung bei der Überweisung von Glaukomen in der Grundversorgung
Blog

Bewertung von Klassifikatoren für maschinelles Lernen zur Entscheidungsunterstützung bei der Überweisung von Glaukomen in der Grundversorgung

Jul 03, 2023Jul 03, 2023

Wissenschaftliche Berichte Band 12, Artikelnummer: 8518 (2022) Diesen Artikel zitieren

953 Zugriffe

1 Zitate

3 Altmetrisch

Details zu den Metriken

Mehrere Algorithmen der künstlichen Intelligenz wurden vorgeschlagen, um die Glaukomdiagnose durch die Analyse der funktionellen und/oder strukturellen Veränderungen im Auge zu unterstützen. Diese Algorithmen erfordern sorgfältig kuratierte Datensätze mit Zugriff auf Augenbilder. In der aktuellen Studie haben wir Klassifikatoren modelliert und ausgewertet, um selbstberichtetes Glaukom anhand eines einzigen, leicht zu ermittelnden Augenmerkmals (Augeninnendruck (IOD)) und nicht-okularer Merkmale (Alter, Geschlecht, Rasse, Body-Mass-Index, systolischer Wert) vorherzusagen diastolischer Blutdruck und Komorbiditäten). Die Klassifikatoren wurden anhand öffentlich verfügbarer Daten von 3015 Probanden trainiert, die zum Zeitpunkt der Einschreibung keine Glaukomdiagnose hatten. 337 Probanden gaben anschließend innerhalb eines Zeitraums von 1–12 Jahren nach der Einschreibung selbst eine Glaukomdiagnose an. Die Klassifikatoren wurden hinsichtlich ihrer Fähigkeit bewertet, diese Probanden nur anhand ihrer zum Zeitpunkt der Einschreibung aufgezeichneten Merkmale zu identifizieren. Support Vector Machine, logistische Regression und adaptives Boosting verhielten sich im Datensatz ähnlich, mit F1-Werten von 0,31, 0,30 bzw. 0,28. Die logistische Regression hatte mit 60 % die höchste Sensitivität bei einer Spezifität von 69 %. Prädiktive Klassifikatoren, die hauptsächlich nicht-okulare Merkmale verwenden, können möglicherweise zur Identifizierung eines Glaukomverdachts in nicht-augenmedizinischen Bereichen, einschließlich der Primärversorgung, eingesetzt werden. Weitere Forschung zur Suche nach zusätzlichen Funktionen, die die Leistung prädiktiver Klassifikatoren verbessern, ist erforderlich.

Das Glaukom ist eine fortschreitende Optikusneuropathie, die zum Verlust retinaler Ganglienzellen führt. Unbehandelt kann es zur völligen Erblindung führen. Es ist die häufigste Ursache für irreversible Blindheit weltweit. Derzeit sind etwa 70 Millionen Menschen davon betroffen, und bis zum Jahr 2040 soll die Zahl auf etwa 112 Millionen ansteigen1. Obwohl die durch das Glaukom verursachte Sehbehinderung irreversibel ist, kann eine frühzeitige Erkennung und Behandlung der Krankheit das Risiko eines dauerhaften Sehverlusts verringern2. Leider wird dies durch die asymptomatische Natur des Glaukoms3 und seinen komplexen, ressourcenintensiven und subjektiven Diagnoseprozess4,5,6,7 erschwert. Auf künstlicher Intelligenz (KI) basierende Ansätze können die Konstruktion, Validierung und Implementierung von Vorhersagemodellen ermöglichen, um Personen zu identifizieren, bei denen ein hohes Risiko für die Entwicklung eines Glaukoms besteht, und zwar in Umgebungen, die nicht unbedingt Zugang zu ophthalmologischen Bildgebungsgeräten haben (z. B. in der Grundversorgung). koordinieren ihre Betreuung mit der Augenheilkunde.

In den letzten Jahren wurden mehrere KI-basierte Ansätze für die Diagnose von Augenerkrankungen wie diabetischer Retinopathie8,9, Makulaödem10,11 und Keratokonus12 untersucht. Einige dieser Bemühungen haben zu neuen medizinischen Geräten geführt. Im Jahr 2018 wurde IDx-DR von der US-amerikanischen Food and Drug Association als erstes vollständig autonomes KI-basiertes Diagnosesystem für diabetische Retinopathie zugelassen13. In mehreren KI-Studien wurde versucht, die im Auge manifestierten strukturellen und funktionellen Muster für die Prognose und Diagnose eines Glaukoms zu interpretieren14,15,16,17,18,19,20,21,22,23,24,25. Künstliche neuronale Netze (ANN) und Klassifikatoren für maschinelles Lernen wurden für funktionelle Daten wie Gesichtsfelder verwendet, um Muster des glaukomatösen Fortschreitens früher als mit konventionelleren Methoden zu identifizieren14,15,16,17. Das Aufkommen von Deep Learning hat die Verwendung von Netzhautbildgebung wie Farbfundusfotos (CFPs)18,19,20,21,22 und Bildern der optischen Kohärenztomographie (OCT) der Makula23,24,25 ermöglicht, um Strukturmerkmale zur Unterscheidung von glaukomatösen Schäden zu extrahieren . Im Vergleich zu Erkrankungen wie der diabetischen Retinopathie, bei denen bereits klinisch machbare KI-basierte Diagnosetechnologien eingesetzt wurden, kann es aufgrund der erheblichen Unterschiede im Erscheinungsbild der Papille schwieriger sein, solche Tools für das Glaukom zu entwickeln. Der Bedarf an sorgfältig ausgewählten, großen und vielfältigen Trainingsdatensätzen, um eine hohe diagnostische Genauigkeit zu erreichen, erhöht diese Herausforderung zusätzlich. Die Leistung von Glaukom-spezifischen Modellen hängt von der Qualität und Anzahl der Bilder (> 100.000) ab, was es zu einem zeitaufwändigen und teuren Prozess macht26. Darüber hinaus sind wiederholte Gesichtsfeldtests erforderlich, um deren inhärenter Subjektivität Rechnung zu tragen, was sie zu einem Großteil der Arbeitsbelastung für Augenuntersuchungen in Krankenhäusern macht22,27.

Relativ wenige KI-basierte Studien haben sich auf die Entwicklung von Vorhersagemodellen für Glaukom ohne Verwendung von Gesichtsfeldern, CFPs oder OCT-Bildern konzentriert. Baxter et al.28 nutzten die weit verbreitete Verbreitung elektronischer Gesundheitsakten (EHR) und verwendeten Klassifikatoren für maschinelles Lernen, um Hochrisikopatienten mit Offenwinkelglaukom (OAG) zu identifizieren, die innerhalb von 6 Monaten operiert werden mussten. Mehta et al.29 trainierten mehrere Ensemble-Modelle, die jeweils unterschiedliche Merkmale verwendeten, um zwischen glaukomatösen und gesunden Augen zu unterscheiden. Eines dieser Modelle nutzte demografische, systemische und Augendaten, um diese Klassifizierungen vorzunehmen. In ähnlicher Weise passten Tielsch et al.30 logistische Regressionsmodelle an eine bevölkerungsbasierte Umfrage an, um unter Verwendung demografischer und anderer bekannter Risikofaktoren nach Glaukomen zu suchen. Diese früheren Studien haben gezeigt, dass KI-basierte Modelle das Potenzial haben, das Glaukom effektiver zu behandeln, fundierte Überweisungen an Augenärzte vorzunehmen, ein effizienteres bevölkerungsbasiertes Glaukom-Screening durchzuführen und intelligente Selbstüberwachungsgeräte zu entwickeln. Da jedoch die Modelle von Baxter et al. und Mehta et al. Da sie nicht auf Merkmale einer nicht diagnostizierten Bevölkerungsgruppe trainiert werden, können sie nicht direkt zur Vorhersage von Glaukomen in der Allgemeinbevölkerung angewendet werden, die nicht bereits aktiv von einem Augenarzt betreut wird. Obwohl Tielsch et al. haben ihr Modell an einer nicht diagnostizierten Population trainiert und dabei von sehr niedrigen vorhergesagten Wahrscheinlichkeiten berichtet; wahrscheinlich eine direkte Folge des verwendeten Datensatzes.

In der aktuellen Studie haben wir die Klassifikatoren an einer ausreichend großen Kohorte von Probanden mit einer negativen Glaukomdiagnose zum Zeitpunkt der Einschreibung trainiert, sodass sie für die Allgemeinbevölkerung repräsentativ sein könnten. Einige der Probanden berichteten anschließend selbst über ein Glaukom. Verschiedene Klassifikatoren für maschinelles Lernen wurden auf ihre Fähigkeit hin untersucht, diese Probanden anhand einer Kombination ihrer zum Zeitpunkt der Einschreibung erfassten demografischen, systemischen, ophthalmischen und Komorbiditätsinformationen zu identifizieren. Ziel war es, die Verwendung leicht verfügbarer Daten zu untersuchen, um Entscheidungen über die Überweisung an Augenärzte aus der Grundversorgung zu treffen, ohne teure und/oder zeitaufwändige Daten wie Gesichtsfelder oder Netzhautbilder zu verwenden.

Zur Entwicklung und Bewertung der Klassifikatoren für maschinelles Lernen wurde die Datenbank der National Institutes of Health (NIH) Age-Related Eye Disease Study (AREDS) verwendet. Bei der AREDS handelte es sich um eine 12-jährige, multizentrische, prospektive Studie, die durchgeführt wurde, um die Risikofaktoren im Zusammenhang mit der altersbedingten Makuladegeneration (AMD) zu bestimmen31. Anonymisierte naturgeschichtliche Daten der Probanden wurden vom NIH zu Forschungszwecken öffentlich zugänglich gemacht. Dem korrespondierenden Autor wurde vom National Eye Institute Data Access Committee, NIH, Zugang zu den AREDS-Daten gewährt und die Analyse wurde in Übereinstimmung mit der genehmigten Forschungsnutzungserklärung (Datenzugriffsanfrage Nr. #89148–1) durchgeführt. Die AREDS hielt sich an die Grundsätze der Deklaration von Helsinki und entsprach dem Gesetz über die Portabilität und Rechenschaftspflicht von Krankenversicherungen32. Für die vorliegende Studie wurden nichtgenetische Daten verwendet, die aus demografischen, systemischen, Augen- (IOD) und Komorbiditätsinformationen der eingeschriebenen Probanden bestanden. Das Glaukom wurde durch einen Selbstbericht festgestellt, bei dem die Probanden jährlich befragt wurden, ob bei ihnen von einem Augenarzt ein Glaukom diagnostiziert worden war. Die Auswahl der Personen mit Glaukom erfolgte anhand derjenigen, die aus einer vordefinierten Liste von Antworten auf die Frage „Hat Ihnen jemals ein Arzt gesagt, dass Sie an Glaukom leiden?“ „Ja“ wählten. Die früheste Diagnose wurde innerhalb eines Jahres nach Beginn erfasst, die späteste nach über 12 Jahren. Auch wenn sie aufgrund des Fehlens einer „bestätigten“ Diagnose begrenzt sind, bieten die AREDS-Daten eine einzigartige Möglichkeit, Vorhersagemodelle auf der Grundlage von Daten von nicht glaukomatösen Probanden zum Zeitpunkt der Einschreibung zu erstellen, von denen einige später selbst ein neues Auftreten eines Glaukoms meldeten.

Für Probanden, die mehrere Nachuntersuchungen hatten, wurden Informationen aus der AREDS-Datenbank extrahiert. Die Modelle basierten auf demografischen Merkmalen (Alter, Geschlecht und Rasse), systemischen Merkmalen (Body-Mass-Index (BMI), systolischer und diastolischer Blutdruck), einem einzelnen Augenmerkmal (IOD im rechten und linken Auge) und Komorbiditäten (Diabetes, Arthritis und AMD). Die Blutdruckwerte wurden von einem zertifizierten Untersucher mit einem Quecksilber-Blutdruckmessgerät gemessen33. Der Augeninnendruck der AREDS-Teilnehmer wurde von erfahrenen Fachleuten mit einem Applanationstonometer oder einem Pneumatonometer gemessen33, was repräsentativ dafür ist, wie der Augeninnendruck bei Augenuntersuchungen im Rahmen der primären Augenpflege gemessen wird34. Es gab 7 nicht glaukomatöse Probanden mit fehlenden Einträgen für IOD oder BMI. Aufgrund der relativ geringen Anzahl fehlender Werte wurde auf eine Imputation verzichtet und diese Fälle aus dem Datensatz entfernt. Eine statistische quantitative Beschreibung der Merkmale ist in den Tabellen 1 und 2 dargestellt. Die Gesamtzahl der Probanden in der endgültigen Datenbank betrug 3.015, die alle nicht glaukomatös waren, als die in den Tabellen 1 und 2 hervorgehobenen Informationen aufgezeichnet wurden. Bei den anschließenden Nachuntersuchungen gaben 337 Probanden selbst an, dass bei ihnen ein Glaukom diagnostiziert worden sei (positive Klasse), so dass am Ende des Studienzeitraums 2.678 nicht glaukomatöse Probanden (negative Klasse) übrig blieben.

Die weitere Datenvorverarbeitung erfolgte in den unten hervorgehobenen Schritten:

Für die anfängliche Datenverarbeitung wurde die Pandas35,36-Bibliothek in Python verwendet. Für die kategoriale AMD-Variable wurde eine ordinale Kodierung verwendet, bei der die ganzzahligen Werte (1–4 in aufsteigender Reihenfolge des Schweregrads) eine natürliche geordnete Beziehung aufwiesen. Für alle anderen kategorialen Variablen (Geschlecht, Rasse, Vorliegen von Diabetes und Arthritis) wurde eine Dummy-Kodierung mithilfe des One-Hot-Encoders implementiert, da keine solche ordinale Beziehung bestand.

Um den Generalisierungsfehler der Klassifikatoren abzuschätzen, wurde eine verschachtelte Kreuzvalidierungsstrategie angewendet. Fünf zufällig generierte Aufteilungen stellten sicher, dass 80 % der Daten für das Training und die restlichen 20 % zum Testen jedes angepassten Klassifikators verwendet wurden. Die Trainings- und Testsätze wurden stratifiziert, um ein ähnliches Verhältnis von Glaukom- zu Nicht-Glaukom-Probanden aufzuweisen. Zur Optimierung der Hyperparameter wurde eine Rastersuche mithilfe einer fünffachen Kreuzvalidierung des Trainingssatzes durchgeführt. Die besten durch den Rastersuchprozess identifizierten Hyperparameter wurden dann verwendet, um die Leistung der Klassifikatoren im Testsatz zu bewerten. Die Modellmetriken werden als Mittelwert über alle Ausführungen gemeldet, um die Leistung jedes Klassifikators zu bewerten und zu vergleichen.

Der aktuelle Datensatz enthielt 11 % positive Fälle und 89 % negative Fälle, was ihn zu einem unausgeglichenen Datensatz macht. Dies kann zu verzerrten Klassifikatoren mit schlechten Vorhersagefähigkeiten führen, insbesondere für die Minderheitenklasse. Um das Klassenungleichgewicht zu beseitigen, wurden synthetische Daten mithilfe der synthetischen Minderheiten-Oversampling-Technik (SMOTE)37 generiert. Der Algorithmus generiert neue Instanzen der Minderheitsklasse, anstatt Kopien der vorhandenen Beispiele zu erstellen. Synthetische Beispiele werden entlang der Liniensegmente eingeführt, die jede Stichprobe der Minderheitsklasse und alle/jeden ihrer nächsten Nachbarn verbinden, bestimmt durch den euklidischen Abstand zwischen ihnen.

Zum Erstellen der Klassifikatoren wurden die Bibliotheken Scikit-learn38 und Keras39 in Python verwendet. Zu den Klassifikatoren gehörten eine lineare Methode (logistische Regression), eine nichtlineare Methode (Support Vector Machines) und eine Ensemble-Methode (Adaptive Boosting). Die Leistung verschiedener Klassifikatoren wird normalerweise anhand von Metriken wie Genauigkeit, Präzision, Rückruf, Spezifität, F1-Score und Fläche unter der Kurve (AUC) für die Receiver Operating Characteristic (ROC) und Präzisions-Rückrufkurven bewertet. Bei unausgeglichenen Daten sind die regulären Leistungsmaßstäbe wie Genauigkeit oft irreführend. Der Rückruf (d. h. die Sensitivität) misst die Fähigkeit des Modells, die positive Klasse (d. h. glaukomatöse Probanden) korrekt zu identifizieren. Präzision (d. h. positiver Vorhersagewert) gibt den Anteil korrekter positiver Vorhersagen an. Da es normalerweise einen Kompromiss zwischen Präzision und Erinnerung gibt, wird oft ihr harmonischer Mittelwert, der sogenannte F1-Score, verwendet. In der aktuellen Studie werden die Hyperparameter der Klassifikatoren so optimiert, dass sie den F1-Score maximieren. In der inneren Schleife der verschachtelten Kreuzvalidierung wurde eine Rastersuchtechnik verwendet, um die optimierten Hyperparameter zu identifizieren. Nachfolgend finden Sie eine kurze Beschreibung des Aufbaus für jedes Modell und der durch Kreuzvalidierung ausgewählten Hyperparameter:

Die logistische Regression ist ein lineares Klassifizierungsmodell, das die logistische Funktion (Sigmoid) verwendet, um die Wahrscheinlichkeit abzuschätzen, dass eine Stichprobe mit bestimmten Merkmalen zur Standardklasse (Y = 1) gehört. Die Wahrscheinlichkeitsvorhersagen werden in Scikit-Learn unter Verwendung eines Schwellenwerts von 0,5 in eine binäre Ausgabe (0 oder 1) umgewandelt. Der logistische Regressionsklassifikator wurde unter Verwendung des Broyden-Fletcher-Goldfarb-Shanno-Lösers (LBFGS) mit begrenztem Speicher eingerichtet. Um eine Überanpassung zu verhindern, wurde die L2-Regularisierung verwendet und der inverse Regularisierungskoeffizient C wurde auf 0,001 festgelegt. Die maximale Anzahl von Iterationen für die Konvergenz des Lösers betrug 10.000. Die Standardisierung des Datensatzes wurde durchgeführt, sodass alle Merkmale ungefähr um Null herum zentriert sind und eine Einheitsvarianz aufweisen. Dadurch wird sichergestellt, dass die Regularisierung gleichermaßen auf alle Features angewendet wird.

Der SVM-Klassifikator (Support Vector Machine) bestimmt eine Hyperebene, die Proben direkt in die eine oder andere Klasse klassifiziert. Eine nichtlineare Entscheidungsfunktion kann mithilfe einer Kernelfunktion bestimmt werden, die die Merkmale implizit in einen hochdimensionalen Raum abbildet. In der vorliegenden Studie wurde ein Kernel mit radialer Basisfunktion verwendet und der inverse Regularisierungskoeffizient C auf 0,001 festgelegt. Der Kernkoeffizient γ stellt den Kehrwert des Einflussradius der vom Modell als Unterstützungsvektoren ausgewählten Proben dar und wurde auf 0,0001 festgelegt. Ähnlich wie der Aufbau des logistischen Regressionsklassifikators ist der SVM-Klassifikator nicht skaleninvariant und die Merkmale wurden daher vor dem Training standardisiert.

Adaptive Boosting (AdaBoost) passt eine Folge schwacher Lernender wie Entscheidungsbäume mit einem einzigen internen Knoten (Entscheidungsstumps) an Daten an, die durch Zuweisen von Gewichtungen wiederholt geändert werden. Bei jeder Boosting-Iteration wird den Beispielen, die im vorherigen Schritt durch das Boosting-Modell falsch klassifiziert wurden, eine höhere Gewichtung zugewiesen, während die Gewichtungen für die korrekt klassifizierten Beispiele verringert werden. Jeder nachfolgende schwache Lernende konzentriert sich dadurch mehr darauf, die Beispiele richtig einzuordnen, die von den vorherigen übersehen wurden. Zur Festlegung der endgültigen Klassifizierung wird eine gewichtete Mehrheit aller schwachen Lernenden herangezogen. Im aktuellen Modell wurden 200 Entscheidungsstümpfe verwendet. Die Lernrate steuert den Beitrag des neuen Entscheidungsstumpfs zum bestehenden Modell und sollte auf kleine Werte (< 0,1)40 eingestellt werden. Im aktuellen Modell ist die Lernrate auf 0,01 eingestellt.

Zur Bestimmung der Vorhersagekraft der verwendeten Merkmale wurde eine Technik zur Permutation der Merkmalsbedeutung eingesetzt. Die Technik wurde eingerichtet, um den Rückgang des F1-Scores zu berechnen, wenn ein einzelner Merkmalswert zufällig gemischt wurde41. Dies führt dazu, dass das Muster zwischen dem Feature und der Zielklasse durchbrochen wird, und der Rückgang des F1-Scores ist ein Hinweis auf die Bedeutung dieses Features für das Modell. Wenn ein bestimmtes Merkmal für das Modell wichtig ist, wird sich die Leistung des Modells durch zufälliges Mischen seiner Werte verschlechtern, während sich die gleiche Vorgehensweise bei einem relativ weniger wichtigen Merkmal nicht negativ auf die Leistung des Modells auswirken würde. Die Wichtigkeit von Permutationsmerkmalen wurde gegenüber der in Entscheidungsbaumklassifikatoren verwendeten auf Verunreinigung basierenden Rangfolgetechnik bevorzugt, da sie modellunabhängig ist und keine Voreingenommenheit gegenüber Merkmalen mit hoher Kardinalität (die meisten numerischen Merkmale) aufweist42.

Tabelle 3 zeigt die Leistung der Klassifikatoren basierend auf den primären Ergebnismaßen: Sensitivität (oder Erinnerung), Spezifität, F1-Score, Genauigkeit und Fläche unter der Präzisions-Erinnerungskurve. Wie bereits erwähnt, ist die Sensitivität ein Maß für falsch-negative Ergebnisse, und der F1-Score ist ein harmonisches Mittel der Sensitivität und Präzision. Spezifität ist ein Maß für die Fähigkeit, Personen ohne Erkrankung korrekt als negativ (dh nicht glaukomatös) zu klassifizieren. Wie in Tabelle 3 zu sehen ist, weisen alle drei Klassifikatoren für maschinelles Lernen eine ähnliche Leistung auf. Dies wird in Abb. 1 hervorgehoben, die die durchschnittliche Präzision und die Rückrufkurven für alle Klassifikatoren im Vergleich zu einem Klassifikator eines Dummy-Klassifikators zeigt, der zufällige Klassifizierungen vornimmt. Die Precision-Recall-Kurve ist bei der Bewertung von Modellen mit Klassenungleichgewicht aussagekräftiger als die ROC-Kurve43. Die Fläche unter der Precision-Recall-Kurve ist für alle drei Klassifikatoren größer als die des Dummy-Klassifikators: 0,30, 0,29 bzw. 0,28 für AdaBoost, SVM und logistische Regression. Klassifikatoren, die im Vergleich zum Dummy-Klassifikator eine größere Fläche unter der Präzisions-Erinnerungskurve aufweisen, weisen auf ihre erlernte Fähigkeit hin, Muster in den Daten zu erkennen.

Die durchschnittlichen Precision-Recall-Kurven für alle Klassifikatoren in Bezug auf einen Dummy-Klassifikator. Die Fläche unter der Kurve (AUC), angegeben als Mittelwert (Standardabweichung): Adaptives Boosting (AdaBoost) – 0,30 (0,07), Support Vector Machine – 0,29 (0,05) und logistische Regression – 0,28 (0,05).

Traditionell erfolgten Glaukom-Screening-Programme und Überweisungen zu umfassenden Augenuntersuchungen auf der Grundlage des Augeninnendrucks, wobei bei Personen mit einem Augeninnendruck > 21 mm Hg ein hohes Glaukomrisiko gilt30,44,45. Tabelle 3 zeigt auch die Leistung eines ähnlichen Kriteriums, das auf den aktuellen Datensatz angewendet wird. Bei Probanden mit einem Augeninnendruck > 21 mm Hg in beiden Augen wurde ein Glaukom vorhergesagt. Beim herkömmlichen IOD-Kriterium ist die Sensitivität im Vergleich zu Klassifikatoren für maschinelles Lernen sehr schlecht, wie in Tabelle 3 dargestellt. Basierend auf der Sensitivität identifizieren Klassifikatoren für maschinelles Lernen wahrscheinlich mehr als doppelt so viele Probanden mit Glaukom aus dem aktuellen Datensatz.

Die Vorhersagefähigkeiten für die zur Klassifizierung verwendeten Merkmale wurden mithilfe der Technik der Permutationsmerkmalsbedeutung bewertet. Abbildung 2 zeigt den Rückgang des F1-Scores für die drei Klassifikatoren, wenn jedes Merkmal permutiert wurde. Die Merkmale, die am meisten zum F1-Score beitragen, sind Augeninnendruck und Alter. Das Alter des Patienten bietet im Vergleich zu AdaBoost bessere Vorhersagemöglichkeiten bei logistischer Regression und Support-Vektor-Maschine.

Die Bedeutung der Permutationsmerkmale wird auf jeden Klassifikator angewendet: (a) Logistische Regression, (b) Support Vector Machine und (c) Adaptive Boosting (AdaBoost). Die mittlere Abnahme des F1-Scores wird für jedes Merkmal angezeigt: Alter, systolischer und diastolischer Blutdruck, Geschlecht (männlich), Body-Mass-Index (BMI), Augeninnendruck (IOD) im rechten Auge (RE) und linken Auge (LE), Kategorie der altersbedingten Makuladegeneration (AMD), Rasse (Schwarze, Hispanoamerikaner, Asiaten und andere) und Vorliegen von Diabetes und Arthritis.

Die Klassifikatoren wurden anhand des AREDS-Datensatzes trainiert und ausgewertet, der Probanden umfasste, die zum Zeitpunkt der Aufzeichnung ihrer Grundlinienmerkmale alle nicht glaukomatös waren. Die Selbstmeldung der Glaukomdiagnose stellt eine Einschränkung dar; Es kann aufgrund des Fehlens einer allgemein anerkannten Methode zur Bestätigung der Diagnose, der damit verbundenen Möglichkeit einer Fehldiagnose seitens eines Anbieters und/oder eines Missverständnisses einer Diagnose (oder des Fehlens einer solchen) durch den Patienten Ungenauigkeiten geben. Der selbstberichtete Glaukomstatus wurde jedoch in früheren Studien regelmäßig verwendet46,47,48 und sein Nutzen und seine Leistung wurden untersucht49.

Der AREDS-Datensatz bietet bestimmte Vorteile, die einige der Verzerrungsquellen beseitigen, die häufig in KI-basierten Studien auftreten50. Erstens umfasst die endgültige Datenbank 3.015 Probanden, was eine relativ große Kohorte darstellt, was zu einer realistischeren Leistung der Klassifikatoren führt. Zweitens umfasst die aktuelle Studie im Gegensatz zu anderen Studien, bei denen die Daten aus Glaukomkliniken stammen, in denen es einen höheren Anteil an Glaukomfällen gibt, 337 glaukomatöse Fälle und 2.678 nicht glaukomatöse Fälle, was ein wahrscheinlicheres reales Szenario darstellt. Drittens wird die Prävalenz von Komorbiditäten wie Diabetes, Arthritis und AMD berücksichtigt, da manche Menschen höchstwahrscheinlich an mehreren Krankheiten leiden würden. KI-basierte Studien, die strukturelle und funktionelle Daten nutzen14,19, gehen im Allgemeinen von einer ansonsten gesunden, aber glaukomatösen Population aus, allerdings leiden die Patienten häufig an mehreren Erkrankungen. Dieser Ansatz würde den Klassifikatoren wahrscheinlich dabei helfen, besser auf Daten aus der realen Welt zu verallgemeinern. Die Klassifikatoren wurden auf Alter, Geschlecht, Rasse, BMI, systolischen und diastolischen Blutdruck, Augeninnendruck und Prävalenz von Komorbiditäten der Probanden geschult.

Tabelle 4 fasst neben der aktuellen Studie weitere KI-basierte Studien zur Glaukomrisikovorhersage zusammen, die keine Gesichtsfeldtests, CFPs und OCT-Scans verwenden. Das von Baxter et al.28 entwickelte Modell prognostiziert bei Patienten ein hohes Risiko für das Fortschreiten des Glaukoms, das durch die Notwendigkeit eines chirurgischen Eingriffs innerhalb von 6 Monaten dargestellt wird. Das Modell wurde anhand von EHR-Daten von Patienten trainiert, bei denen bereits ein Glaukom diagnostiziert wurde. Ihr endgültiger Datensatz war mit insgesamt 385 Patienten, die alle an Glaukom litten und von denen 174 operiert wurden, relativ klein. Daher wäre ihr Modell nicht geeignet, Personen mit Glaukom aus einer nicht diagnostizierten Population zu bestimmen. Mehta et al.29 trainierten ihr Modell anhand eines markierten Datensatzes mit gesunden und glaukomatösen Augen unter Verwendung demografischer, systemischer und okularer Informationen. Da die Vorhersage von Glaukomen in der Allgemeinbevölkerung sinnvoll ist, wandten sie das Modell auch auf eine Kohorte von 55 Probanden an, bei denen zum Zeitpunkt der Datenerhebung keine Glaukomdiagnose vorlag und die anschließend alle an einem Glaukom erkrankten. Obwohl ihr Modell das Glaukom mit einer Genauigkeit von 75 % vorhersagt, ist eine Kohorte von 55 Probanden sehr klein, um seine Vorhersagefähigkeiten beurteilen zu können. Tielsch et al.30 berichteten über Sensitivitäten und Spezifitäten ihrer logistischen Regressionsmodelle für verschiedene Entscheidungsschwellen (0,025, 0,05, 0,1, 0,15). Sie stellten fest, dass der Bereich der vorhergesagten Wahrscheinlichkeiten aus ihrem Modell unter 0,2 lag und die Sensitivität und Spezifität mit 0,15 als Wahrscheinlichkeitsgrenze 35 % bzw. 97 % betrugen. Im Gegensatz dazu haben wir in der aktuellen Studie einen Standardwahrscheinlichkeitsschwellenwert von 0,5 für den logistischen Regressionsklassifikator verwendet. Ihre Daten umfassten 191 Glaukomfälle und 5.054 normale Fälle, was es zu einem äußerst unausgewogenen Datensatz machte. Sie haben nicht berichtet, ob vor der Anpassung des Modells Stichprobentechniken eingesetzt wurden, um das Ungleichgewicht zu beheben. Dies könnte zu einem Modell geführt haben, das auf die Vorhersage der häufiger vorkommenden Klasse ausgerichtet ist. Wie in Tabelle 4 zu sehen ist, mildert die aktuelle Studie einige der oben angesprochenen Einschränkungen.

Die Anwendung einer Permutations-Feature-Wichtigkeitstechnik auf die Klassifikatoren in der aktuellen Studie zeigte, dass Augeninnendruck und Alter die prädiktivsten Merkmale im Hinblick auf die Erhöhung des F1-Scores waren. Systemische Merkmale, Komorbiditäten und Rassendaten trugen nicht zur Vorhersagefähigkeit der Klassifikatoren bei. Dies bedeutet jedoch nicht, dass die Informationen im Hinblick auf ihren Zusammenhang mit Glaukom nicht wichtig sind. Die Ergebnisse der Permutationsmerkmalsbedeutung sind spezifisch für den aktuellen Datensatz und spiegeln den Beitrag der Merkmale zum F1-Score wider. Mehrere große Prävalenzstudien haben afrikanische Abstammung als Risikofaktor für Glaukom mit höheren Augeninnendruckwerten dokumentiert51,52,53. Die fehlende Abhängigkeit der Klassifikatoren von der Rasse ist wahrscheinlich auf die sehr hohe Prävalenz weißer Teilnehmer in der AREDS-Datenbank zurückzuführen, was eine Einschränkung der aktuellen Studie darstellt. Eine ausgewogenere Rassenverteilung innerhalb der Daten hätte möglicherweise zu anderen Ergebnissen geführt. Gefäßerkrankungen wie der Blutdruck wurden als mögliche Risikofaktoren für ein Glaukom untersucht. Die Ergebnisse waren jedoch nicht schlüssig. Während die Egna-Neumarkt-Studie54 einen Zusammenhang zwischen Glaukom und systemischer Hypertonie feststellte, stellte die Rotterdam-Studie55 fest, dass der Blutdruck mit einem Hochdruckglaukom, nicht aber mit einem Normaldruckglaukom assoziiert war. Andererseits ergab die Beijing Eye Study56, dass weder der systolische noch der diastolische Blutdruck signifikant mit der Glaukomprävalenz assoziiert waren. Um die Bedeutung jedes Merkmals wirklich beurteilen zu können, muss der Datensatz hochgradig standardisiert und über die verschiedenen Merkmale hinweg ausgewogen sein. Darüber hinaus litt die Mehrheit der AREDS-Teilnehmer an AMD, was für die Normalbevölkerung nicht repräsentativ ist und eine Einschränkung des aktuellen Ansatzes darstellt. Während die Feature-Permutation-Wichtigkeitstechnik darauf hindeutet, dass AMD möglicherweise kein wichtiger Prädiktor für Glaukom ist, könnte die Stratifizierung des Datensatzes nach AMD-Kategorien ein geeigneter Ansatz sein, um schlüssige Informationen zu extrahieren. Dies wurde in der aktuellen Studie jedoch nicht weiterverfolgt, da es die Anzahl der Stichproben im Datensatz verringern würde, was ihn anfällig für eine Überanpassung machen würde.

Das Ziel des Screenings besteht darin, Krankheiten frühzeitig zu erkennen und Zustände zu behandeln, die bereits pathologische Veränderungen hervorgerufen haben, aber noch nicht ein Stadium erreicht haben, in dem spontan eine medizinische Intervention angestrebt wird57. Im Gegensatz zu diagnostischen Instrumenten, die eine hohe Sensitivität und Spezifität erfordern, kann das Screening relativ ungenauer sein, da es nicht die Grundlage für die Behandlung bildet. Personen, die durch einen positiven Screening-Test identifiziert wurden, müssen zur Diagnose und notwendigen Behandlung überwiesen werden. Der asymptomatische Charakter des Glaukoms führt dazu, dass 50–90 % der Fälle bis zu fortgeschrittenen Krankheitsstadien unentdeckt bleiben4,5,6. Das Fehlen regelmäßiger Besuche beim Augenarzt ist eine der Hauptursachen für ein nicht diagnostiziertes Glaukom58. Obwohl diese Zahlen die Notwendigkeit von Glaukom-Screening-Programmen belegen, sind sie aufgrund ihrer hohen Kosten59 und des Fehlens einer idealen Screening-Methode60,61 nicht sehr verbreitet. Das Student Sight Savers Program führte in den Vereinigten Staaten ein Glaukom-Screening für über 41.000 Menschen durch44. Das Screening umfasste einen Fragebogen zur Ermittlung des Glaukoms in der Familiengeschichte, die Messung des Augeninnendrucks und die Beurteilung der Sehfunktion. Die Sensitivitäts- und Spezifitätswerte für ein positives Screening in den einzelnen Tests betrugen 48,6 % bzw. 68,6 % für ein bestätigtes Glaukom in der Familienanamnese, 22,1 % bzw. 78,6 % für einen Augeninnendruck über 21 mm Hg und 58,1 % bzw. 98,6 % für drei oder mehr Auffälligkeiten Orte im Gesichtsfeld. Wie in der aktuellen Studie gezeigt, kann eine multivariable Entscheidungsfunktion, die durch datenbasierte Techniken erlernt wird, im Vergleich zu einem festen Kriterium für das Screening bessere Ergebnisse liefern. Screening-Techniken müssen kostengünstig und einfach sein, schnell durchgeführt werden und sollten dem Probanden nur minimale Beschwerden bereiten57. Mit den Fortschritten beim maschinellen Lernen und der relativen Einfachheit der IOD-Messung besteht die Möglichkeit, Herausforderungen zu bewältigen, die speziell für das Glaukom-Screening gelten, und unterstreicht nachdrücklich die Notwendigkeit weiterer Forschung zu diesen Technologien62.

In Zukunft werden Klinikern Glaukom-spezifische KI-basierte Tools für ein verbessertes Krankheitsmanagement zur Verfügung stehen, einschließlich der Möglichkeit eigenständiger oder EHR-integrierter Tools zur Entscheidungsunterstützung bei Überweisungen für Hausärzte und/oder Anbieter von Pflegemanagementdiensten. Mit der zunehmenden Leistungsfähigkeit der Rechenressourcen werden gut kuratierte Datensätze von besserer Qualität diese Tools wahrscheinlich für das Screening und möglicherweise auch für die Diagnose äußerst präzise machen. Die hier präsentierten Ergebnisse unterstreichen das Potenzial dieser Instrumente, eine zukünftige Rolle bei der Früherkennung von Glaukomen zu spielen. Diese Arten von Vorhersagemodellen können Screening-Programme, Überweisungsentscheidungen und Selbstüberwachung effizienter und effektiver machen und dadurch die Chancen auf eine effektivere Behandlung des Glaukoms erhöhen, das Risiko eines Sehverlusts verringern und die Lebensqualität verbessern.

In dieser Studie haben wir mehrere Klassifikatoren für maschinelles Lernen auf ihre Fähigkeit untersucht, künftige selbstberichtete Glaukomfälle auf der Grundlage von Daten vorherzusagen, die unabhängig von einem Augenarzt gewonnen werden können. Ziel war es, das Potenzial für die Kombination leicht zugänglicher Patientendaten mit einer einfachen IOP-Messung in einem nicht augenmedizinischen Umfeld zu erkunden, um Überweisungsentscheidungen zu treffen und so die Zahl der Glaukomverdächtigen zu erhöhen, die frühzeitig von einem Augenarzt untersucht werden. Die drei Klassifikatoren: logistische Regression, Support Vector Machine und adaptive Boosting wurden anhand von Daten trainiert, die aufgezeichnet wurden, als kein Proband eine Glaukomdiagnose meldete. Die Klassifikatoren waren in der Lage, Probanden vorherzusagen, die anschließend eine bestätigte Glaukomdiagnose meldeten, mit Sensitivitäten zwischen 52 % und 60 % und Spezifitäten zwischen 69 % und 77 %. Weitere Untersuchungen zur Identifizierung weiterer Merkmale zur Verbesserung der Vorhersageleistung solcher Klassifikatoren sind erforderlich. Wir stellen uns den Einsatz solcher Algorithmen bei der Entwicklung von Tools vor, die in der Grundversorgung eingesetzt werden sollen, um Patienten zu beraten, die von einem Augenarzt untersucht werden sollen. Wir glauben, dass ein solches Tool einen Mehrwert für die klinische Versorgung von Patienten mit Glaukomrisiko darstellen würde, die andernfalls ohne die Überweisung und Ermutigung ihres Hausarztes keinen Augenarzt aufsuchen würden.

Tham, Y. et al. Globale Glaukomprävalenz und Prognosen zur Glaukombelastung bis 2040: eine systematische Überprüfung und Metaanalyse. Ophthalmology 121, 2081–2090 (2014).

Artikel PubMed Google Scholar

Tatham, AJ, Weinreb, RN & Medeiros, FA Strategien zur Verbesserung der Früherkennung von Glaukomen: der kombinierte Struktur-Funktions-Index. Klin. Ophthalmol. (Auckland, Neuseeland) 8, 611 (2014).

Google Scholar

Weinreb, RN, Aung, T. & Medeiros, FA Die Pathophysiologie und Behandlung des Glaukoms: eine Übersicht. JAMA 311, 1901–1911 (2014).

Artikel PubMed PubMed Central CAS Google Scholar

Leite, MT, Sakata, LM & Medeiros, FA Glaukombehandlung in Entwicklungsländern. Arq. BHs. Ophthalmol. Rev. 74, 83–84 (2011).

Artikel PubMed PubMed Central Google Scholar

Hennis, A. et al. Bekanntheit des Auftretens von Offenwinkelglaukomen in einer Bevölkerungsstudie: den Barbados Eye Studies. Ophthalmology 114, 1816–1821 (2007).

Artikel PubMed Google Scholar

Susanna, R., De Moraes, CG, Cioffi, GA & Ritch, R. Warum erblinden Menschen (noch) an Glaukom? Übers. Vis.Sci. Technol. 4, 1 (2015).

Artikel PubMed PubMed Central Google Scholar

Founti, P. et al. Überdiagnose von Offenwinkelglaukom in der Allgemeinbevölkerung: die Thessaloniki Eye Study. Acta Ophthalmol. 96, e859–e864 (2018).

Artikel PubMed Google Scholar

Gulshan, V. et al. Entwicklung und Validierung eines Deep-Learning-Algorithmus zur Erkennung diabetischer Retinopathie in Netzhautfundusfotos. JAMA 316, 2402–2410 (2016).

Artikel PubMed Google Scholar

Rajalakshmi, R., Subashini, R., Anjana, RM & Mohan, V. Automatisierte Erkennung diabetischer Retinopathie in der Smartphone-basierten Fundusfotografie mithilfe künstlicher Intelligenz. Auge 32, 1138–1144 (2018).

Artikel PubMed PubMed Central Google Scholar

Wang, Y., Zhang, Y., Yao, Z., Zhao, R. & Zhou, F. Auf maschinellem Lernen basierende Erkennung von altersbedingter Makuladegeneration (AMD) und diabetischem Makulaödem (DME) mithilfe der optischen Kohärenztomographie (OCT). ) Bilder. Biomed. Opt. Express 7, 4928–4940 (2016).

Artikel PubMed PubMed Central Google Scholar

Lee, CS et al. Deep-Learning-basierte, automatisierte Segmentierung von Makulaödemen in der optischen Kohärenztomographie. Biomed. Opt. Express 8, 3440–3448 (2017).

Artikel PubMed PubMed Central Google Scholar

Maeda, N., Klyce, SD, Smolek, MK & Thompson, HW Automatisiertes Keratokonus-Screening mit Hornhauttopographieanalyse. Investieren. Ophthalmol. Vis. Wissenschaft. 35, 2749–2757 (1994).

CAS PubMed Google Scholar

Abràmoff, MD, Lavin, PT, Birch, M., Shah, N. & Folk, JC Schlüsselstudie eines autonomen KI-basierten Diagnosesystems zur Erkennung diabetischer Retinopathie in Praxen der Grundversorgung. NPJ digitale Medizin. 1, 1–8 (2018).

Artikel Google Scholar

Bizios, D., Heijl, A. & Bengtsson, B. Trainiertes künstliches neuronales Netzwerk für die Glaukomdiagnose unter Verwendung von Gesichtsfelddaten: ein Vergleich mit herkömmlichen Algorithmen. J. Glaukom. 16, 20–28 (2007).

Artikel PubMed Google Scholar

Chan, K. et al. Vergleich von maschinellem Lernen und traditionellen Klassifikatoren in der Glaukomdiagnose. IEEE Trans. Biomed. Ing. 49, 963–974 (2002).

Artikel PubMed Google Scholar

Goldbaum, MH et al. Vergleich von Klassifikatoren für maschinelles Lernen zur Glaukomdiagnose anhand standardmäßiger automatischer Perimetrie. Investieren. Ophthalmol. Vis. Wissenschaft. 43, 162–169 (2002).

PubMed Google Scholar

Probe, PA et al. Verwendung von Klassifikatoren für maschinelles Lernen, um glaukomatöse Veränderungen in Standardgesichtsfeldern früher zu erkennen. Investieren. Ophthalmol. Vis. Wissenschaft. 43, 2660–2665 (2002).

PubMed Google Scholar

Liu, S. et al. Ein auf Deep Learning basierender Algorithmus identifiziert glaukomatöse Bandscheiben anhand monoskopischer Fundusfotos. Ophthalmol. Glaucoma 1, 15–22 (2018).

Artikel PubMed Google Scholar

Christopher, M. et al. Durchführung von Deep-Learning-Architekturen und Transfer-Learning zur Erkennung einer glaukomatösen Optikusneuropathie in Fundusfotos. Wissenschaft. Rep. 8, 1–13 (2018).

Artikel CAS Google Scholar

Li, Z. et al. Wirksamkeit eines Deep-Learning-Systems zur Erkennung einer glaukomatösen Optikusneuropathie basierend auf Farbfotos des Fundus. Ophthalmology 125, 1199–1206 (2018).

Artikel PubMed Google Scholar

Shibata, N. et al. Entwicklung eines Deep-Residuen-Lernalgorithmus zum Screening auf Glaukom anhand der Fundusfotografie. Wissenschaft. Rep. 8, 1–9 (2018).

Artikel Google Scholar

Yoo, TK & Hong, S. Künstlicher neuronaler Netzwerkansatz zur Unterscheidung von Offenwinkelglaukom und Glaukomverdacht ohne Gesichtsfeldtest. Investieren. Ophthalmol. Vis. Wissenschaft. 56, 3957–3966 (2015).

Artikel PubMed CAS Google Scholar

Maetschke, S. et al. Ein merkmalsunabhängiger Ansatz zur Glaukomerkennung in OCT-Volumina. PLoS ONE 14, e0219126 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Medeiros, FA, Jammal, AA & Thompson, AC Von Maschine zu Maschine: ein OCT-trainierter Deep-Learning-Algorithmus zur objektiven Quantifizierung glaukomatöser Schäden in Fundusfotos. Ophthalmology 126, 513–521 (2019).

Artikel PubMed Google Scholar

Muhammad, H. et al. Hybrides Deep Learning auf einzelnen optischen Weitfeld-Kohärenztomographie-Scans klassifiziert Glaukomverdächtige genau. J. Glaucoma 26, 1086 (2017).

Artikel PubMed PubMed Central Google Scholar

Devalla, SK et al. Glaukommanagement im Zeitalter der künstlichen Intelligenz. Br. J. Ophthalmol. 104, 301–311 (2020).

Artikel PubMed Google Scholar

Fung, SS, Lemer, C., Russell, RA, Malik, R. & Crabb, DP Werden praktische Empfehlungen umgesetzt? Eine nationale multizentrische Querschnittsstudie zur Häufigkeit von Gesichtsfeldtests beim Glaukom. Br. J. Ophthalmol. 97, 843–847 (2013).

Artikel PubMed Google Scholar

Baxter, SL, Marks, C., Kuo, T., Ohno-Machado, L. & Weinreb, RN Auf maschinellem Lernen basierende prädiktive Modellierung chirurgischer Eingriffe bei Glaukom unter Verwendung systemischer Daten aus elektronischen Gesundheitsakten. Bin. J. Ophthalmol. 208, 30–40 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Mehta, P. et al. Automatisierte Glaukomerkennung durch interpretierbares maschinelles Lernen unter Verwendung klinischer Daten und multimodaler Netzhautbilder. BioRxiv. (2020).

Tielsch, JM et al. Eine bevölkerungsbasierte Bewertung des Glaukom-Screenings: die Baltimore Eye Survey. Bin. J. Epidemiol. 134, 1102–1110 (1991).

Artikel CAS PubMed Google Scholar

Gruppe, T. Die Studie zu altersbedingten Augenerkrankungen (AREDS): Auswirkungen auf das Design AREDS-Bericht Nr. 1. Kontrolle. Klin. Versuche. 20, 573 (1999).

Koo, E. et al. Zehnjahres-Inzidenzraten von altersbedingtem Katarakt in der Age-Related Eye Disease Study (AREDS): AREDS-Bericht Nr. 33. Ophthalmisches Epidemiol. 20, 71–81 (2013).

Artikel PubMed Google Scholar

Altersbedingte Augenkrankheitsstudie (AREDS) des National Eye Institute (NEI). https://www.ncbi.nlm.nih.gov/projects/gap/cgi-bin/variable.cgi?study_id=phs000001.v3.p1&phv=54046 (2012).

Lazarus, R. Augenuntersuchungen. https://www.optometrists.org/general-practice-optometry/guide-to-eye-exams/eye-exams/ (2020).

McKinney W. Datenstrukturen für statistische Berechnungen in Python. In Proceedings der 9. Python in Science-Konferenz. Bd. 445, 56–61 (Austin, TX, 2010)

Das Pandas-Entwicklungsteam. pandas-dev/pandas: Pandas. (2020).

Chawla, NV, Bowyer, KW, Hall, LO & Kegelmeyer, WP SMOTE: eine synthetische Minderheits-Oversampling-Technik. J. Artif. Intel. Res. 16, 321–357 (2002).

Artikel MATH Google Scholar

Pedregosa, F. et al. Scikit-learn: Maschinelles Lernen in Python. J. Mach. Lernen. Res. 12, 2825–2830 (2011).

MathSciNet MATH Google Scholar

Chollet, F. Keras. https://keras.io (2015).

Friedman, J., Hastie, T. & Tibshirani, R. Additive logistische Regression: eine statistische Sicht auf Boosting (mit Diskussion und Gegenerwiderung der Autoren). Ann. Stat. 28, 337–407 (2000).

Artikel MATH Google Scholar

Breiman, L. Zufällige Wälder. Mach. Lernen. 45, 5–32 (2001).

Artikel MATH Google Scholar

Scikit-learn-Entwickler. Bedeutung der Permutationsmerkmale. https://scikit-learn.org/stable/modules/permutation_importance.html#id2 (2020).

Saito, T. & Rehmsmeier, M. Das Precision-Recall-Plot ist bei der Auswertung binärer Klassifikatoren für unausgeglichene Datensätze informativer als das ROC-Plot. PLoS ONE 10, e0118432 (2015).

Artikel PubMed PubMed Central CAS Google Scholar

Salim, S., Netland, PA, Fung, KH, Smith, ME & Aldridge, A. Bewertung der Methoden des Studenten-Sehprogramms für das Glaukom-Screening. Ophthalmisches Epidemiol. 16, 238–242 (2009).

Artikel PubMed Google Scholar

Hochschule für Optiker. Leitlinien zur Überweisung von Glaukomverdächtigen durch gemeindenahe Optiker. (2010).

Wilson, MR et al. Depression bei Patienten mit Glaukom, gemessen anhand von Selbstberichtsumfragen. Ophthalmology 109, 1018–1022 (2002).

Artikel PubMed Google Scholar

Shweikh, Y. et al. Messungen des sozioökonomischen Status und des selbstberichteten Glaukoms in der britischen Biobank-Kohorte. Auge 29, 1360–1367 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Masís, M., Kakigi, C., Singh, K. & Lin, S. Zusammenhang zwischen selbstberichtetem Bupropionkonsum und Glaukom: eine bevölkerungsbasierte Studie. Br. J. Ophthalmol. 101, 525–529 (2017).

Artikel PubMed Google Scholar

Neustaeter, A., Vehof, J., Snieder, H. & Jansonius, NM Glaukom in der groß angelegten bevölkerungsbasierten Epidemiologie: ein fragebogenbasierter Proxy. Auge 35, 508–516 (2021).

Artikel PubMed Google Scholar

Girard, MJ & Schmetterer, L. Künstliche Intelligenz und Deep Learning beim Glaukom: Aktueller Stand und Zukunftsaussichten. 257, 37–64 (2020).

Tielsch, JM et al. Rassenspezifische Unterschiede in der Prävalenz des primären Offenwinkelglaukoms: die Baltimore Eye Survey. JAMA 266, 369–374 (1991).

Artikel CAS PubMed Google Scholar

Leske, MC, Connell, A., Schachat, AP & Hyman, L. Die Barbados-Augenstudie: Prävalenz des Offenwinkelglaukoms. Bogen. Ophthalmol. 112, 821–829 (1994).

Artikel CAS PubMed Google Scholar

Buhrmann, RR et al. Prävalenz von Glaukom in einer ländlichen Bevölkerung Ostafrikas. Investieren. Ophthalmol. Vis. Wissenschaft. 41, 40–48 (2000).

CAS PubMed Google Scholar

Bonomi, L. et al. Gefäßrisikofaktoren für primäres Offenwinkelglaukom: die Egna-Neumarkt-Studie. Ophthalmology 107, 1287–1293 (2000).

Artikel CAS PubMed Google Scholar

Dielemans, I. et al. Primäres Offenwinkelglaukom, Augeninnendruck und systemischer Blutdruck in der allgemeinen älteren Bevölkerung: die Rotterdam-Studie. Ophthalmology 102, 54–60 (1995).

Artikel CAS PubMed Google Scholar

Xu, L., Wang, YX & Jonas, JB Augenperfusionsdruck und Glaukom: die Beijing Eye Study. Auge 23, 734–736 (2009).

Artikel CAS PubMed Google Scholar

Wilson, JMG, Jungner, G. & Weltgesundheitsorganisation: Grundsätze und Praxis des Screenings auf Krankheiten. 14–15 (1968).

Topouzis, F. et al. Faktoren im Zusammenhang mit einem nicht diagnostizierten Offenwinkelglaukom: die Thessaloniki Eye Study. Bin. J. Ophthalmol. 145, 327-335. e1 (2008).

Artikel PubMed Google Scholar

Weinreb, RN Glaukom-Screening. (Kugler Publications, 2008).

Quigley, HA Aktuelle und zukünftige Ansätze zum Glaukom-Screening. J. Glaukom. 7, 210–220 (1998).

Artikel CAS PubMed Google Scholar

Shields, MB Die Herausforderung des Glaukom-Screenings. Bin. J. Ophthalmol. 120, 793–795 (1995).

Artikel CAS PubMed Google Scholar

Tan, NY, Friedman, DS, Stalmans, I., Ahmed, IIK & Sng, CC Glaukom-Screening: Wo stehen wir und wohin müssen wir gehen? Curr. Meinung. Ophthalmol. 31, 91–100 (2020).

Artikel PubMed Google Scholar

Referenzen herunterladen

Der für die in diesem Manuskript beschriebenen Analysen verwendete Datensatz wurde aus der Datenbank der Age-Related Eye Disease Study (AREDS) unter https://www.ncbi.nlm.nih.gov/gap/ über die dbGaP-Zugangsnummer phs000001.v3 bezogen. p1. Die finanzielle Unterstützung für AREDS erfolgte durch das National Eye Institute (N01-EY-0-2127). Wir möchten den AREDS-Teilnehmern und der AREDS-Forschungsgruppe für ihren wertvollen Beitrag zu dieser Forschung danken.

National Eye Institute (Fördernummer 1R41EY031632-01).

North Carolina State University, Raleigh, NC, 27695, USA

Omkar G. Kaskar & Landon Grace

Lumata Health, 1111 North Lee Ave, Oklahoma City, OK, 73103, USA

Elaine Wells-Gray

University of North Carolina at Chapel Hill, Chapel Hill, NC, 27599, USA

David Fleischman

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

LG war für das Design der Studie, die Datenerfassung und die Überarbeitung des Manuskripts verantwortlich. OGK hat die Daten vorbereitet und bereinigt, die Klassifikatoren entwickelt und war am Schreiben des Manuskripts beteiligt. EWG analysierte die Daten und war maßgeblich an der Entwicklung der Klassifikatoren und dem Verfassen des Manuskripts beteiligt. DF interpretierte die Daten, lieferte technische Anleitung bei der Auswahl der Daten zum Trainieren von Klassifikatoren und überarbeitete das Manuskript inhaltlich. Alle Autoren haben das Manuskript überprüft.

Korrespondenz mit Landon Grace.

Dr. Grace ist Beraterin und Anteilseignerin von Lumata Health, USA. Dr. Wells-Gray ist Vollzeitmitarbeiter von Lumata Health, USA. Dr. Fleischman und Omkar G. Kaskar erklären, dass kein potenzieller Interessenkonflikt besteht.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Kaskar, OG, Wells-Gray, E., Fleischman, D. et al. Bewertung von Klassifikatoren für maschinelles Lernen zur Entscheidungsunterstützung bei der Überweisung von Glaukomen in der Grundversorgung. Sci Rep 12, 8518 (2022). https://doi.org/10.1038/s41598-022-12270-w

Zitat herunterladen

Eingegangen: 27. Juli 2021

Angenommen: 18. April 2022

Veröffentlicht: 20. Mai 2022

DOI: https://doi.org/10.1038/s41598-022-12270-w

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.