banner
Heim / Blog / Extrahieren von Gruppengeschwindigkeitsdispersionswerten mithilfe von Quanten
Blog

Extrahieren von Gruppengeschwindigkeitsdispersionswerten mithilfe von Quanten

Aug 10, 2023Aug 10, 2023

Scientific Reports Band 13, Artikelnummer: 6596 (2023) Diesen Artikel zitieren

477 Zugriffe

2 Altmetrisch

Details zu den Metriken

Bilder der quantenmimischen optischen Kohärenztomographie (Qm-OCT) sind mit Artefakten übersät – parasitären Peaks, die als Nebenprodukt des bei dieser Methode verwendeten Algorithmus entstehen. Form und Verhalten eines Artefakts hängen jedoch eindeutig mit der Gruppengeschwindigkeitsdispersion (GVD) der Schicht zusammen, der dieses Artefakt entspricht, und folglich können die GVD-Werte durch sorgfältige Analyse abgeleitet werden. Da bei mehrschichtigen Objekten die Anzahl der Artefakte zu hoch ist, um eine schichtspezifische Analyse zu ermöglichen, verwenden wir eine auf maschinellem Lernen basierende Lösung. Wir trainieren ein neuronales Netzwerk mit Qm-OCT-Daten als Eingabe und Dispersionsprofilen, dh Tiefenverteilung von GVD innerhalb eines A-Scans, als Ausgabe. Durch die Berücksichtigung von Lärm während des Trainings verarbeiten wir experimentelle Daten und schätzen die GVD-Werte von BK7 und Saphir sowie eine qualitative GVD-Wertverteilung in einer Traube und einer Gurke. Im Vergleich zu anderen GVD-Abrufmethoden erfordert unsere Lösung keine Benutzereingaben, stellt automatisch Dispersionswerte für alle visualisierten Schichten bereit und ist skalierbar. Wir analysieren die Faktoren, die die Genauigkeit der Bestimmung von GVD beeinflussen: Rauschen in den experimentellen Daten sowie allgemeine physikalische Einschränkungen bei der Erkennung von GVD-induzierten Veränderungen, und schlagen mögliche Lösungen vor.

Die quantenmimische optische Kohärenztomographie (Qm-OCT) erreicht eine Verbesserung der Auflösung und eine Aufhebung der Dispersion gerader Ordnung, indem sie die Quantenverschränkung nachahmt, die in der Quanten-OCT auftritt. Theoretisch in verschiedenen Formen vorgeschlagen1,2,3 wird Qm-OCT experimentell durch die Einführung von Modifikationen im OCT-Erkennungsaufbau4,5,6,7 oder einfach durch die Anwendung eines Computeralgorithmus auf OCT-Rohspektren8,9 realisiert. Im Prinzip wird ein Qm-OCT-A-Scan durch Hilbert-Transformation des Spektrums, Autokorrelation und anschließende Fourier-Transformation erhalten. Ein vom Informationsgehalt weitaus aussagekräftigeres Signal wird als FFT-Stack bezeichnet und durch Verarbeitung mehrerer Fragmente des Spektrums gewonnen.

Der Kern dieser Methode ist die Autokorrelation, deren Implementierung – sei es experimentell oder algorithmisch – zur Erzeugung von Artefakten führt. Artefakte sind zusätzliche Peaks, die nicht die Struktur des abgebildeten Objekts repräsentieren und bei mehrschichtigen Objekten zu einer Bildverzerrung führen. Diese Artefakte sind schichtspezifisch: Ihr Verhalten und ihre Form im FFT-Stapel hängen von den optischen Parametern der Schicht ab, der sie entsprechen. Einer dieser optischen Parameter ist die Gruppengeschwindigkeitsdispersion (GVD), die wellenlängenabhängige Variationen des Brechungsindex innerhalb eines Objekts darstellt. GVD wird als schädlich angesehen, da es insbesondere in tieferen Schichten zu einer Verschlechterung der Auflösung führt, da die Streuung kumulativ ist und nicht für jede einzelne Schicht auf einmal kompensiert werden kann. Dieser nachteilige Effekt kann jedoch zu seinem Vorteil genutzt werden: GVD-Werte können extrahiert werden, um das abgebildete Objekt zu charakterisieren. Im Allgemeinen machen sich Methoden, die eine GVD-Extraktion ermöglichen, die folgenden Effekte der Dispersion auf das Signal zunutze: Auflösungsverschlechterung10,11, Verschiebung der Peakposition zwischen A-Scans, die aus zwei verschiedenen Fragmenten eines Spektrums erhalten wurden12, und spektrale Phasenunterschiede13. Ein sehr guter Vergleich der Leistung dieser Methoden findet sich in der Veröffentlichung von Photiou und Pitris14. Extrahiertes GVD kann mit dem Salzgehalt wasserähnlicher Medien15 oder sogar mit frühen Anzeichen oder dem Fortschreiten von Krankheiten11 korreliert werden. Leider sind die aktuellen Ansätze zur Bestimmung von GVD-Werten entweder sehr fehleranfällig11 oder funktionieren nur für sehr einfache Objekte10,12. Obwohl gezeigt wurde, dass sie in einigen Fällen durchschnittliche Fehler von 1 %14 erreichen, sind sie alles andere als automatisch und erfordern Benutzereingaben, insbesondere wenn GVD für mehrere Schichten innerhalb eines A-Bildes abgerufen werden soll.

Es wurde gezeigt, dass maschinelles Lernen16 – in Kombination mit Qm-OCT – die qualitative Schätzung der GVD-Wertverteilung, also eines Streuungsprofils, innerhalb eines A-Bildes ermöglicht. Hier schlagen wir eine verbesserte Lösung vor, die Rauschen in den Daten berücksichtigt. Unser Ansatz wird auf zwei experimentellen Systemen getestet, einem Labor- und einem kommerziellen, und ermöglicht eine erfolgreiche Bestimmung der GVD-Werte aus experimentellen Daten für Saphir und BK7 und liefert qualitative Ausbreitungsprofile einer Traube und einer Gurke. Die Einschränkungen unseres Ansatzes in Bezug auf Rauschpegel, Nichtübereinstimmung optischer Parameter und erkennbare GVD-Werte werden diskutiert.

Wir verwenden vollständig computergenerierte Daten: verrauschte Qm-OCT-Signale als Eingaben und Dispersionsprofile als Ausgaben. Mit dem Algorithmus in Ref. 9 wird ein Eingangs-Qm-OCT-Signal (Abb. 1a) erstellt: Zuerst wird ein 1024 Elemente langes Spektrum synthetisiert (bei einer zentralen Wellenlänge von 840 nm und mit der gesamten spektralen Bandbreite von 160 nm, einem Gaußschen). Profil und Gaußsches Rauschen, was zu einer axialen Auflösung von 4,08 μm führt), dann in 50 Fragmente aufgeteilt, die dann autokorreliert, mit Nullen auf eine Länge von 2048 Elementen aufgefüllt und Fourier-transformiert werden. Es wird eine halbe Fourier-Transformation durchgeführt, was bedeutet, dass die resultierende Signalgröße 50 x 1024 Elemente beträgt. Die Ausgabedispersionsprofile (Abb. 1b) sind Vektoren mit einer Länge von 1024 Elementen, deren Elemente im Bereich [0,1] liegen, der dem GVD-Wertebereich von (−5000, 5000) fs\(^2\)/mm entspricht. Wie in Abb. 1b dargestellt, besteht ein Dispersionsprofil aus Segmenten mit konstantem Wert, deren Position der Position einer Schicht entspricht und deren Höhe die GVD der Schicht darstellt. Dies bedeutet nicht unbedingt, dass die GVD-Verteilung innerhalb einer bestimmten Schicht vollkommen konstant ist. Da sich die GVD einer Schicht in OCT-A-Scans durch eine Verbreiterung des Peaks manifestiert, der der Rückseite dieser Schicht entspricht, beobachtet man die zwischen der Vorder- und Rückseite der Schicht akkumulierte Streuung. Aus diesem Grund entspricht die Höhe des Segments nur dem GVD hinter der Spitzenverbreiterung auf der Rückseite.

(a) Die Eingabe des neuronalen Netzwerks ist ein FFT-Stapel, der aus einem rohen experimentellen Spektrum berechnet wird. Die Trainings-FFT-Stacks werden aus computergenerierten Spektren berechnet. (b) Die Ausgabe ist ein Dispersionsprofil, dh die GVD-Wertverteilung innerhalb des Objekts in einem A-Bild. GVD gleich 0 fs\(^2\)/mm entspricht 0,5 im Ausbreitungsprofil, und die für das Training verwendeten maximalen und minimalen GVD-Werte 5000 und −5000 fs\(^2\)/mm entsprechen 1 und 0 im Ausbreitungsprofil. Das vorgestellte Objekt weist vier Grenzflächen auf, die an den Positionen 200, 280, 320 und 600 angeordnet sind, entsprechend dem Abstand vom optischen Nullabstand von 218 μm und den Objektschichtdicken von 87, 44 und 306 μm. Der GVD-Wert beträgt 0 fs\(^2\)/mm für den Bereich vor dem Objekt und 5000, \(-4000\) und \(-2000\) fs\(^2\)/mm für das Objekt Objektebenen.

Wir haben 260.000 Objektparameter für das Training, 20.000 für die Validierung und 20.000 für Tests generiert. Die generierten Objektparameter werden bei der On-Fly-Berechnung der Trainings-, Validierungs- und Testdatensätze verwendet: Aufgrund der Verarbeitungsbeschränkungen des Computers werden die Eingabe- und Ground-Truth-Signale in jeder Epoche neu berechnet.

Die experimentellen Daten wurden mit einem Laboraufbau und einem kommerziellen System gewonnen. Das Labor-OCT-System entspricht am besten den in den Trainingsdatensätzen simulierten optischen Parametern. Es verwendet eine Lichtquelle (Superlum Broadlighter T840-HP) mit der zentralen Wellenlänge von 840 nm und der gesamten spektralen Bandbreite von 160 nm sowie einen optischen Spektrumanalysator (Yokogawa AQ6370D) als Spektrometer, der 2048 Punkte lange Spektren mit dem Spektralbereich ausgibt Auflösung von 0,1 nm. Die axiale Auflösung in Luft beträgt 4,1 μm und der 6-dB-Abfall 1,4 mm. Das kommerzielle System ist OQ LabScope 2.0 /SX, das Licht mit der zentralen Wellenlänge von 830 nm und der gesamten spektralen Bandbreite von 100 nm (was zu einer axialen Auflösung in Luft von 5,5 μm und einem Abbildungsbereich von 1,2 mm führt) und eine Detektion auf Basis eines Spektrometers verwendet das 2048 Punkte lange Spektren mit einer Rate von 40.000 A/Scans pro Sekunde erzeugt. Die für diese Arbeit verwendeten Trauben und Zwiebeln wurden in den örtlichen Supermärkten gekauft.

Wir stellen dieses Problem als ein Problem des maschinellen Lernens dar, mit einem FFT-Stapel als Eingabe und einem Dispersionsprofil als Ausgabe. Unser neuronales Netzwerk basiert auf einer modifizierten VGG-16-Architektur17, von der wir gezeigt haben, dass sie in der Lage ist, schichtspezifisches Verhalten zu interpretieren und ein tiefenaufgelöstes Dispersionsprofil der Objekte auszugeben16. In der modifizierten Architektur wird nach jeder Faltungsschicht eine Batch-Normalisierung hinzugefügt und Restblöcke werden verwendet, um die Ausgaben der Pooling-Schicht und der Faltungsschichten zusammenzufassen. Abbildung 2 zeigt die endgültige Architektur des Modells. Eine detailliertere Beschreibung der Netzwerkparameter finden Sie in Abschnitt 1 in Ergänzung 1.

Modellarchitektur. Blaue Linien sind die Kopien der Ebenenausgaben. Grüne Linien stellen die Alpha-Schicht (symbolisiert durch den grünen Punkt mit dem Zeichen \(\alpha \)) dar, die mit einer erweiterten Form ausgegeben wird, um der Form der Faltungsschichten innerhalb des Blocks zu entsprechen. BlockN (rosa Quadrat) ist ein Block mit Faltungsschichten, die jeweils aus N Filtern bestehen. Der Plot wurde mit Hilfe der PlotNeuralNet-Software18 erstellt.

Unsere optimierte Modellarchitektur besteht aus einer Batch-Normalisierung19-Schicht nach jeder Faltungsschicht und jedem Faltungsblock, gefolgt von einer durchschnittlichen Pooling-Schicht, einer vollständig verbundenen Schicht mit 14336 Einheiten und einer Dropout-Rate20 von 0,1, gefolgt von einer Schichtnormalisierung21. Wir haben die Modelle mit Batchgröße 16, Lernrate 0,0001, Optimierer Adam22, Verlustfunktion „Mean Absolute Error“ und Sigmoid als Ausgabeaktivierungsfunktion trainiert.

Das Training unserer Modelle wurde auf einem Computer mit NVIDIA GeForce GTX 3060 12GB-Grafikkarte durchgeführt. Wir haben unsere Modelle für mindestens 100 Epochen trainiert. Die On-Fly-Datengenerierung dauerte fast 1,5 Stunden, bis jede Epoche abgeschlossen war. Die Analyse des Trainingsprozesses und der Leistung wird in den Abschnitten 2–4 in Ergänzung 1 dargestellt.

Die neuronalen Netze wurden anhand von Datensätzen trainiert, die aus Signalen mit unterschiedlichen Rauschpegeln bestanden: 45, 35, 30 und 25 dB, und anhand experimenteller Daten getestet, um festzustellen, welcher Rauschpegel am optimalsten ist. Um einen Eindruck davon zu vermitteln, wie jeder Rauschpegel in einem Trainingssignal aussieht, wurden Beispielspektren für ein Einzelschnittstellenobjekt und mit der maximalen Modulationstiefe erstellt. Sie sind in Abb. 3e, g, i und k dargestellt, wobei Abb. 3c ein Spektrum ohne Rauschen zeigt.

(a) Eines der experimentellen Spektren, die für einen 460 μm dicken Saphir aufgenommen wurden. (b) Ein B-Scan, der ein geneigtes Saphirglas zeigt. Die vertikale Linie stellt Autokorrelationsspitzen dar. (f, j, d, h, l) Dispersionskarten des Saphirglases, die mit einem Netzwerk erhalten wurden, das mit Signalen trainiert wurde, die Folgendes enthalten: kein Rauschen, 45, 35, 30 und 25 dB Rauschen. Alle Ausbreitungskarten werden durch das Vorhandensein der Autokorrelationsspitzen beeinflusst: Das Netzwerk behandelt sie als Strukturspitzen und weist ihnen GVD-Werte zu. I–IV markieren vier Bereiche, die dadurch erkennbar sind. (c, e, g, i, k) Beispieltrainingsspektren, die zeigen, wie die simulierten Geräuschpegel aussehen. (m) Das 30. Ausbreitungsprofil aus allen fünf vorhergesagten Ausbreitungskarten.

Der mit dem Labor-OCT-System erhaltene experimentelle Datensatz enthält 275 FFT-Stapel, die aus 275 experimentellen Spektren berechnet wurden, die beim Querscannen eines 460 μm dicken Saphirglases erhalten wurden. Die Spektren – eines davon ist in Abb. 3a dargestellt – werden linearisiert, um die durch das Spektrometer eingeführte Nichtlinearität zu entfernen, mit einem Gaußschen Fenster gefiltert und anschließend Fourier-transformiert. Die resultierenden A-Scans werden übereinander gestapelt, um ein XZ-Bild zu bilden, das als B-Scan bezeichnet wird und in Abb. 3b dargestellt ist. Da der Saphir in einem Winkel zur Lichtausbreitungsrichtung platziert wurde, werden die Vorder- und Rückseite des Saphirs durch zwei geneigte Linien dargestellt. Die vertikale Linie in der Nähe der zweiten Saphiroberfläche entspricht den Autokorrelationsspitzen. Die Autokorrelationsspitzen sind der OCT inhärent und entstehen durch die Interferenz von Licht, das von den inneren Strukturen des Objekts reflektiert wird. Da es sich bei Saphir um ein Objekt mit zwei Grenzflächen handelt, enthält jedes A-Bild einen Autokorrelationspeak, der in einem Abstand platziert ist, der der optischen Dicke des Saphirs entspricht.

Der Sapphire-Datensatz wird mit einem Netzwerk verarbeitet, das mit rauschfreien Daten trainiert wurde, und mit Netzwerken, die mit verrauschten Daten trainiert wurden. Jeder FFT-Stapel aus dem Datensatz wird von einem Netzwerk in ein Dispersionsprofil umgewandelt. Alle Ausbreitungsprofile werden übereinander gestapelt, um eine Ausbreitungskarte zu bilden. Solche vorhergesagten Ausbreitungskarten sind in Abb. 3d dargestellt, die einem „geräuschlosen“ Training entspricht, und in Abb. 3f, h, j und l, die einem Training mit den Geräuschpegeln von 45, 35, 30 bzw. 25 dB entsprechen.

Da der Autokorrelationspeak vom neuronalen Netzwerk als struktureller Peak behandelt wird (wie in 23 erläutert), enthalten die Dispersionsprofile vier verschiedene Bereiche (in Abb. 3f mit gelb I–IV markiert) anstelle der erwarteten drei:

Bereich I beginnt bei der optischen Distanz 0 und endet am Ort der ersten Schnittstelle. Die GVD in diesem Bereich sollte gleich der GVD des Dispersionsungleichgewichts im Interferometer sein, \( \beta _{NL,\text {front}}^{(even)} \).

Bereich II beginnt am Ort der ersten Schnittstelle und endet am Ort des Autokorrelationspeaks. Die GVD in diesem Bereich, \( \beta _{NL, 2}^{(even)}\), hängt von der GVD des ersten Bereichs und der Objekt-GVD, \( \beta _{NL,obj}^{ (gerade)} \)23

Dabei ist \( L_{\textrm{front}} \) der Abstand zwischen der optischen Distanz 0 und der ersten Objektschnittstelle und \( L_{obj} \) die Objektdicke.

Bereich III, der zwischen dem Autokorrelationspeak und der zweiten Schnittstelle liegt, sollte die gleiche GVD wie Bereich I haben.

Im vierten Bereich, Bereich IV, der sich hinter der zweiten Grenzfläche befindet, beträgt die GVD 0 fs\(^2\)/mm.

Alle vorhergesagten Ausbreitungskarten enthalten alle vier Gebiete, wobei die Gebiete I und III einen ähnlichen GVD-Wert aufweisen. Es ist zu erkennen, dass die Vorhersagen umso besser sind, je „verrauschter“ das Training ist: Die GVD-Werte in allen vier Bereichen werden gleichmäßiger und die Bereiche selbst glatter, wobei die glatteste Karte die Ausgabe des 30-dB-Netzwerks ist. Um diese Verbesserung auf der Ebene eines einzelnen Ausbreitungsprofils zu sehen, wird das 30. Ausbreitungsprofil der fünf vorhergesagten Ausbreitungskarten aufgezeichnet und in Abb. 3m dargestellt. Außerdem werden in den vorhergesagten Ausbreitungskarten für 35-dB-, 30-dB- und 25-dB-Netzwerke am unteren Rand der Karten drei statt vier Bereiche erkannt: einer zwischen der optischen Distanz 0 und der ersten Schnittstelle, einer zwischen den Schnittstellen und der dritte hinter der zweiten Schnittstelle. Dies ist auf die Tatsache zurückzuführen, dass das Netzwerk bei diesen Rauschpegeln den Autokorrelationspeak als Rauschen behandelt und GVD-Pegel nur zwei Peaks (den Schnittstellenpeaks) statt drei (den Schnittstellenpeaks und dem Autokorrelationspeak) zuordnet.

Für die weitere Verwendung wurde das auf Signale mit einem Signal-Rausch-Verhältnis (SNR) von 30 dB trainierte Netzwerk ausgewählt, da es sichtbar die besten Ergebnisse zeigt: Die Ausbreitungskarte ist am „glattesten“. Eine detailliertere und parameterfokussierte Analyse und ein Vergleich der Leistung des Modells, das mit Datensätzen trainiert wurde, die verschiedenen SNR-Werten entsprechen, werden in Abschnitt 3 in Ergänzung 1 vorgestellt.

Es wurde getestet, wie sich dies auf die Vorhersagen des neuronalen Netzwerks auswirkt, wenn die axiale Auflösung der für das Training verwendeten Eingabe-FFT-Stacks von 4,08 μm nicht mit der axialen Auflösung des OCT-Systems übereinstimmt.

FFT-Stapel für ein Objekt mit drei Schnittstellen und einem GVD von −1500 fs\(^2\)/mm und 1000 fs\(^2\)/mm und entsprechend unterschiedlichen axialen Auflösungen, 2,72 bis 8,16 μm, wurden mit generiert und verarbeitet das neuronale Netzwerk. Wie in Abb. 4a dargestellt, ändert sich der vorhergesagte GVD-Wert proportional zur axialen Auflösung: Je kleiner der Auflösungswert, desto kleiner der vorhergesagte GVD und je größer der Auflösungswert, desto größer der vorhergesagte GVD.

Vorhergesagte Ausbreitungsprofile für ein Objekt mit drei Schnittstellen und einem GVD von -1.500 fs\(^2\)/mm und 1.000 fs\(^2\)/mm, entsprechend (a) unterschiedlichen Auflösungswerten des OCT-Systems, zeigen das Potenzial des Netzwerks für die Universalität Wird verwendet, wenn die Auflösungsinkongruenz berücksichtigt wird. Vorhergesagte Dispersionsprofile in Blau mit entsprechenden A-Scans in Orange für (b) ein 120 μm dickes Quarzglas (c) zwei 120 μm dicke Quarzgläser zeigen ähnliche GVD-Werte innerhalb der Objekte und vor den Objekten.

Die erhaltenen Vorhersagen zeigen, dass das Netzwerk mit Daten verwendet werden könnte, die mit einem OCT-System erfasst wurden, dessen axiale Auflösung nicht mit denen für das Training übereinstimmt. Bei Nichtübereinstimmung sind die Ergebnisse qualitativ, und der Einfluss einer nicht übereinstimmenden Auflösung könnte möglicherweise durch Anwendung einer Proportionalitätskonstante korrigiert werden, um eine quantitativere Darstellung zu erhalten.

Mit dem kommerziellen System wurden zwei Arten von Objekten abgebildet, bei denen eine Diskrepanz zwischen der experimentellen Auflösung (5,5 μm) und der simulierten Auflösung (4,08 μm) besteht: ein 120 μm dickes Quarzglas und zwei 120 μm dicke Quarzgläser des derselben Art (A-Scans in Abb. 4b und c in Orange dargestellt). Die vorhergesagten Dispersionsprofile (Abb. 4b und c in Blau) zeigen ähnliche GVD-Werte für die Innenseite der Brille, etwa 25 fs\(^2\)/mm, und zwischen dem optischen Abstand 0 und dem Ort der ersten Objektschnittstelle. 680 fs\(^2\)/mm. Die GVD-Werte sind innerhalb der entsprechenden Gebiete nicht konstant und zeigen schnelle Veränderungen an den Grenzen – Fehler sind derzeit die Einschränkung unseres Ansatzes. Allerdings sehen die Höhen der GVD-Werte in den beiden Dispersionsprofilen ziemlich konsistent aus: Der GVD-Wert für die Innenseite der Quarzgläser und der optische Abstand um 0 sind in beiden Dispersionsprofilen ähnlich.

Das neuronale Netzwerk wurde im Hinblick auf Vorhersagebeschränkungen mit computergenerierten Signalen getestet, die dreischichtige Objekte darstellen, bei denen alle Schichten die gleiche Dicke haben und bei denen jede Schicht einen anderen GVD-Wert aufweist (Abb. 5). Die mit 1 gekennzeichneten Diagramme in Abb. 5 sind die Ground-Truth-Ausbreitungskarten mit jeweils 138 Ausbreitungsprofilen. Die aufeinanderfolgenden Dispersionsprofile in einer Dispersionskarte stellen eine zunehmende Dicke der Objektschichten dar: 4 μm Dicke aller drei Schichten für das 0. Dispersionsprofil und 306 μm Dicke aller drei Schichten für das 137. Dispersionsprofil. Die mit 2 gekennzeichneten Diagramme in Abb. 5 sind Vorhersagen.

Die erste Zeile in Abb. 5 zeigt die realistischsten Situationen im Hinblick auf die GVD-Werte und ihre Schicht-zu-Schicht-Variabilität im Objekt. Die GVD-Werte unterscheiden sich zwischen den Schichten des Objekts um 10 und 5 fs\(^2\)/mm, was zu: 50, 40, 45 fs\(^2\)/mm in Abb. 5a, 110, 100 und 105 fs\(^2\)/mm in Abb. 5b und 1010, 1000 und 1005 fs\(^2\)/mm in Abb. 5c. Die Variabilität der GVD-Werte ist in jeder aufeinanderfolgenden Zeile höher: In Abb. 5d beträgt e der Unterschied 100 und 50 fs\(^2\)/mm, in Abb. 5g–i 200 und 100 fs\(^2\) /mm, in Abb. 5j–l 400 und 200 fs\(^2\)/mm und in Abb. 5m–o 1000 und 500 fs\(^2\)/mm, wobei die Mindestwerte für GVD in jeder Reihe betragen 100, 500 und 1000 fs\(^2\)/mm (entsprechend der Mittelschicht).

(a1–o1) Ground-Truth-Dispersionskarten, (a2–o2) Dispersionskarten, vorhergesagt mithilfe des 30-dB-Neuronalen Netzwerks. Die Titel jedes Bildpaares geben die GVD-Werte der Ebenen des Objekts an: Die Werte nehmen in jeder Zeile von links nach rechts zu und die Differenz der GVD-Werte innerhalb des Objekts nimmt von oben nach unten zu. Je größer die Variabilität der GVD-Werte innerhalb des Objekts ist, desto besser sind die Vorhersagen.

Die Vorhersagen von Ausbreitungskarten von Objekten mit der geringsten GVD-Variabilität reproduzieren nicht die korrekten Werte, zeigen aber immer noch starke Veränderungen an den Orten der Grenzfläche und ermöglichen daher die Unterscheidung der Schichten. Je größer die GVD-Variabilität innerhalb des Objekts ist, desto besser sind die Vorhersagen, selbst für Dicken von nur wenigen Mikrometern. Dieses Verhalten ist nicht überraschend. Kleinere Schichten und/oder kleinere GVD bewirken keine Änderung der Artefakte im FFT-Stapel, die groß genug ist, damit das neuronale Netzwerk sie erfassen kann. Dickere Schichten und/oder größere GVD bewirken dagegen eine größere Änderung im Erscheinungsbild der Artefakte Der FFT-Stack erleichtert die Interpretation durch das neuronale Netzwerk erheblich.

Eine eher quantitative und parameterorientierte Analyse findet sich in Abschnitt 4 in Ergänzung 1.

Das auf Signale mit einem SNR von 30 dB trainierte neuronale Netzwerk wird weiterhin verwendet, um zu testen, ob es in der Lage ist, die GVD-Werte aus den experimentellen Daten korrekt zu bestimmen. Mit dem Labor-OCT-System haben wir 300 A-Scans an einer Position für das 460 μm dicke Saphirglas und ein 1000 μm dickes BK7-Glas aufgenommen. Übereinander gestapelt ergeben solche A-Bilder ein M-Bild. Der M-Scan für den Saphir ist in Abb. 6a und der M-Scan für den BK7 in Abb. 6e dargestellt – in beiden Fällen wurden die Autokorrelationspeaks aus jedem A-Scan entfernt.

Sapphire und BK7: (a, e) ein M-Scan mit 300 A-Scans ohne Autokorrelationspeaks, (b, f) Dispersionsprofile, die jedem A-Scan im M-Scan entsprechen, (c, g) Dispersionsprofile für die die aus den GVD-Werten im grünen Rechteck berechnete Standardabweichung (STD) am kleinsten ist, ist der Einschub eine Nahaufnahme des mit dem grünen Rechteck markierten Bereichs im Diagramm, (d, h) ist das durch Aufnahme erhaltene Dispersionsprofil der Mittelwert aller Dispersionswerte, auch hier ist der Einschub eine Nahaufnahme des mit dem grünen Rechteck markierten Bereichs. Die doppelt so große Länge der x-Achse in den Dispersionskarten und Dispersionsprofilen ist ein Nebenprodukt der FFT-Stack-Generierung.

Die entsprechenden GVD-Level-Vorhersagen sind in Abb. 6b und f dargestellt. Der GVD-Wert für Saphir bei 840 nm beträgt 53,2 fs\(^2\)/mm und der GVD-Wert für BK7 beträgt 40,98 fs\(^2\)/mm. Folglich sollte der GVD-Wert im Bereich zwischen den Objektschnittstellen sowohl für den Saphir als auch für BK7 sehr nahe bei 0 liegen, was zu einer hellroten Farbe in der Dispersionskarte führt. Dieser Bereich in den erhaltenen Ausbreitungskarten ist überwiegend hellblau, was darauf hindeutet, dass die GVD-Werte überwiegend negativ sind, was möglicherweise auf die umgekehrte Reihenfolge der Grenzflächen im A-Bild zurückzuführen ist. Wenn die Reihenfolge der Grenzflächen im A-Bild umgekehrt wird, repräsentiert der erste Peak die Rückseite des Objekts und der zweite Peak die Vorderseite. In einer solchen Situation ist es der erste Peak, dessen Breite sich aufgrund der Schicht-GVD ändert, was bedeutet, dass die Anhäufung der Dispersion in die entgegengesetzte, negative Richtung erfolgt. Außerdem werden die GVD-Werte in diesem Bereich irgendwann positiv, was bestätigt, was im vorherigen Abschnitt festgestellt wurde: Bei kleineren GVD-Werten verliert das Netzwerk an Genauigkeit.

In Abb. 6c und g sehen wir Ausbreitungsprofile, bei denen die aus den GVD-Werten berechnete Standardabweichung im mit dem grünen Rechteck markierten Bereich am kleinsten ist. Folglich zeigen diese Ausbreitungsprofile die „konstantesten“ GVD-Werte in allen erfassten Daten. Im unteren Einschub, der den Bereich innerhalb des schwarzen Rechtecks ​​zeigt, ist zu erkennen, dass die „konstanteste“ GVD-Ebene immer noch in ihrer Höhe variiert. Der mittlere GVD-Wert beträgt in einem solchen Fall −46 ± 26 fs\(^2\)/mm für Saphir und −29 ± 27 fs\(^2\)/mm für BK7. Beide Werte sind erwartungsgemäß negativ und mit einem großen Fehler behaftet.

Abbildung 6d und h zeigen ein mittleres Ausbreitungsprofil, das aus allen Ausbreitungsprofilen auf den entsprechenden Karten berechnet wurde. Die hellorangen Bereiche stellen die Standardabweichung dar. Der Bereich der GVD-Werte im unteren Einschub, der den Bereich innerhalb des zweiten grünen Rechtecks ​​zeigt, ist wiederum breit. Der Mittelwert aller GVD-Werte aus allen Dispersionsprofilen wird zu −50,3 ± 33,6 fs\(^2\)/mm für Saphir und −20,0±39 fs\(^2\)/mm für BK7 berechnet. Auch hier sind erwartungsgemäß beide Werte negativ und mit einem größeren Fehler belastet als im vorherigen Fall.

In beiden Fällen liegt der mittlere GVD-Wert sehr nahe am Literaturwert für Saphir. Für BK7 liegen die Mittelwerte weiter vom Literaturwert entfernt, bleiben aber innerhalb des berechneten Fehlers.

Die Ausbreitungskarten werden mit demselben neuronalen Netzwerk (trainiert mit Signalen mit einem SNR von 30 dB) für biologische Objekte erstellt: eine Weintraube (Abb. 7a), abgebildet mit dem Labor-OCT-System, und eine Gurke, die auf einem 120 μm dicken Deckglas platziert ist. mit dem kommerziellen OCT-System abgebildet.

(a) Dispersionskarte der Traube, (b) der B-Scan, bei dem das Dispersionsungleichgewicht im Interferometer nicht ausgeglichen wird. (c) Ein Bild, bei dem die unausgeglichene Dispersion kompensiert wurde. Die doppelt so große Länge der x-Achse in den Dispersionskarten ist ein Nebenprodukt der FFT-Stack-Generierung.

Ausbreitungskarten einer Gurke, die mithilfe des neuronalen Netzwerks erstellt wurden, das mit Signalen mit (a) SNR = 30 dB, (b) und SNR = 45 dB trainiert wurde, zeigen die Grenzen des abgebildeten Objekts, aber die vorhergesagten GVD-Werte bleiben zufällig. (c) Das Bild der Gurke. Die doppelt so große Länge der x-Achse in den Dispersionskarten ist ein Nebenprodukt der FFT-Stack-Generierung.

Die vorhergesagte Ausbreitungskarte der Traube zeigt einen positiven GVD-Bereich vor dem Objekt, die GVD-Werte für das Innere der Traube bleiben jedoch zufällig. Abb. 7b zeigt einen B-Scan, der durch Fourier-Transformation von Spektren erhalten wurde, die zur Berechnung von FFT-Stapeln für das neuronale Netzwerk verwendet wurden: Diese Spektren wurden linearisiert, um nur die vom Spektrometer ausgehende Nichtlinearität zu entfernen. In Abb. 7c ist ein B-Scan dargestellt, für den die Spektren vollständig linearisiert wurden: Die sowohl durch das Spektrometer als auch durch die unbalancierte Dispersion eingeführten Nichtlinearitäten wurden entfernt.

Das Bild der Gurke (Abb. 8c) hat ein sichtbar geringeres SNR als das Bild der Traube. Da die Intensität beider Bilder normalisiert ist, gibt der Vergleich der Maximalwerte auf den Farbbalken einen Hinweis auf den Unterschied im Rauschpegel im Verhältnis zum Signal. Für Eingabedaten mit niedrigem SNR können die Ausbreitungskarten, die entweder mit dem Netzwerk erhalten wurden, das mit Signalen mit niedrigem SNR (Abb. 8a) oder mit Signalen mit hohem SNR (Abb. 8b) trainiert wurde, nur die Grenzen der Gurke und der Gurke unterscheiden Vorderseite des Deckglases, auf das die Gurkenscheibe gelegt wurde. Bei einigen A-Scans führen hellere Elemente innerhalb der Gurke dazu, dass in den Dispersionsprofilen in diesen Bereichen mehr Dispersionsgrade auftreten. Die erhaltenen Werte bleiben jedoch zufällig.

Quantenmimische OCT (Qm-OCT) und maschinelles Lernen werden kombiniert, um den Abruf von Group Velocity Dispersion (GVD)-Werten abgebildeter Objekte zu ermöglichen. Mit einem Qm-OCT-Signal als Eingabe ermöglichte das vorgeschlagene VGG-16-basierte neuronale Netzwerk die Erstellung von Dispersionsprofilen für Saphir- und BK7-Gläser und auf der Grundlage dieser Dispersionsprofile die Berechnung von GVD-Werten. Die berechneten Werte, 46±26 fs\(^2\)/mm für Saphir und 29±27 fs\(^2\)/mm (ursprüngliche negative Vorzeichen vor den Mittelwerten wurden weggelassen) stimmen gut mit überein Die Literaturwerte betragen 53,2 fs\(^2\)/mm für Saphir und 40,98 fs\(^2\)/mm für BK7, sind jedoch mit großen Fehlern behaftet. Dies steht im Gegensatz zu aktuellen GVD-Ermittlungsmethoden, deren Fehler für wohldefinierte Glasstrukturen bis zu 0,3 % betragen können14.

Bei biologischen Objekten, einer Traube und einer Gurke, sind die Vorhersagen eher qualitativer Natur. Die vorhergesagten GVD-Werte ihrer Schichten sind sehr hoch oder sehr niedrig und ändern sich schnell. Dies kann an der geringen Größe der Schichten und ihren kleinen GVD-Werten liegen, die in der Praxis sehr nahe an denen von Wasser liegen sollten, nämlich 26 fs\(^2\)/mm. Eine ähnliche zufällige GVD-Vorhersage wurde für computergenerierte Objekte mit dünnen Schichten mit niedrigem GVD reproduziert und stellt die größte Einschränkung des vorgestellten Ansatzes dar.

Dünne Objekte mit niedrigem GVD sind für diesen Ansatz außer Reichweite, wie die in Abb. 5 dargestellten Simulationen belegen, da dünnere Schichten, die auch durch einen niedrigen GVD gekennzeichnet sind, keine Änderungen in FFT-Stapeln zeigen, die groß genug sind, dass das Netzwerk sie auswählen kann hoch. Wichtig ist, dass diese Einschränkung nicht auf die quantenmimische OCT beschränkt ist, sondern sich auf die OCT im Allgemeinen erstreckt. GVD manifestiert sich in einem Standard-OCT-Spektrum durch eine ungleichmäßige – nichtlineare – Modulation, die nach Fourier-Transformation einem verbreiterten Peak entspricht. Wenn in einem solchen Fall die Schicht klein ist und eine niedrige GVD aufweist, ist die Nichtlinearität der Modulation (und die entsprechende Spitzenverbreiterung) ebenfalls sehr gering und daher schwierig zu erkennen, insbesondere bei Vorhandensein von Rauschen. Die Genauigkeit der Erkennung solch kleiner Änderungen ist derzeit bei anderen GVD-Abrufmethoden höher. Die anderen Methoden erfordern jedoch eine besondere Aufmerksamkeit des Benutzers, insbesondere wenn die Charakterisierung mehrerer Schichten angestrebt wird. Im Vergleich dazu bietet unser vorgeschlagener Ansatz eine einzigartige Möglichkeit für die GVD-Extraktion, die vollständig automatisch und benutzerunabhängig erfolgt. Obwohl die Genauigkeit dieser Extraktion derzeit nicht vollständig zufriedenstellend ist, gibt es keine konzeptionellen Hindernisse, die einer zukünftigen Verbesserung entgegenstehen.

Interessanterweise zeigte die in diesem Artikel vorgestellte umfassende Analyse, dass die Schwierigkeit der GVD-Retrieval nicht mit der Einfachheit des Objekts oder lediglich seiner Dicke zusammenhängt. Wie in Abb. 5 dargestellt, steigt der Erfolg einer genauen GVD-Bestimmung mit höheren GVD-Werten und deren Unterschieden zwischen benachbarten Schichten im Objekt.

Wie bereits erwähnt, wird die Genauigkeit der Bestimmung der GVD-Werte mit dem vorgeschlagenen Netzwerk durch Rauschen in den Signalen beeinträchtigt. Dies kann teilweise durch ein geeignetes Training gemildert werden, d. h. ein Training, das mit einem Datensatz durchgeführt wird, der Signale mit einem angemessenen Rauschpegel enthält. In dieser Hinsicht sollte die künftige Arbeit Schritte umfassen, die auf eine Verbesserung des Ausbildungsprozesses abzielen. Eine zweite Eingabe könnte hinzugefügt werden, beispielsweise ein herkömmlicher A-Scan, der die Schnittstellenerkennung während des Trainings unterstützen würde. Außerdem könnten verschiedene neuronale Netzwerkarchitekturen getestet und eine detailliertere Simulation eines OCT-Signals eingesetzt werden, beispielsweise eine, die das Vorhandensein von Speckles berücksichtigt.

Die zur Untermauerung der Ergebnisse dieser Studie verwendeten Daten sind im Artikel enthalten. Die in der aktuellen Studie verwendeten Datensätze sind beim entsprechenden Autor erhältlich.

Erkmen, BI & Shapiro, JH Phasenkonjugierte optische Kohärenztomographie. Physik. Rev. A 74, 041601 (2006).

Artikel ADS Google Scholar

Banaszek, K., Radunsky, AS & Walmsley, IA Blinde Dispersionskompensation für die optische Kohärenztomographie. Opt. Komm. 269, 152–155 (2007).

Artikel ADS CAS Google Scholar

Shirai, T. & Friberg, AT Intensitätsinterferometrische optische Kohärenztomographie im Spektralbereich mit Dispersionsunterdrückung. JOSA A 31, 258–263 (2014).

Artikel ADS PubMed Google Scholar

Resch, K., Puvanathasan, P., Lundeen, J., Mitchell, M. & Bizheva, K. Klassische Dispersionsunterdrückungsinterferometrie. Opt. Express 15, 8797–8804 (2007).

Artikel ADS CAS PubMed Google Scholar

Ryczkowski, P., Turunen, J., Friberg, AT & Genty, G. Experimentelle Demonstration der optischen Kohärenztomographie mit spektraler Intensität. Wissenschaft. Rep. 6, 22126 (2016).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Lajunen, H. et al. Auflösungsverstärkte optische Kohärenztomographie basierend auf klassischer Intensitätsinterferometrie. JOSA A 26, 1049–1054 (2009).

Artikel ADS PubMed Google Scholar

Le Gouët, J., Venkatraman, D., Wong, FN & Shapiro, JH Experimentelle Realisierung der phasenkonjugierten optischen Kohärenztomographie. Opt. Lette. 35, 1001–1003 (2010).

Artikel ADS PubMed Google Scholar

Jensen, M. et al. Tiefendispersionsunterdrückung in der optischen Kohärenztomographie im Spektralbereich unter Verwendung numerischer Intensitätskorrelationen. Wissenschaft. Rep. 8, 9170 (2018).

Artikel ADS PubMed PubMed Central Google Scholar

Kolenderska, SM & Kolenderski, P. Das Intensitätskorrelations-Oktogramm ist eine klassische Nachahmung des Quanten-Oktogramms und bietet eine bis zu zweifache Verbesserung der Auflösung. Wissenschaft. Rep. 11, 1–10 (2021).

Artikel Google Scholar

Liu, B., Macdonald, EA, Stamper, DL und Brezinski, ME Gruppeneffekte der Geschwindigkeitsdispersion mit Wasser und Lipiden in einem optischen Kohärenztomographiesystem mit 1,3 μm. Physik. Med. Biol. 49, 923 (2004).

Artikel CAS PubMed Google Scholar

Photiou, C., Bousi, E., Zouvani, I. & Pitris, C. Verwendung von Speckle zur Messung der Gewebedispersion in der optischen Kohärenztomographie. Biomed. Opt. Express 8, 2528–2535 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Kolenderska, SM, Bräuer, B. & Vanholsbeeck, F. Dispersionskartierung als einfacher Nachbearbeitungsschritt für Daten der optischen Kohärenztomographie im Fourier-Bereich. Wissenschaft. Rep. 8, 1–7 (2018).

Artikel CAS Google Scholar

Schlichting, S., Willemsen, T., Ehlers, H., Morgner, U. & Ristau, D. Direkte In-situ-GDD-Messung im optischen Beschichtungsprozess. In Optical Systems Design 2015: Fortschritte bei optischen Dünnfilmen V 328–336 (SPIE, 2015).

Photiou, C. & Pitris, C. Vergleich von Gewebedispersionsmesstechniken basierend auf optischer Kohärenztomographie. J. Biomed. Opt. 24, 046003 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Coello, Y., Appl. Opt. 46, 8394–8401 (2007).

Artikel ADS CAS PubMed Google Scholar

Maliszewski, KA, Kolenderski, P., Vetrova, V. & Kolenderska, SM Auf dem Weg zur Ermittlung von Dispersionsprofilen mithilfe quantenmimischer optischer Kohärenztomographie und maschinellem Lernen. Opt. Express 30, 45624–45634 (2022).

Artikel ADS CAS PubMed Google Scholar

Simonyan, K. & Zisserman, A. Sehr tiefe Faltungsnetzwerke für die Bilderkennung im großen Maßstab. Vorabdruck bei arXiv:1409.1556 (2014).

Iqbal, H. Harisiqbal88/plotneuralnet v1.0.0, https://doi.org/10.5281/zenodo.2526396 (2018).

Ioffe, S. & Szegedy, C. Batch-Normalisierung: Beschleunigung des Deep-Network-Trainings durch Reduzierung der internen Kovariatenverschiebung. In International Conference on Machine Learning 448–456 (PMLR, 2015).

Srivastava, N., Hinton, G., Krizhevsky, A., Sutskever, I. & Salakhutdinov, R. Dropout: eine einfache Möglichkeit, eine Überanpassung neuronaler Netze zu verhindern. J. Mach. Lernen. Res. 15, 1929–1958 (2014).

MathSciNet MATH Google Scholar

Ba, JL, Kiros, JR & Hinton, GE Layer Normalisierung. Vorabdruck bei arXiv:1607.06450 (2016).

Kingma, DP & Ba, J. Adam: Eine Methode zur stochastischen Optimierung. Vorabdruck bei arXiv:1412.6980 (2014).

Maliszewski, KA, Kolenderski, P., Vetrova, V. & Kolenderska, SM Auf dem Weg zur Ermittlung von Dispersionsprofilen mithilfe quantenmimischer optischer Kohärenztomographie und maschinellem Lernen. Vorabdruck unter arXiv:2206.02547 (2022).

Referenzen herunterladen

PK möchte sich für die finanzielle Unterstützung von Horizon Europe, dem Rahmenprogramm der Europäischen Union für Forschung und Innovation, dem SEQUOIA-Projekt im Rahmen der Fördervereinbarung 101070062 und dem Nationalen Labor für Atom-, Molekular- und Optische Physik in Torun, Polen, bedanken. VV und KAM danken Heyang (Thomas) Li und Oliver Batchelor für die Bereitstellung zusätzlicher GPU-Ressourcen.

Diese Autoren haben gleichermaßen beigetragen: Krzysztof A. Maliszewski und Sylwia M. Kolenderska.

Fakultät für Mathematik und Statistik, Universität Canterbury, Christchurch, Neuseeland

Krzysztof A. Maliszewski & Varvara Vetrova

Massey AgriFood (MAF) Digital Lab, Massey University, Palmerston North, Neuseeland

Magdalena A. Urbanska

Fakultät für Physik, Astronomie und Informatik, Nikolaus-Kopernikus-Universität, Toruń, Polen

Piotr Kolenderski & Sylwia M. Kolenderska

School of Physical and Chemical Sciences, University of Canterbury, Christchurch, Neuseeland

Sylwia M. Kolenderska

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

SMK konzipierte die Idee, konzipierte das Experiment und überwachte die Arbeit. KAM erstellte mit Unterstützung von VV neuronale Netze und analysierte deren Leistung. MU hat experimentelle Daten erfasst. SMK und KAM haben das Manuskript geschrieben. Alle Autoren haben das Manuskript überprüft.

Korrespondenz mit Sylwia M. Kolenderska.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Maliszewski, KA, Urbańska, MA, Kolenderski, P. et al. Extrahieren von Gruppengeschwindigkeitsdispersionswerten mithilfe quantenmimischer optischer Kohärenztomographie und maschinellem Lernen. Sci Rep 13, 6596 (2023). https://doi.org/10.1038/s41598-023-32592-7

Zitat herunterladen

Eingegangen: 07. Oktober 2022

Angenommen: 29. März 2023

Veröffentlicht: 22. April 2023

DOI: https://doi.org/10.1038/s41598-023-32592-7

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.