Verfahren und Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinearem stochastischem Verhalten专利检索-多层感知器前馈神经网络人工神经网络机器学习人工智能人工智能专利检索查询-专利查询网

Verfahren und Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinearem stochastischem Verhalten

阅读：722发布：2020-12-21

专利汇可以提供Verfahren und Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinearem stochastischem Verhalten专利检索，专利查询，专利分析的服务。并且Die Erfindung gibt eine Lösung zur Modellierung stochastischer nicht linearer dynamischer Systeme an, bei denen wenige Meßwerte der Einflußgröße vorliegen und die restlichen Werte der Zeitreihe modelliert werden müssen. Als Lösung wird eine spezifische Kombination eines nichtlinearen rekurrenten neuronalen prädiktiven Netzwerkes und eines linearen Fehlermodells vorgeschlagen, womit eine Vorhersage durchgeführt werden kann und die Anwendung von maximum likelihood Adaptionsregeln durchgeführt werden kann. Im Speziellen kann dazu das rekurrente neuronale Netzwerk mit Hilfe der Echtzeitrekurrenten Lernregel trainiert werden und das lineare Fehlermodell wird mit Hilfe der Fehlermodelladaptionsregel trainiert, die auf Basis der vorwärts-rückwärts Kalman-Filter-Gleichungen implementiert ist. Dieses Modell wird eingesetzt, um Werte des Glukose-Insulin-Metabolismus eines Diabetespatienten vorherzusagen. Die Anordnung realisiert die Kombination dieser beiden Modelle.，下面是Verfahren und Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinearem stochastischem Verhalten专利的具体信息内容。

权利要求

Verfahren zur neuronalen Modellierung eines dynamischen Systems mit nichtlinarem stochastischem Verhalten. mit folgenden Merkmalen:a) das Systemverhalten wird in Form von einer Zeitreihe (Z10) von mindestens einer Einflußgröße des Systems für eine Vorhersage modelliert;

b) die Einflußgröße wird als additive Kombination aus einer deterministischen Ausgangsgröße (y*) eines rekurrenten neuronalen Netzes (NN) und einem linear modellierten Systemfehler (ε) gebildet;

c) das rekurrente neuronale Netz wird an einem ersten Zeitpunkt mit dem Fehlermodelladaptionsfehler adaptiert, der als Differenz zwischen der am ersten Zeitpunkt gemessenen Einflußgröße (M70) des Systems und dem Systemfehler gebildet wird.

b) die modellierte Einflußgröße wird als additive Kombination aus einer deterministischen Ausgangsgröße (y*) eines rekurrenten neuronalen Netzes und einem linear modellierten Systemfehler (ε) gebildet;

c) das Modell (L) für die Modellierung des Systemfehlers (ε) wird mit dem als Differenz aus der dem Netz an einem ersten Zeitpunkt als Eingangsgröße zugeführten Einflußgröße und der Ausgangsgröße, welche das adaptierte Netz ausgibt, gebildeten Neuronenmodelladaptionsfehler, adaptiert.

Verfahren nach Anspruch 1 und 2

Verfahren nach einem der vorangehenden Ansprüche,a) bei dem der Systemfehler (ε) mit einem Kalmanfilter modelliert wird,

b) bei dem ein Fehlender Meßwert (V60) in der Zeitreihe mit Varianz unendlich modelliert wird;

c) und bei dem ein Meßwert in der Zeitreihe mit Varianz Null modelliert wird.

Verfahren nach Anspruch 3 oder 4 mit folgenden Systemgleichungen,

\begin{matrix} \begin{matrix} \begin{matrix} (1) & y_{t}^{*} {= f}_{w} {(y*}_{t-1} {,...,y}_{t-N}^{*} {,u}_{t}) \end{matrix} \\ \begin{matrix} (2) & x_{t} = i=1 K θ_{i} x_{t-i} {+ ε}_{t} \end{matrix} \\ \begin{matrix} (3) & y_{t} {= y}_{t}^{*} {+ x}_{t} {= f}_{w} {(y}_{t-1}^{*} {,...,y}_{t-N}^{*} {,u}_{t}) + i=1 K θ_{i} x_{t-i} {+ ε}_{t}, \end{matrix} \end{matrix} \end{matrix}

und der Meßwertgleichung

z_{t} = y_{t} + δ_{t}

mit:ε_t und δ_t: additives Rauschen. Hierbei wird die

\binom{*}{t}

: Antwort

y_t: Einflußgröße

x_t: Systemfehler

Verfahren nach einem der vorangehenden Ansprüche, bei dem das rekurrente neuronale Netz (NN) mit der Echtzeit Lernregel für neuronale Netze trainiert wird.

Verfahren nach einem der vorangehenden Ansprüche, bei dem das lineare Fehlermodell (L) mit vorwärts/rückwärts Kalman-Filtergleichungen adaptiert wird.

Verfahren nach einem der vorangehenden Ansprüche,a) bei dem als dynamisches System der Glucose/Insulin-Metabolismus eines Diabetes Patienten modelliert wird,

b) und bei dem als Einflußgröße mindestens der Glucosespiegel des Blutes modelliert wird.

Verfahren nach Anspruch 8 bei dem dem rekurrenten neuronalen Netz (NN) zum Training mindestens Zeitreihen (Z10) von folgenden Einflußgrößen des Patienten zugeführt werden: verabreichte Insulindosen, Essensmenge, Sport, aktueller Blut-Gluosespiegel, vorangegangener geschätzter Blut-Gluosespiegel.

Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinarem stochastischem Verhalten. mit folgenden Merkmalen:a) sie weist ein rekurrentes neuronales Netz (NN) zur Prognose von mindestens einer Einflußgröße des Systems auf;

b) sie weist Mittel zur Fehlermodellierung (L) eines Systemfehlers (ε) des dynamischen Systems auf;

c) sie weist Mittel zur Bildung eines Adaptionsfehlers für einen ersten Zeitpunkt als der Differenz aus dem Systemfehler des dynamischen Systems und der am ersten Zeitpunkt gemessenen Einflußgröße des Systems auf;

d) sie weist wenigstens beim Training des Neuronalen Netzes mit dem Systemverhalten Mittel zur Adaption des rekurrenten neuronalen Netzes mit dem Adaptionsfehler auf.

Anordnung zur neuronalen Modellierung eines dynamischen Systems nach Anspruch 10,a) bei der das neuronale Netz (NN) als Multilayer Perceptron ausgeführt ist,

b) und bei der das neuronale Netz (NN) einen hidden Layer mit drei Neuronen aufweist.

Anordnung zur neuronalen Modellierung eines dynamischen Systems nach einem der Ansprüche 10 oder 11, bei der das neuronale Netz (NN) Mittel zur Eingabe eines Blutzuckermeßwertes aufweist.

说明书全文

Die Erfindung bezieht sich auf ein Verfahren und auf eine Anordnung zur Modellierung eines Systems mit nicht linearem stochastischem Verhalten, insbesondere eines biologischen Systems, wie beispielsweise dem Insulin-Glukose-Metabolismus, für den, wie auch für andere Systeme, wenig Lerndaten zum Training des neuronalen Netzes zur Verfügung stehen.

Weil Messungen von Einflußgrößen, zur Zustandsbestimmung eines technischen oder physiologischen Systems, teilweise sehr aufwendig und umständlich durchzuführen sind, werden sie häufig nur in unregelmäßigen Zeitintervallen vorgenommen. Diabetiker bestimmen ihren Blutzuckergehalt beispielsweise lediglich 4-5 mal am Tag. Falls man versucht Modelle von derartigen Systemen zu erstellen, so kommt erschwerend hinzu, daß diese sich in hohem Maße nichtlinear und stochastisch verhalten, so daß neuronale Netze für ihre Modellierung geeignet erscheinen. In üblicher Weise werden solche Netze im Free-Running"-Betrieb, auch als Freilaufmodus bezeichnet, eingesetzt, in dem Netzwerkvorhersagen iteriert werden, oder im "Teacher-Forcing Mode", in dem aktuelle Messungen der Zeitreihe, die dem Netz zur Verfügung gestellt wird, die iterierten Werte ersetzen. Beide Ansätze sind problematisch bei solchen Systemen, die sich in hohem Maße stochastisch verhalten und bei denen für die einzelnen Einflußgrößen nur wenig Meßwerte in der Zeitreihe zur Verfügung stehen. Aus dem Stand der Technik [2] ist es bekannt solche Probleme mit Hilfe von stochastischen Modellen anzugehen, in dem man beispielsweise nichtlineare Zustandsraummodelle verwendet. Dabei besteht jedoch das Problem der Vorhersage und des Trainings von fehlenden Meßwerten, dessen analytische Lösung zu derartig komplizierten Integralen führt, daß sie unbehandelbar sind. Alternativ dazu können für die Vorhersage und das Training zustandsabhängige Linearisierungen durchgeführt werden, von denen die populärste der Extended Kalman Filter" ist. Weitere Lösungsmöglichkeiten für derartige Probleme sind aus dem Stand der Technik nicht bekannt.

Die der Erfindung zu Grunde liegende Aufgabe besteht darin, ein Verfahren und eine Anordnung anzugeben, um von Systemen, die sich nichtlinear und stochastisch verhalten und von deren Einflußgrößen wenig Meßwerte zum Training des neuronalen Netzes zur Verfügung stehen, ein gültiges Modell zu erhalten.

Diese Aufgabe wird für das Verfahren gemäß den Merkmalen des Patentanspruches 1 und für die Anordnung gemessen Merkmalen des Patentanspruches 10 gelöst. Weiterbildungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.

Ein Vorteil des erfindungsgemäßen Verfahrens und der erfindungsgemäßen Anordnung besteht darin, daß man durch die Kombination eines linearen Fehlermodells mit einem rekurrenten neuronalen Netz, für Ein- oder Mehrschrittvorhersage einfache Iterationsregeln erhält, mit denen das lineare Fehlermodell verbessert werden kann. Ein weiterer Vorteil besteht darin, daß für das "maximum likelihood learning" das rekurrente neuronale Netz mit Hilfe von Real Time recurrent learning", auch Echtzeit-Lernregel für rekurrente neurronale Netze genannt, trainiert werden kann und daß das lineare Fehlermodell mit Hilfe einer Adaptionsregel trainiert werden kann, die sich der vorwärts-, rückwärts-Kalman-Filter-Gleichungen bedient.

Vorteilhaft werden bei einer Weiterbildung des Verfahrens die angegebenen Systemgleichungen verwendet, da damit ein möglichst geringer Rechenaufwand beim Training und bei der Simulation des Modells verbunden ist.

Vorteilhaft kann bei einer Weiterbildung des Verfahrens das dynamische System des Glukose-Insulin-Metabolismus eines Diabetespatienten modelliert werden, wobei bevorzugt als Einflußgröße der Glukosespiegel des Patienten durch das neuronale Netz und das Fehlermodell modelliert wird, da für diesen Meßwert als Einflußgröße wenig Werte zur Verfügung stehen und sich das gesamte System in hohem Maße stochastisch und nichtlinear verhält.

Vorteilhaft werden bei einer Weiterbildung des Verfahrens für das Training des Modells Zeitreihen von verabreichten Insulindosen, der Essensmenge, körperlicher Ertüchtigung und dem aktuellen, sowie dem vorangegangenen geschätzten Blutzuckerwert zur Verfügung gestellt, da dieses die Einflußgrößen sind, die sich am meisten auf den Blutzuckerspiegel auswirken.

Vorteilhaft weist eine Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinearem stochastischem Verhalten ein rekurrentes Netz, sowie Mittel zur Fehlermodellierung des Systemfehlers des dynamischen Systems auf, wobei das neuronale Netz mit Hilfe der Differenz aus dem Systemfehler und einem Meßwert, der zum jeweiligen Zeitpunkt der Zeitreihe gemessen wurde, trainiert wird. Auf diese Weise wird sichergestellt, daß das neuronale Netz alle Nichtlinearitäten des Systems lernt.

Vorteilhaft wird in einer Weiterbildung der Anordnung das neuronale Netz als multi-layer perceptron ausgeführt, da sich derartige neuronale Netze besonders gut zur Modellierung von unvollständigen Zeitreihen eignen.

Vorteilhaft wird eine Weiterbildung der Anordnung zur Vorhersage des Blutzuckerwertes eines Diabetespatienten eingesetzt, indem der aktuelle Blutzuckerwert zur Verfügung gestellt wird, da sich mit einer solchen Anordnung derzeit die besten Vorhersageergebnisse erzielen lassen.

Im Folgenden werden Ausführungsbeispiele der Erfindung anhand von Figuren weiter erläutert.

Figur 1: zeigt eine Zeitreihe und den Vorhersagewert in Abhängigkeit verschiedener Iterationsverfahren des neuronalen Netzes.
Figur 2: zeigt die selbe Zeitreihe mit Vorhersagewerten unter Verwendung eines richtigen Fehlermodelles.
Figur 3: zeigt ein Beispiel einer erfindungsgemäßen Anordnung.
Figur 4: zeigt Blutzuckerkurven für verschiedene Modellierungsmethoden.
Figur 5: zeigt die Standardabweichung für eine erfindungsgemäß modellierte Blutzuckerkurve.

Wie Figur 1 zeigt, besteht eine Zeitreihe Z10 für solche Zeitpunkte an denen keine Meßwerte von Einflußgrößen zur Verfügung stehen, wie hier für t=1 bis t=6 aus iterierten Werten, die hier als unausgefüllte Kreise dargestellt sind. Für den Fall daß das Netzwerk in einem Freilaufmodus betrieben wird, würde es den Meßwert zum Zeitpunkt t=7 M70 ignorieren und als Vorhersagewert FR zum Zeitpunkt 8 ausgeben. Wie erkannt werden kann, werden dem neuronalen Netz NN hier die Werte der Zeitreihe zum Zeitpunkt 6 und 7 zur Vorhersage des 8-ten Wertes zur Verfügung gestellt. Für den Fall, daß das neuronale Netz im sogenannten "Teacher-Forcing-Mode" betrieben wird, würde der gemessene Wert M70 für den iterierten Wert zum Zeitpunkt 7 eingesetzt werden. Dies ist nicht die optimale Vorgehensweise, da durch das Wissen über den Meßwert zum Zeitpunkt 7 auch Informationen für die Zeitreihe zum Zeitpunkt 6 zur Verfügung stehen. In diesem Fall ist in der Zeitreihe der Wert V60 geeigneter, als der iterierte Wert.

Wie Figur 2 zeigt, sieht ein vernünftiger Werteverlauf der diesen Sachverhalt berücksichtigt für die Werte 8-13 so aus, daß die Vorhersagen nach dem Meßwert im Nahbereich dieses Meßwertes zu finden sind. Dieses Vorhersageverhalten des Modells kann durch Verwendung eines geeigneten Fehlermodells erreicht werden. Dem Systemmodell des dynamischen Systems liegt dabei die Systemgleichung der Form $y_{t} {= f}_{w} {(y}_{t-1} {,...,y}_{t-N} {,u}_{t})$ zu Grunde. Diese ist von der Ordnung N, mit einer Eingangsgröße u_t wobei f_w(.) ein neuronales Netzwerkmodell darstellt, daß den Parametervektor w aufweist. Gemäß dem Verfahren wird ein Modell mit Zustandsaktualisierungen gemäß folgender Gleichungen vorgeschlagen: $\begin{matrix} \begin{matrix} \begin{matrix} (1) & y_{t}^{*} {= f}_{w} {(y}_{t-1}^{*} {,...,y}_{t-N}^{*} {,u}_{t}) \end{matrix} \\ \begin{matrix} (2) & x_{t} = i=1 K θ_{i} x_{t-i} {+ ε}_{t} \end{matrix} \\ \begin{matrix} (3) & y_{t} {= y}_{t}^{*} {+ x}_{t} {= f}_{w} {(y}_{t-1}^{*} {,...,y}_{t-N}^{*} {,u}_{t}) + i=1 K θ_{i} x_{t-i} {+ ε}_{t}, \end{matrix} \end{matrix} \end{matrix}$ wobei die Meßwertgleichung $z_{t} = y_{t} + δ_{t}$ lautet. Dabei bedeuten ε_t und δ_t additives Rauschen. Hierbei wird die Einflußgröße y_t nun durch die Summe der deterministischen Antwort des rekurrenten neuronalen Netzwerkes y $\binom{*}{t}$ mit dem von einem linearen Systemfehlermodell abgegebenen Systemfehler x_t gebildet. Dieser Sachverhalt ist in der Anordnung in Figur 3 zu erkennen. Das neuronale Netz ist mit NN bezeichnet und das lineare Systemfehlermodell mit L. Weiterhin sind einzelne Summationsstellen S10 und S20 vorhanden und die gesamte Anordnung ist mit A10 bezeichnet. z_t ist dabei eine verrauschte Messung von y_t. Da nur wenige Meßwerte zur Verfügung stehen, sind im einzelnen jene Fälle interessant, in denen y_t mit Sicherheit gemessen werden kann, wobei also die Varianz δ_t=0 ist und solche Fälle, in denen kein Meßwert vorliegt, in denen also die Varianz von $δ_{t} = ∞$ ist. Vorteilhaft kann dabei y $\binom{*}{t}$ als deterministischer Eingangswert für das Zustandsraummodell, das aus den Gleichungen 2-3 besteht, angesehen werden. Daraus ergibt sich, daß für eine optimale Einschritt- und Mehrschrittvorhersage des Modells lineare Kalman-Filter-Gleichungen für die Gleichungen (2) bis (3) und die Meßwertgleichung (4) verwendet werden können, bei denen y $\binom{*}{t}$ als deterministischer Eingang eingesetzt wird. In ähnlicher Weise kann das lineare Fehlermodell des Systems trainiert werden, d. h.{θ_i} $\binom{N}{i=1}$ Varianz von ε_t, indem eine Fehlermodelladaptionsregel verwendet wird, welche mit vorwärtsrückwärts Kalman-Filter-Gleichungen implementiert wurde. Das deterministische rekurrente neuronale Netz wird dabei mit dem Restfehler adaptiert, der vom linearen Fehlermodell nicht nachgebildet werden kann, d. h. ${target}_{t}^{mn} {= y}_{t}^{m} - {\hat{y}}_{t}^{linear},$ wobei y $\binom{m}{t}$ den Meßwert von y_t zur Zeit t darstellt und $\hat{y}$ $\binom{linear}{t}$ den Systemfehler angibt, der vom linearen Fehlermodell geschätzt wurde. Die Anwendung der vorwärts-rückwärts Kalman-Gleichungen wird in einem mathematischen Anhang noch erklärt.

Nachdem das neuronale Modell mit diesem Fehler adaptiert wurde, kann das lineare Fehlermodell mit dem verbleibenden Restfehler trainiert werden, der vom neuronalen Netz nicht adaptiert werden konnte. Diese Verfahrensweise kann solange durchgeführt werden, bis keine weitere Verbesserung erzielt werden kann. Der Vorteil des Verfahrens besteht dabei darin, daß alle nichtlinearen Einflüsse des Systems durch das rekurrente neuronale Netzwerk nachgebildet werden, während das lineare Fehlermodell lediglich das Rauschen des Systems nachbildet, das mit Hilfe von bekannten Lernalgorithmen für lineare Systeme antrainiert werden kann.

Vorteilhaft kann mit dem erfindungsgemäßen Verfahren und mit der erfindungsgemäßen Anordnung eine Vorhersage des Blutzuckerwertes einer Person mit Diabetes mellitus durchgeführt werden. Für solche Modelle gibt es mehrere sinnvolle Anwendungen in der Therapie: es kann benutzt werden um eines Person vor gefährlichen metabolischen Zuständen zu warnen, weiterhin kann das Modell Empfehlungen abgeben, um die Therapie des Patienten zu optimieren und schließlich kann es eingesetzt werden für die Kontrolle einer sogenannten künstlichen Betazelle, die automatisch den Blutzuckerspiegel mit Hilfe von Messungen und Insulingaben steuert. Bevorzugt wird das Systemmodell mit Daten eines Patienten trainiert, die über eine größere Zeitperiode, beispielsweise 6 Monate aufgenommen wurden. Maßgebliche Einflußgrößen für diesen Blutzucker-Insulin-Metabolismus sind im einzelnen die Zeiten und Dosierungsmengen von Insulininjektionen, die Zeiten und Mengen von Essensaufnahmen (Basalinsulin u $\binom{1}{t}$ und Normalinsulin u $\binom{2}{t}$ ), die Zeiten und Mengen von Essensaufnahme (schnelle u $\binom{3}{t}$ , mittlere u $\binom{4}{t}$ und langsame u $\binom{5}{t}$ Kohlehydrate), die Zeitpunkte und Andauer von körperlichen Übungen (regelmäßig u $\binom{6}{t}$ oder intensiv u $\binom{7}{t}$ ) und der Blutzuckerspiegel y_t (mehrfach am Tag gemessen). Dabei sind u $\binom{j}{t}$ , für j=1,...,7 = 0 ausgenommen für den Fall, daß ein Ereignis, wie beispielsweise Essensaufnahme, Insulininjektion oder sportliche Übung stattfindet. Beispielsweise werden diese Daten für 15-minütige Anstände aufgenommen. Von diesen Daten werden beispielsweise die für 43 Tage aufgenommenen 312 Blutzuckermeßwerte zum Training des Modelles eingesetzt und die für die folgenden 21 Tage aufgenommenen 151 Blutzuckermeßwerte zu seiner Validierung. Das bedeutet, daß hierbei mit ca. 93 % fehlenden Daten beim Training umgegangen werden muß.

Dabei ist zu beachten, daß die Einflüsse von Insulin, Essensaufnahme und sportlichen Übungen auf den Blutzuckerspiegel verzögert eintreten und bevorzugt durch lineare Antwortfunktionen der Form $v_{t}^{j} {= h}_{j} {(u}_{t}^{j})$ modelliert werden, wobei diese den Einfluß der Eingangsgröße u $\binom{j}{t}$ auf den Glukosewert beschreibt. Beispielsweise wird die Antwort v $\binom{2}{t}$ von Normalinsulin u $\binom{2}{t}$ nach der Injektion bestimmt, indem die Diffusion des subkutan injizierten Insulins in den Blutstrom durch drei Abteilungen erster Ordnung in Serien modelliert wird, oder wie beispielsweise durchgeführt, durch eine Antwortfunktion der Form $v_{t}^{2} {= h}_{2} {(u}_{t}^{2} {) = Σ}_{τ} g_{2} {(t - τ)u}_{τ}^{2} {mit g}_{2} {(t) = a}_{2} t^{2} e ^{{-b}_{2} t} .$

Die funktionalen Abhängigkeiten für den Verdauungsapparat g_j(.) sind dabei weniger bekannt. Es wird deshalb ebenfalls die Gleichung von obiger Form angenommen. Die Antwortfunktionen g_j(.) beschreiben den Verzögerungseffekt der Eingänge auf den Blutzuckerspiegel. Dabei wird davon ausgegangen, daß die Gleichung der Form g_j(.) ausreicht, um sämtliche Variationen der Verzögerungen der Eingänge abzubilden und das sie an die Physiologie des Patienten durch Variation der einzelnen Parameter a_j, b_j angepaßt werden kann. Um die hochgradig nichtlinearen physiologischen Zusammenhänge zwischen den Antwortfunktionen V $\binom{j}{t}$ und dem Blutzuckerspiegel y_t nachbilden zu können, welcher lediglich wenige Male am Tag bestimmt wird, wird, wie zuvor beschrieben, die Kombination eines linearen Fehlermodells mit einem rekurrenten neuronalen Netz eingesetzt. Dabei wird bevorzugt als f_w(.) ein vorwärtsgerichtetes multi-layer perceptron" als neuronales Netz verwendet, bei dem drei versteckte lagen vorhanden sind. Als die fünf Eingänge des Netzwerkes werden dabei Insulin ${(in}_{t}^{1} {= v}_{t}^{1} {+ v}_{t}^{2}),$ Essen ${(in}_{t}^{2} {= v}_{t}^{3} {+ v}_{t}^{4} {+ v}_{t}^{5}),$ körperliche Ertüchtigung ${(in}_{t}^{3} {= v}_{t}^{6} {+ v}_{t}^{7})$ und der gegenwärtige und vorherige Schätzwert des Blutzuckerspiegels verwendet. Die Gleichung des nichtlinearen rekurrenten Netzwerkes zweiter Ordnung ist dabei wie folgt: $y_{t}^{*} {= y}_{t-1}^{*} {+ f}_{w} {(y}_{t-1}^{*} {,y}_{t-2}^{*} {,in}_{t}^{1} {,in}_{t}^{2} {,in}_{t}^{3}).$

Für das lineare Fehlermodell wird ebenfalls ein Modell zweiter Ordnung verwendet $x_{t} {= θ}_{1} x_{t-1} {+ θ}_{2} x_{t-2} {+ ε}_{t}$

Tabelle 1 zeigt dabei die Varianz der verschiedenen Vorhersagemodelle.

Modell

mean

RNN-TF

18.8

8.9

LM-LEM

31.4

LEM

12.9

RNN-LEM1

43.7

RNN-FR

14.1

RNN-LEM2

44.9

Zunächst wurde das rückwärtsgerichtete neuronale Netz im Freilaufmodus untersucht (RNN-FR). Dabei wurde der Blutzuckerspiegel zur Zeit t als der Ausgang des neuronalen Netzes gemäß ${\hat{y}}_{t} {= y}_{t}^{*}$ vorhergesagt. Das neuronale Netz wurde dabei im Freilaufmodus beim Training und bei der Vorhersage betrieben. Als Lernregel wurde die Echtzeit-Lernregel für rekurrente neuronale Netze verwendet, sowohl um die Gewichte des neuronalen Netzes anzupassen, als auch die Parameter der Antwortfunktionen g_j (.). Wie erkannt werden kann, erklärt dieses Modell 14.1 % der Varianz. Das rückwärtsgerichtete neuronale Netz im Teacher-Forcing-Modus (RNN-TF)ist dabei identisch zur vorherigen Untersuchung eingesetzt worden mit der Ausnahme, daß die Meßwerte für die iterierten Werte der Zeitreihe eingesetzt wurden, wann immer sie verfügbar waren. Wie aus Tabelle 1 gesehen werden kann, erklärt RNN-TF mit 18.8 % mehr der Varianz. Die Erklärung besteht darin, daß die Information der Meßwerte verwertet wird.

Die Kombination aus rekurrentem neuronalen Netzwerk und linearem Fehlermodell zweiter Ordnung der Form $y_{t} {= x}_{t} {+ y}_{t}^{*}$ modelliert den Blutzuckerspiegel und $z_{t} {= y}_{t} {+ δ}_{t}$ modelliert die Meßwertgleichung, wobei die Varianz von δ_t zu 0 gesetzt wurde für einen Meßwert des Blutzuckerspiegels zum Zeitpunkt t und die Varianz von δ_t zu unendlich gesetzt wird für fehlende Meßwerte. Für ε_t werden unabhängige Gaußverteilungen des Rauschens angenommen. Zur Vorhersage wird die Gleichung im Freilaufmodus des Netzes iteriert. Der Blutzuckerspiegel zum Zeitpunkt t wird dabei durch einen linearen Kalmanfilter geschätzt, der y $\binom{*}{t}$ als deterministischen Eingang in das Zustandsraummodell $y_{t} {= x}_{t} {+ y}_{t}^{*},$ $z_{t} {= y}_{t} {+ δ}_{t}$ behandelt. Die Parameter des linearen Fehlermodells (θ₁, θ₂, die Varianz von ε_t) werden dabei durch eine Fehlermodelladaptionsregel angepaßt, die mit Hilfe von vorwarts-rückwärts Kalman-Filtergleichungen implementiert ist, die im mathematischen Erklärungsteil ausgeführt werden. Die Parameter die neuronalen Netzes werden mit derselben Lernregel angepaßt, mit der Ausnahme, daß als Target nun ${target}_{t}^{mnn} {= y}_{t}^{m} - {\hat{y}}_{t}^{linear}$ verwendet wird, wobei y $\binom{m}{t}$ einen Meßwert von y_t zum Zeitpunkt t darstellt und $\hat{y}$ $\binom{linear}{t}$ den Schätzwert des linearen Fehlermodells basierend auf dem linearen Kalman-Filter angibt. Die Adaption des linearen Fehlermodells und des neuronalen Netzwerkes wird dabei alternierend solange durchgeführt, bis sich keine entscheidende Verbesserung mehr in der Leistungsfähigkeit des Modells ergibt.

Wie Tabelle 1 weiter zeigt, erreicht dieses Modell RNN-LEM2 die beste Leistungsfähigkeit, indem es die Varianz zu 44.9 % erklärt (das Fehlermodell erster Ordnung RNN-LEM1 kommt lediglich auf 43.7 %). Zum Vergleich mit anderen Methoden, wird ebenfalls die Leistungsfähigkeit des linearen Fehlermodells LEM, das alle Eingänge ignoriert, aufgezeigt, und des linearen Modells (LM-FR) das ohne Fehlermodell arbeitet und mit Hilfe der Echtzeitlernregel für rekurrente neuronale Netze trainiert wird. Ebenfalls dargestellt ist das lineare Modell mit dem Fehlermodell (LM-LEM). Dadurch das die nichtlinearen Modell bei weitem bessere Resultate erzielen (RNN-FR, RNN-TF, RNN-LEM), als ihr linearen Gegenstücke, wird bestätigt, daß das System sich in hohem Maße nichtlinear verhält.

Figur 4 zeigt einige Beispiele von Ergebnissen mit den unterschiedlichen Modellen. Sie sind in einem Diagramm D10 zusammengefaßt, das zeigt, wie gut die Unterschiedlichen Modelle K10, K20 und K30 einzelne Meßwerte der Zeitreihe M10, M20 und M30 annähern können. Im Diagramm D10 ist nach oben der Blutglukosegehalt in mg/dl und nach rechts die Zeit in Stunden angegeben. Mit K30 ist der Systemverlauf angegeben, den man durch Modellierung mit dem neuronalen Netzwerk im Freilaufmodus erzielt. Mit dem rekurrenten neuronalen Netzwerk, das im "Teacher Forcing" Modus betrieben und trainiert wird, kann in bezug auf die Meßwerte ein besserer Kurvenverlauf erzielt werden, als mit der Behandlung des Meßwertes im Freilaufmodus, was Kurve K20 veranschaulicht. Der beste Kurvenverlauf ergibt sich durch die Kurve K10, also durch eine Modellierung mit einem linearen Fehlermodell und einem rekurrenten neuronalen Netzwerk in Kombination.

In Figur 5 sind in einem Diagramm D20 nach rechts die Zeit aufgetragen und nach oben die Varianz der Vorhersage in mg/dl. Dargestellt ist diese Signalkurve SIG10 für die Modellierung des Systemverhaltens mit dem linearen Fehlermodell und dem rekurrenten neuronalen Netzwerk in Kombination. Die Varianz der Vorhersage wird dabei mit dem linearen iterierten Kalman-Filter berechnet. Wie Figur 5 weiter zeigt, ist die Standardabweichung um einen Meßwert herum vergleichsweise klein und konvergiert dann gegen einen konstanten Wert. Basierend auf der Vorhersage und der geschätzten Varianz ist es also möglich eine Risikoanalyse für den Diabetiker durchzuführen, um ihn vor gefährlichen metabolischen Zuständen des Blut-Insulin-Metabolismus zu warnen.

Im folgenden werden die mathematischen Grundlagen für die Anpassung und das Training des linearen Fehlermodells dargestellt. Die Modellierung und Beobachtungsgleichungen des allgemeinen Modells ergeben sich zu: $x_{t} {= θx}_{t-1} {+ ε}_{t} z_{t} {= M}_{t} x_{t} {+ δ}_{t}$ wobei θ die K × K Übertragungsmatrix des linearen Fehlermodells mit der K-ten Ordnung darstellt. Die K × 1 Rauschterme ε_t sind dabei unkorrelierte Normalenvektoren mit Mittelwert 0 und der allgemeinen Kovarianzmatix Q. δ_t ist ein m-dimensionaler unkorrelierter Normalenrauschvektor mit Mittelwert 0 und Kovarianzmatix R_t. In grundlegender Weise wird bei diesem Lösungsansatz davon ausgegangen, daß bestimmte Messungen und fehlende Meßwerte als Spezialfälle von verrauschten Messungen zu betrachten sind. Beim Ausgangszustand des Systems wird davon ausgegangen, daß dieser normalverteilt ist mit mittlerem µ und mittlerer Kovarianz Σ.

Zur Beschreibung der Gleichungen für das lineare Fehlermodel zur Maximierung der "likelihood" des Modells wird wie folgt vorgegangen: es werden die geschätzten Parameter zur (r + 1)-sten Iteration des Fehlermodells zu den Werten µ, Σ, θ, Q, definiert, welche die Gleichung ${G(µ,Σ,θ,Q) = E}_{τ} {(logL|z}_{1} {,...,z}_{n})$ maximieren, wobei logL die log-likelihood Funktion der kompletten Daten x₀, x₁,..., x_n, z₁,..., z_n angibt und E_r die wahrscheinliche Erwartung relativ zu einer Dichte angibt, welche die Werte der r-ten Iteration µ(r), Σ(r), θ(r) und Q(r) angibt. Die fehlenden Zielgrößen werden dabei implizit durch die Definition von M_t und R_t modelliert.

Um die durch Gleichung 8 angegebene bedingte Erwartung zu berechnen, wird der folgende Satz von Rekursionsformeln, der die Standard Kalman-Filter-Ergebnisse auswertet, benutzt [1]. Zunächst wird dabei die Vorwärtsrekursion angegeben: $\begin{matrix} \begin{matrix} x_{t}^{t-1} {= θx}_{t}^{t-1} \\ P_{t}^{t-1} {= θP}_{t}^{t-1} θ^{T} + Q \\ K_{t} {= P}_{t}^{t-1} M_{t}^{T} {(M}_{t} P_{t}^{t-1} M_{t}^{T} {+ R}_{t})^{-1} \\ x_{t}^{t} {= x}_{t}^{t-1} {+ K}_{t} {(y}_{t}^{*} {- M}_{t} x_{t}^{t-1}) \\ P_{t}^{t} {= P}_{t}^{t-1} {- K}_{t} M_{t} P_{t}^{t-1} \end{matrix} \end{matrix}$ wobei $x_{0}^{0} = µ$ und $P_{0}^{0} = Σ$ gilt. Als nächstes wird die Rückwärtsrekursionsformel angegeben: $\begin{matrix} \begin{matrix} J_{t-1} {= P}_{t-1}^{t-1} θ^{T} {(P}_{t-1}^{t-1})^{-1} \\ x_{t-1}^{n} {= x}_{t-1}^{t-1} {+ J}_{t-1} {(x}_{t}^{n} {- θx}_{t-1}^{t-1}) \\ P_{t-1}^{n} {= P}_{t-1}^{t-1} {+ J}_{t-1} {(P}_{t}^{n} {- P}_{t}^{t-1} {)J}_{t-1}^{T} \\ P_{t-1,t-2}^{n} {= P}_{t-1}^{t-1} J_{t-2}^{T} {+ J}_{t-1} {(P}_{t,t-1}^{n} {- θP}_{t-1}^{t-1} {)J}_{t-2}^{T} \end{matrix} \end{matrix}$ mit der Initialisierung $P_{n,n-1}^{n} {= (I - K}_{n} M_{n} {)θP}_{n-1}^{n-1} .$ Dabei bildet eine Vorwärts- und eine Rückwärtsrekursion den Fehlerschritt des Fehlermodellierungs-Algorithmus. Um daraus den Modellierungsschritt zu erhalten, werden die bedingten Wahrscheinlichkeiten in Gleichung 8 zu folgenden Gleichungen umgebildet: $\begin{matrix} \begin{matrix} G = - \frac{1}{2} log|Σ|- \frac{1}{2} {tr{Σ}^{-1} {(P}_{0}^{n} {+ (x}_{0}^{n} {- µ)(x}_{0}^{n} {- µ)}^{T})} \\ - \frac{n}{2} log|Q|- \frac{1}{2} {tr{Q}^{-1} {(C - Bθ}^{T} {- θB}^{T} {- θAθ}^{T})} \\ - \frac{n}{2} {log|R}_{t} |- \frac{1}{2} {tr{R}_{t}^{-1} Σ_{t=1}^{n} {[(y}_{t}^{*} {- M}_{t} x_{t} {)(y*}_{t} {- M}_{t} x_{t})^{T} {+ M}_{t} P_{t}^{n} M_{t}^{T}]} \end{matrix} \end{matrix}$ wobei tr{.} die Spur angibt, und $\begin{matrix} \begin{matrix} {A = Σ}_{t=1}^{n} {(P}_{t-1}^{n} {+ x}_{t-1}^{n} x_{t-1}^{T}), \\ {B = Σ}_{t=1}^{n} {(P}_{t,t-1}^{n} + x _{t-1}^{n^{T}} {) und C = Σ}_{t=1}^{n} {(P}_{t}^{n} {+ x}_{t}^{n} x _{t}^{n^{T}}) \end{matrix} \end{matrix}$ gelten. ${θ(r + 1) = BA}^{-1}$ und ${Q(r + 1) = n}^{-1} {(C - BA}^{-1} B^{T})$ maximieren dabei die logarithmische Wahrscheinlichkeitsgleichung 11. µ(r+1) wird zu n $\binom{n}{0}$ gesetzt und Σ kann auf einen vernünftigen Grundwertpegel gesetzt werden. Die Ableitung dieser Gleichungen ergibt sich aus [3]. Die E- (vorwärts und rückwärts Kalman-Filter-Gleichungen) und die M-Schritte werden alternierend wiederholt bis sie gegen eine Fehlermodellösung konvertieren.

Literatur

[1] Jazwinski, A. H. (1970) Stochastic Processes and Filtering Theory, Academic Press, N.Y.

[2] Lewis, F. L. (1986) Optimal Estimation, John Wiley, N.Y.

[3] Shumway, R. H. and Stoffer, D. S. (1981) Time Series Smoothing and Forecasting Using the EM Algorithm, Technical Report No. 27, Division of Statistics, UC Davis.

[4] Tresp, V., Moody, J. and Delong, W.-R. (1994) Neural Modeling of Physiological Processes, in comput. Learning Theory and Natural Learning Sys. 2, Hanson et al., eds., MIT Press.

标题	发布/更新时间	阅读量
一种基于安全态势感知的传感云双层网络防御系统及方法	2020-05-15	506
预测自动语音识别系统中的短语识别质量	2020-05-19	561
一种GIS隔离开关触头温度预测方法、装置及可读存储介质	2020-05-16	873
一种基于三维空间时序建模的深度视频人体行为识别方法	2020-05-19	456
基于伪标签方法和弱监督学习的过程数据故障分类方法	2020-05-08	385
一种三维点云的处理方法、装置及设备	2020-05-11	190
一种基于三维立体视觉和点云深度学习的机器人上料系统	2020-05-12	653
一种文本分类方法及系统	2020-05-13	822
一种基于对抗生成网络的人脑效应连接识别方法	2020-05-16	365
用于监测车辆盲区的方法和装置	2020-05-12	964

Verfahren und Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinearem stochastischem Verhalten

该功能需要专业版企业版VIP权限，您可以：