专利汇可以提供Verfahren und Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinearem stochastischem Verhalten专利检索,专利查询,专利分析的服务。并且Die Erfindung gibt eine Lösung zur Modellierung stochastischer nicht linearer dynamischer Systeme an, bei denen wenige Meßwerte der Einflußgröße vorliegen und die restlichen Werte der Zeitreihe modelliert werden müssen. Als Lösung wird eine spezifische Kombination eines nichtlinearen rekurrenten neuronalen prädiktiven Netzwerkes und eines linearen Fehlermodells vorgeschlagen, womit eine Vorhersage durchgeführt werden kann und die Anwendung von maximum likelihood Adaptionsregeln durchgeführt werden kann. Im Speziellen kann dazu das rekurrente neuronale Netzwerk mit Hilfe der Echtzeitrekurrenten Lernregel trainiert werden und das lineare Fehlermodell wird mit Hilfe der Fehlermodelladaptionsregel trainiert, die auf Basis der vorwärts-rückwärts Kalman-Filter-Gleichungen implementiert ist. Dieses Modell wird eingesetzt, um Werte des Glukose-Insulin-Metabolismus eines Diabetespatienten vorherzusagen. Die Anordnung realisiert die Kombination dieser beiden Modelle.,下面是Verfahren und Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinearem stochastischem Verhalten专利的具体信息内容。
Die Erfindung bezieht sich auf ein Verfahren und auf eine Anordnung zur Modellierung eines Systems mit nicht linearem stochastischem Verhalten, insbesondere eines biologischen Systems, wie beispielsweise dem Insulin-Glukose-Metabolismus, für den, wie auch für andere Systeme, wenig Lerndaten zum Training des neuronalen Netzes zur Verfügung stehen.
Weil Messungen von Einflußgrößen, zur Zustandsbestimmung eines technischen oder physiologischen Systems, teilweise sehr aufwendig und umständlich durchzuführen sind, werden sie häufig nur in unregelmäßigen Zeitintervallen vorgenommen. Diabetiker bestimmen ihren Blutzuckergehalt beispielsweise lediglich 4-5 mal am Tag. Falls man versucht Modelle von derartigen Systemen zu erstellen, so kommt erschwerend hinzu, daß diese sich in hohem Maße nichtlinear und stochastisch verhalten, so daß neuronale Netze für ihre Modellierung geeignet erscheinen. In üblicher Weise werden solche Netze im Free-Running"-Betrieb, auch als Freilaufmodus bezeichnet, eingesetzt, in dem Netzwerkvorhersagen iteriert werden, oder im "Teacher-Forcing Mode", in dem aktuelle Messungen der Zeitreihe, die dem Netz zur Verfügung gestellt wird, die iterierten Werte ersetzen. Beide Ansätze sind problematisch bei solchen Systemen, die sich in hohem Maße stochastisch verhalten und bei denen für die einzelnen Einflußgrößen nur wenig Meßwerte in der Zeitreihe zur Verfügung stehen. Aus dem Stand der Technik [2] ist es bekannt solche Probleme mit Hilfe von stochastischen Modellen anzugehen, in dem man beispielsweise nichtlineare Zustandsraummodelle verwendet. Dabei besteht jedoch das Problem der Vorhersage und des Trainings von fehlenden Meßwerten, dessen analytische Lösung zu derartig komplizierten Integralen führt, daß sie unbehandelbar sind. Alternativ dazu können für die Vorhersage und das Training zustandsabhängige Linearisierungen durchgeführt werden, von denen die populärste der Extended Kalman Filter" ist. Weitere Lösungsmöglichkeiten für derartige Probleme sind aus dem Stand der Technik nicht bekannt.
Die der Erfindung zu Grunde liegende Aufgabe besteht darin, ein Verfahren und eine Anordnung anzugeben, um von Systemen, die sich nichtlinear und stochastisch verhalten und von deren Einflußgrößen wenig Meßwerte zum Training des neuronalen Netzes zur Verfügung stehen, ein gültiges Modell zu erhalten.
Diese Aufgabe wird für das Verfahren gemäß den Merkmalen des Patentanspruches 1 und für die Anordnung gemessen Merkmalen des Patentanspruches 10 gelöst. Weiterbildungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.
Ein Vorteil des erfindungsgemäßen Verfahrens und der erfindungsgemäßen Anordnung besteht darin, daß man durch die Kombination eines linearen Fehlermodells mit einem rekurrenten neuronalen Netz, für Ein- oder Mehrschrittvorhersage einfache Iterationsregeln erhält, mit denen das lineare Fehlermodell verbessert werden kann. Ein weiterer Vorteil besteht darin, daß für das "maximum likelihood learning" das rekurrente neuronale Netz mit Hilfe von Real Time recurrent learning", auch Echtzeit-Lernregel für rekurrente neurronale Netze genannt, trainiert werden kann und daß das lineare Fehlermodell mit Hilfe einer Adaptionsregel trainiert werden kann, die sich der vorwärts-, rückwärts-Kalman-Filter-Gleichungen bedient.
Vorteilhaft werden bei einer Weiterbildung des Verfahrens die angegebenen Systemgleichungen verwendet, da damit ein möglichst geringer Rechenaufwand beim Training und bei der Simulation des Modells verbunden ist.
Vorteilhaft kann bei einer Weiterbildung des Verfahrens das dynamische System des Glukose-Insulin-Metabolismus eines Diabetespatienten modelliert werden, wobei bevorzugt als Einflußgröße der Glukosespiegel des Patienten durch das neuronale Netz und das Fehlermodell modelliert wird, da für diesen Meßwert als Einflußgröße wenig Werte zur Verfügung stehen und sich das gesamte System in hohem Maße stochastisch und nichtlinear verhält.
Vorteilhaft werden bei einer Weiterbildung des Verfahrens für das Training des Modells Zeitreihen von verabreichten Insulindosen, der Essensmenge, körperlicher Ertüchtigung und dem aktuellen, sowie dem vorangegangenen geschätzten Blutzuckerwert zur Verfügung gestellt, da dieses die Einflußgrößen sind, die sich am meisten auf den Blutzuckerspiegel auswirken.
Vorteilhaft weist eine Anordnung zur neuronalen Modellierung eines dynamischen Systems mit nichtlinearem stochastischem Verhalten ein rekurrentes Netz, sowie Mittel zur Fehlermodellierung des Systemfehlers des dynamischen Systems auf, wobei das neuronale Netz mit Hilfe der Differenz aus dem Systemfehler und einem Meßwert, der zum jeweiligen Zeitpunkt der Zeitreihe gemessen wurde, trainiert wird. Auf diese Weise wird sichergestellt, daß das neuronale Netz alle Nichtlinearitäten des Systems lernt.
Vorteilhaft wird in einer Weiterbildung der Anordnung das neuronale Netz als multi-layer perceptron ausgeführt, da sich derartige neuronale Netze besonders gut zur Modellierung von unvollständigen Zeitreihen eignen.
Vorteilhaft wird eine Weiterbildung der Anordnung zur Vorhersage des Blutzuckerwertes eines Diabetespatienten eingesetzt, indem der aktuelle Blutzuckerwert zur Verfügung gestellt wird, da sich mit einer solchen Anordnung derzeit die besten Vorhersageergebnisse erzielen lassen.
Im Folgenden werden Ausführungsbeispiele der Erfindung anhand von Figuren weiter erläutert.
Wie Figur 1 zeigt, besteht eine Zeitreihe Z10 für solche Zeitpunkte an denen keine Meßwerte von Einflußgrößen zur Verfügung stehen, wie hier für t=1 bis t=6 aus iterierten Werten, die hier als unausgefüllte Kreise dargestellt sind. Für den Fall daß das Netzwerk in einem Freilaufmodus betrieben wird, würde es den Meßwert zum Zeitpunkt t=7 M70 ignorieren und als Vorhersagewert FR zum Zeitpunkt 8 ausgeben. Wie erkannt werden kann, werden dem neuronalen Netz NN hier die Werte der Zeitreihe zum Zeitpunkt 6 und 7 zur Vorhersage des 8-ten Wertes zur Verfügung gestellt. Für den Fall, daß das neuronale Netz im sogenannten "Teacher-Forcing-Mode" betrieben wird, würde der gemessene Wert M70 für den iterierten Wert zum Zeitpunkt 7 eingesetzt werden. Dies ist nicht die optimale Vorgehensweise, da durch das Wissen über den Meßwert zum Zeitpunkt 7 auch Informationen für die Zeitreihe zum Zeitpunkt 6 zur Verfügung stehen. In diesem Fall ist in der Zeitreihe der Wert V60 geeigneter, als der iterierte Wert.
Wie Figur 2 zeigt, sieht ein vernünftiger Werteverlauf der diesen Sachverhalt berücksichtigt für die Werte 8-13 so aus, daß die Vorhersagen nach dem Meßwert im Nahbereich dieses Meßwertes zu finden sind. Dieses Vorhersageverhalten des Modells kann durch Verwendung eines geeigneten Fehlermodells erreicht werden. Dem Systemmodell des dynamischen Systems liegt dabei die Systemgleichung der Form
Nachdem das neuronale Modell mit diesem Fehler adaptiert wurde, kann das lineare Fehlermodell mit dem verbleibenden Restfehler trainiert werden, der vom neuronalen Netz nicht adaptiert werden konnte. Diese Verfahrensweise kann solange durchgeführt werden, bis keine weitere Verbesserung erzielt werden kann. Der Vorteil des Verfahrens besteht dabei darin, daß alle nichtlinearen Einflüsse des Systems durch das rekurrente neuronale Netzwerk nachgebildet werden, während das lineare Fehlermodell lediglich das Rauschen des Systems nachbildet, das mit Hilfe von bekannten Lernalgorithmen für lineare Systeme antrainiert werden kann.
Vorteilhaft kann mit dem erfindungsgemäßen Verfahren und mit der erfindungsgemäßen Anordnung eine Vorhersage des Blutzuckerwertes einer Person mit Diabetes mellitus durchgeführt werden. Für solche Modelle gibt es mehrere sinnvolle Anwendungen in der Therapie: es kann benutzt werden um eines Person vor gefährlichen metabolischen Zuständen zu warnen, weiterhin kann das Modell Empfehlungen abgeben, um die Therapie des Patienten zu optimieren und schließlich kann es eingesetzt werden für die Kontrolle einer sogenannten künstlichen Betazelle, die automatisch den Blutzuckerspiegel mit Hilfe von Messungen und Insulingaben steuert. Bevorzugt wird das Systemmodell mit Daten eines Patienten trainiert, die über eine größere Zeitperiode, beispielsweise 6 Monate aufgenommen wurden. Maßgebliche Einflußgrößen für diesen Blutzucker-Insulin-Metabolismus sind im einzelnen die Zeiten und Dosierungsmengen von Insulininjektionen, die Zeiten und Mengen von Essensaufnahmen (Basalinsulin u
Dabei ist zu beachten, daß die Einflüsse von Insulin, Essensaufnahme und sportlichen Übungen auf den Blutzuckerspiegel verzögert eintreten und bevorzugt durch lineare Antwortfunktionen der Form
Die funktionalen Abhängigkeiten für den Verdauungsapparat gj(.) sind dabei weniger bekannt. Es wird deshalb ebenfalls die Gleichung von obiger Form angenommen. Die Antwortfunktionen gj(.) beschreiben den Verzögerungseffekt der Eingänge auf den Blutzuckerspiegel. Dabei wird davon ausgegangen, daß die Gleichung der Form gj(.) ausreicht, um sämtliche Variationen der Verzögerungen der Eingänge abzubilden und das sie an die Physiologie des Patienten durch Variation der einzelnen Parameter aj, bj angepaßt werden kann. Um die hochgradig nichtlinearen physiologischen Zusammenhänge zwischen den Antwortfunktionen V
Für das lineare Fehlermodell wird ebenfalls ein Modell zweiter Ordnung verwendet
Tabelle 1 zeigt dabei die Varianz der verschiedenen Vorhersagemodelle.
Zunächst wurde das rückwärtsgerichtete neuronale Netz im Freilaufmodus untersucht (RNN-FR). Dabei wurde der Blutzuckerspiegel zur Zeit t als der Ausgang des neuronalen Netzes gemäß
Die Kombination aus rekurrentem neuronalen Netzwerk und linearem Fehlermodell zweiter Ordnung der Form
Wie Tabelle 1 weiter zeigt, erreicht dieses Modell RNN-LEM2 die beste Leistungsfähigkeit, indem es die Varianz zu 44.9 % erklärt (das Fehlermodell erster Ordnung RNN-LEM1 kommt lediglich auf 43.7 %). Zum Vergleich mit anderen Methoden, wird ebenfalls die Leistungsfähigkeit des linearen Fehlermodells LEM, das alle Eingänge ignoriert, aufgezeigt, und des linearen Modells (LM-FR) das ohne Fehlermodell arbeitet und mit Hilfe der Echtzeitlernregel für rekurrente neuronale Netze trainiert wird. Ebenfalls dargestellt ist das lineare Modell mit dem Fehlermodell (LM-LEM). Dadurch das die nichtlinearen Modell bei weitem bessere Resultate erzielen (RNN-FR, RNN-TF, RNN-LEM), als ihr linearen Gegenstücke, wird bestätigt, daß das System sich in hohem Maße nichtlinear verhält.
Figur 4 zeigt einige Beispiele von Ergebnissen mit den unterschiedlichen Modellen. Sie sind in einem Diagramm D10 zusammengefaßt, das zeigt, wie gut die Unterschiedlichen Modelle K10, K20 und K30 einzelne Meßwerte der Zeitreihe M10, M20 und M30 annähern können. Im Diagramm D10 ist nach oben der Blutglukosegehalt in mg/dl und nach rechts die Zeit in Stunden angegeben. Mit K30 ist der Systemverlauf angegeben, den man durch Modellierung mit dem neuronalen Netzwerk im Freilaufmodus erzielt. Mit dem rekurrenten neuronalen Netzwerk, das im "Teacher Forcing" Modus betrieben und trainiert wird, kann in bezug auf die Meßwerte ein besserer Kurvenverlauf erzielt werden, als mit der Behandlung des Meßwertes im Freilaufmodus, was Kurve K20 veranschaulicht. Der beste Kurvenverlauf ergibt sich durch die Kurve K10, also durch eine Modellierung mit einem linearen Fehlermodell und einem rekurrenten neuronalen Netzwerk in Kombination.
In Figur 5 sind in einem Diagramm D20 nach rechts die Zeit aufgetragen und nach oben die Varianz der Vorhersage in mg/dl. Dargestellt ist diese Signalkurve SIG10 für die Modellierung des Systemverhaltens mit dem linearen Fehlermodell und dem rekurrenten neuronalen Netzwerk in Kombination. Die Varianz der Vorhersage wird dabei mit dem linearen iterierten Kalman-Filter berechnet. Wie Figur 5 weiter zeigt, ist die Standardabweichung um einen Meßwert herum vergleichsweise klein und konvergiert dann gegen einen konstanten Wert. Basierend auf der Vorhersage und der geschätzten Varianz ist es also möglich eine Risikoanalyse für den Diabetiker durchzuführen, um ihn vor gefährlichen metabolischen Zuständen des Blut-Insulin-Metabolismus zu warnen.
Im folgenden werden die mathematischen Grundlagen für die Anpassung und das Training des linearen Fehlermodells dargestellt. Die Modellierung und Beobachtungsgleichungen des allgemeinen Modells ergeben sich zu:
Zur Beschreibung der Gleichungen für das lineare Fehlermodel zur Maximierung der "likelihood" des Modells wird wie folgt vorgegangen: es werden die geschätzten Parameter zur (r + 1)-sten Iteration des Fehlermodells zu den Werten µ, Σ, θ, Q, definiert, welche die Gleichung
Um die durch Gleichung 8 angegebene bedingte Erwartung zu berechnen, wird der folgende Satz von Rekursionsformeln, der die Standard Kalman-Filter-Ergebnisse auswertet, benutzt [1]. Zunächst wird dabei die Vorwärtsrekursion angegeben:
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于安全态势感知的传感云双层网络防御系统及方法 | 2020-05-15 | 506 |
预测自动语音识别系统中的短语识别质量 | 2020-05-19 | 561 |
一种GIS隔离开关触头温度预测方法、装置及可读存储介质 | 2020-05-16 | 873 |
一种基于三维空间时序建模的深度视频人体行为识别方法 | 2020-05-19 | 456 |
基于伪标签方法和弱监督学习的过程数据故障分类方法 | 2020-05-08 | 385 |
一种三维点云的处理方法、装置及设备 | 2020-05-11 | 190 |
一种基于三维立体视觉和点云深度学习的机器人上料系统 | 2020-05-12 | 653 |
一种文本分类方法及系统 | 2020-05-13 | 822 |
一种基于对抗生成网络的人脑效应连接识别方法 | 2020-05-16 | 365 |
用于监测车辆盲区的方法和装置 | 2020-05-12 | 964 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。