METHOD AND DEVICE FOR THE PROBABILISTIC PREDICTION OF SENSOR DATA - IAV GMBH INGENIEURGESELLSCHAFT AUTO & VERKEHR

Title:

METHOD AND DEVICE FOR THE PROBABILISTIC PREDICTION OF SENSOR DATA

Document Type and Number:

WIPO Patent Application WO/2020/192827

Kind Code:

Abstract:

The invention relates to a computer-implemented method for the probabilistic prediction of sensor data. Starting from existing time curves of a target variable and optionally from further auxiliary variables, an RCGAN according to the invention is able to calculate the probability distribution of future values of the target variable and to predict the future values of the target variable therefrom. The predicted future values of the target variable can be fed back to the technical system in which the method according to the invention is used so that the latter can adjust parameters on the basis of the obtained findings. The prediction of the filling amount of cylinders of an internal combustion engine is used here as a specific technical application.

Inventors:

SCHULTALBERS MATTHIAS (DE)
SCHICHTEL PETER (DE)
KOOCHALI ALIREZA (DE)
AHMED SHERAZ (DE)

Application Number:

PCT/DE2020/100165

Publication Date:

October 01, 2020

Filing Date:

March 10, 2020

Export Citation:

Click for automatic bibliography generation Help

Assignee:

IAV GMBH INGENIEURGESELLSCHAFT AUTO & VERKEHR (DE)

International Classes:

G05B13/02

Foreign References:

DE19756919A1	1998-10-08
DE102018200816B3	2019-02-07
DE19756919A1	1998-10-08
DE102004041708B4	2006-07-20

Other References:

HENRIK ARNELID: "Sensor Modelling with Recurrent Conditional GANs Recurrent Conditional Generative Adversarial Networks for Generating Artificial Real-Valued Time Series Master's thesis in Complex Adaptive Systems", 1 January 2018 (2018-01-01), XP055685157, Retrieved from the Internet [retrieved on 20200414]
ZHANG CHI ET AL: "Generative Adversarial Network for Synthetic Time Series Data Generation in Smart Grids", 2018 IEEE INTERNATIONAL CONFERENCE ON COMMUNICATIONS, CONTROL, AND COMPUTING TECHNOLOGIES FOR SMART GRIDS (SMARTGRIDCOMM), IEEE, 29 October 2018 (2018-10-29), pages 1 - 6, XP033478150, DOI: 10.1109/SMARTGRIDCOMM.2018.8587464
CHENG FENG ET AL: "A Deep Learning-based Framework for Conducting Stealthy Attacks in Industrial Control Systems", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 19 September 2017 (2017-09-19), XP080817359
C. ESTEBANS. L. HYLANDG. RÄTSCH: "Real-valued (medical) time series generation with recurrent conditional gans", ARXIV PREPRINT ARXIV: 1706.02633, 2017

Download PDF:

View/Download PDF PDF Help

Claims:

Patentansprüche

1. Computerimplementiertes Verfahren zur probabilistischen Vorhersage von Sensordaten einer Zielgröße eines technischen Systems (1), umfassend die Schritte:

• vor der probabilistischen Vorhersage der Sensordaten:

Erzeugen eines wiederkehrenden bedingten generativen gegnerischen

Netzwerkes (RCGAN);

Trainieren des erzeugten RCGAN^'s mittels Testdaten des technischen Systems (1);

• während der probabilistischen Vorhersage der Sensordaten:

Bereitstellen des zeitlichen Verlaufs der Zielgröße durch das technische System (1); Erzeugen eines historischen Bedingungszeitfensters (C) aus dem Verlauf der Zielgröße durch das technische System (1);

Berechnung der Wahrscheinlichkeitsverteilung zukünftiger Werte der Zielgröße durch das trainierte RCGAN, unter Verwendung des historischen

Bedingungszeitfensters (C);

Vorhersagen eines in der Zukunft liegenden Sensordatenwertes der Zielgröße unter Verwendung der berechneten Wahrscheinlichkeitsverteilung durch das trainierte RCGAN;

Rückführung des vorhergesagten Sensordatenwertes der Zielgröße in das technische System (1), sodass dieses den vorhergesagten Wert der Zielgröße weiterverarbeiten kann.

2. Computerimplementiertes Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die zeitlichen Verläufe von Hilfsgrößen (S) zusätzlich durch das technische System (1)

bereitgestellt werden sowie dass das historische Bedingungszeitfenster (C) zusätzlich aus den Verläufen der Hilfsgrößen (S) erzeugt wird.

3. Computerimplementiertes Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass durch Anwendung des Verfahrens nach Anspruch 1 oder 2 eine Steuerung eines technischen Prozesses erfolgt.

4. Computerimplementiertes Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das technische System (1) eine Maschine, eine Antriebsmaschine, eine Kraftmaschine oder eine elektrische Maschine ist.

5. Computerimplementiertes Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass das technische System (1) eine Verbrennungskraftmaschine eines Fahrzeuges und die Zielgröße die Füllungsmenge (f_r) der Zylinder von dieser ist.

6. Computerimplementiertes Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass die Hilfsgrößen (S) eine physikalische Zeitverzögerung, die Motordrehzahl (n_mot), die relative Zylinderfüllung (rl), die Nockenwellenverstellung, die Drosselklappenstellung, den Ansaugdruck, das Luft-Kraftstoff-Verhältnis, die Kühlmitteltemperatur (T_mot) und die Ansauglufttemperatur umfassen.

7. Computerimplementiertes Verfahren nach Anspruch 5 oder 6, dadurch gekennzeichnet, dass das Weiterverarbeiten des vorhergesagten Sensordatenwertes der Füllungsmenge (f_r) die Verstellung wenigstens einer Hilfsgröße (S) umfasst.

8. Vorrichtung die eingerichtet ist, ein Verfahren nach einem der Ansprüche 1 bis 2 und 4 bis 6 auszuführen.

9. Vorrichtung nach Anspruch 8, mit einer Antriebssteuereinheit (2) einer

Verbrennungskraftmaschine, die eingerichtet ist, um

• zeitliche Verläufe der Füllungsmenge (f_r) sowie weiterer Sensordaten (4) zu erfassen und weiter zu verarbeiten;

• ein historisches Bedingungszeitfenster (C) aus den zeitlichen Verläufen der

Füllungsmenge (f_r) und weiterer Sensordaten (4) zu erzeugen;

• ein RCGAN zu speichern und zu verarbeiten;

• die Wahrscheinlichkeitsverteilung zukünftiger Sensordatenwerte der Füllungsmenge (f_r) aus dem historischen Bedingungszeitfenster (C), unter Verwendung des RCGAN^'s, zu berechnen;

• zukünftige Sensordatenwerte der Füllungsmenge (f_r) aus der berechneten

Wahrscheinlichkeitsverteilung zu bestimmen;

• die berechneten zukünftigen Sensordatenwerte der Füllungsmenge (f_r) weiter zu

verarbeiten.

10. Antriebssteuereinheit (2) nach Anspruch 9, dadurch gekennzeichnet, dass die

Weiterverarbeitung der berechneten zukünftigen Werte der Füllungsmenge (f_r) die Verstellung wenigstens einer der Hilfsgrößen (S) Motordrehzahl (n_mot), relative Zylinderfüllung (rl),

Nockenwellenverstellung, Drosselklappenstellung, Ansaugdruck, Luft-Kraftstoff-Verhältnis, Kühlmitteltemperatur (T_mot) umfasst.

Description:

Verfahren und Vorrichtung zur probabilistischen Vorhersage von Sensordaten

Beschreibung

Technisches Gebiet

Die vorliegende Erfindung betrifft das Gebiet der die Wahrscheinlichkeitsverteilung

berücksichtigenden Vorhersage zukünftiger Werte von Zeitreihen, unter Anwendung von generativen gegnerischen Netzwerken („generative adversarial networks“ - GAN),

insbesondere zur Prognose von Sensordaten einer Antriebseinheit, in der Anwendung der Prognose der Füllung von Zylindern einer Verbrennungskraftmaschine.

Stand der Technik

Die Vorhersage zukünftiger Werte von gegebenen Zeitreihen von Kenngrößen technischer Systeme kann das Verhalten jener technischen Systeme bezüglich Performance, Effizienz und Effektivität positiv beeinflussen. Speziell in der Ausführung der Prognose der Füllung von Zylindern einer Verbrennungskraftmaschine eines Kraftfahrzeuges kann auf diese Art und Weise eine vorausschauende Steuerung des gesamten Antriebsstranges des Kraftfahrzeuges erfolgen, was zu verringertem Verschleiß der Komponenten, einem reduzierten

Kraftstoffverbrauch und einhergehend zu reduziertem Schadstoffausstoß, bei gleichzeitiger leistungsgerechter Gewährleistung der Performance führt. Zur Vorhersage von zukünftigen Werten, ausgehend von vergangenen Daten, existieren verschiedene Methoden.

Durch die Methode der Regression zur Mitte kann beispielsweise auf einfache Art und Weise ein nachvollziehbares Ergebnis erzeugt werden. Hierbei sind statistische Modelle, wie ARMA (Auto Regressive-Moving Average) oder ARIMA bekannt. Auf dem Gebiet des maschinellen Lernens zählen hierzu die SVM („Support-Vector-Machine“), evolutionäre Algorithmen, Fuzzy Logic, sowie künstliche neuronale Netze. Methoden der Regression zur Mitte berücksichtigen jedoch die Schwankungen um den Mittelwert nicht, weisen bei Wahrscheinlichkeitsverteilungen von komplexen Systemen keine Überlappung mit dem wahren Wert auf und können ihr Ergebnis bei gegebenen Wahrscheinlichkeitsverteilungen nicht verbessern.

Die Wahrscheinlichkeitsverteilung berücksichtigende, oder mit anderen Worten probabilistische Vorhersage von zukünftigen Werten beruht auf der Quantifizierung der Varianz einer

Vorhersage. Hierbei sind Verteilungsschätzungen, wie die bedingte Quantilregression oder die expektile Regression bekannt. Weiterhin werden hierfür Modelle der Bayes’schen

Wahrscheinlichkeitstheorie verwendet. Bei diesen Ansätzen entsteht zum einen die Gefahr von Quantilüberschneidung und zum anderen sind sie rechenintensiv und erfordern eine geeignete Vorverteilung, die vom Anwender ausgewählt werden muss. Durch die Anwendung von GAN’s entsteht die Möglichkeit, dass ein technisches System unbekannte Wahrscheinlichkeitsverteilungen aus einer Auswahl von Stichproben aus der datengenerierenden (physikalischen) Verteilung lernt. Dadurch werden synthetische Daten erzeugt, die der so erlernten Wahrscheinlichkeitsverteilung folgen. Auf diese Art und Weise können GAN ^'s trainiert werden, um zukünftige Werte aus einer Historie von Daten zu prognostizieren. Allerdings entsteht das Problem der Bewertung, ob die nach solcherart entstandenen Daten realistisch sind. Aus diesem Grund beschränkt sich die Erzeugung von synthetischen, realistischen Daten mittels GAN weitestgehend auf Anwendungen, deren Ergebnisse ein menschlicher Betrachter intuitiv bewerten kann, wie Bild-, Text-, Sprach- und Musikdaten.

In DE102018200816B3 wird ein GAN verwendet, um künstliche Benutzerdaten eines Fahrers eines Fahrzeuges zu erzeugen. Die künstlichen Benutzerdaten basieren dabei auf im Vorfeld analysierten echten Benutzerdaten. In der bekannten Arbeitsweise eines GAN’s erzeugt ein Generatornetzwerk künstliche Benutzerdaten und ein Diskriminatornetzwerk unterscheidet zwischen künstlichen und echten Benutzerdaten, sodass das Generatornetzwerk und das Diskriminatornetzwerk auf Grundlage dieser Unterscheidung trainiert werden, sodass das Generatornetzwerk später als künstliches Benutzermodell verwendet werden kann. Für diese Anwendung reicht es aus, künstliche Benutzerdaten zu erzeugen, welche realistisch aussehen, jedoch nicht mit einer gegebenen Wahrscheinlichkeitsverteilung oder mit anderen Worten, mit den wahren Werten (Grundwahrheit) verglichen werden.

In C. Esteban, S. L. Hyland, G. Rätsch:“Real-valued (medical) time series generation with recurrent conditional gans.” arXiv preprint arXiv: 1706.02633, 2017, wird ein Ansatz zum

Erzeugen von realistischen Werten von medizinischen Zeitreihen, unter Verwendung von wiederkehrenden bedingten GAN’s („recurrent conditional GAN“ - RCGAN) offenbart. Ziel ist die Prognose von Messwerten zur Patientenüberwachung. Dabei soll auf Grundlage der Messwerte verschiedener Messgrößen der Patienten aus einem vergangenen Zeitraum prognostiziert werden, ob einzelne Messgrößen in einem bestimmten Zeitraum in der Zukunft definierte Grenzwerte überschreiten. Hierbei werden RCGAN ^'s verwendet, wobei das

Generatornetzwerk und das Diskriminatornetzwerk jeweils durch wiederkehrende neuronale Netze („recurrent neural network“ - RNN) ersetzt sind und insbesondere durch Long-Short- Term-Memory (LSTM) dargestellt werden. Das Generatornetzwerk nimmt zu jedem Zeitpunkt, in dem ein weiterer zukünftiger Wert der Zeitreihe prognostiziert wird, einen zufälligen Wert aus einem Rauschvektor sowie eine zusätzliche Bedingung und erzeugt daraus einen Signalwert. Den vorangegangenen Werten sind dabei Bezeichnungen zugeordnet. Durch diesen fortlaufenden Vorgang entsteht eine synthetische Zeitreihe. Das Diskriminatornetzwerk erhält die synthetisch erzeugten Werte und erstellt für jeden Zeitschrift eine Unterscheidung in synthetisch oder realistisch und versucht auf diese Art und Weise das Verhalten der Zeitreihe zu lernen. Das Diskriminatornetzwerk wird hierbei darauf trainiert, die durchschnittliche negative Kreuzentropie seiner Vorhersagen pro Zeitschritt und den Bezeichnungen der Werte zu minimieren. Bewertet wird das Modell durch das Testen eines Modells, das mit synthetisch erzeugten Werten gelernt wurde, auf reale Daten oder durch Testen eines Modells, das mit realen Daten gelernt wurde, auf synthetische Werte. Es wird zusätzlich auf die Problematik hingewiesen, dass ein nach solcherart gelerntes Modell lediglich die Trainingsdaten speichern und wiedergeben könnte. Weiterhin wird die Möglichkeit in Aussicht gestellt, das Ergebnis anhand der Wahrscheinlichkeitsverteilung der Ausgangsdaten (Grundwahrheit) bewerten zu können.

Zur Bestimmung und Vorhersage der Befüllung eines Zylinders einer

Verbrennungskraftmaschine sind durch den Stand der Technik Berechnungsmethoden nach DE19756919A1 und DE102004041708B4 bekannt.

Bekannte Verfahren zur Vorhersage von zukünftigen Werten technischer Systeme, wie

Sensordaten von Vorrichtungen zum Steuern einer Antriebseinheit, insbesondere der Befüllung der Zylinder einer Verbrennungskraftmaschine, bilden die Realität nur unzureichend genau ab. Verfahren zur probabilistischen Vorhersage zukünftiger Werte von Zeitreihen von Sensordaten werden in technischen Systemen aus Mangel an der Bewertbarkeit ihrer Prognosen bezüglich realistischer Ergebnisse nicht zur Steuerung von Antriebseinheiten, insbesondere von

Verbrennungskraftmaschinen angewendet.

Aufgabe der Erfindung

Die Aufgabe der vorliegenden Erfindung ist es daher, ein Verfahren und eine Vorrichtung bereitzustellen, das eingerichtet ist, um zukünftige Werte einer Zeitreihe, insbesondere

Sensordaten von technischen Systemen, insbesondere einer Antriebseinheit, insbesondere die Füllung von Zylindern einer Verbrennungskraftmaschine probabilistisch und bewertbar vorherzusagen.

Lösung der Aufgabe

Die Aufgabe wird durch ein Verfahren nach Patentanspruch 1 und eine Vorrichtung nach Patentanspruch 8 gelöst. Weitere Varianten und Ausführungsformen ergeben sich durch die Unteransprüche.

Darstellung und Vorteile der Erfindung

Der vorliegenden Erfindung liegt die Intention zu Grunde, einem RCGAN mit

erfindungsgemäßer Architektur die Wahrscheinlichkeitsverteilung der Werte eines Sensors eines technischen Systems zu erlernen, sodass das fertig gelernte Generatornetzwerk des RCGAN's fähig ist, zukünftige Werte des Sensors vorherzusagen, sodass das technische System, ausgehend von der Kenntnis des zukünftigen Wertes des Sensors eigenständig Vorkehrungen treffen kann, um eine gewünschte Funktionsweise zu realisieren. In einer Ausführungsform kann das technische System der Antriebsstrang, eine Antriebsmaschine oder eine anders geartete Antriebseinheit eines Fahrzeuges sein und der Sensor eine Kenngröße bereitstellen, welche durch das technische System verarbeitet wird und von welcher weitere Kenngrößen abhängig sein können. Alternativ kann das technische System generell eine Maschine, eine sonstige Antriebsmaschine oder Kraftmaschine oder auch eine elektrische Maschine sein, die in der Lage ist technische Prozesse zu steuern. In einer erfindungsgemäßen Ausführungsform kann das technische System eine Verbrennungskraftmaschine eines

Fahrzeuges und die Kenngröße des Sensors, von welchem die zukünftigen Werte vorhergesagt werden sollen, die Füllungsmenge der einzelnen Zylinder der Verbrennungskraftmaschine sein. Zum besseren Verständnis und als Unterstützung der Beschreibung wird sich auf folgende Abbildungen bezogen. Hierbei zeigen:

Fig. 1 die Vorhersage und den zeitlichen Verlauf eines beispielhaften Sensordatenwertes,

Fig. 2 ein technisches System zur Ausführung des erfindungsgemäßen Verfahrens,

Fig. 3 ein System zum Trainieren des erfindungsgemäßen RCGAN’s,

Fig. 4 das Verfahren zum Trainieren des erfindungsgemäßen RCGAN’s,

Fig. 5 den Aufbau des Generatornetzwerkes,

Fig. 6 den Aufbau des Diskriminatornetzwerkes.

Das erfindungsgemäße Verfahren zur Vorhersage von Sensordaten umfasst nunmehr folgende grundlegende Schritte:

• Trainieren eines erfindungsgemäßen RCGAN ^'s mittels erhobener Daten eines

technischen Systems;

• Bereitstellen der zeitlichen Verläufe der Zielgröße und der Hilfsgrößen des technischen Systems;

• Erzeugen eines Bedingungszeitfensters aus den zeitlichen Verläufen der Zielgröße und den Hilfsgrößen;

• Berechnung der zukünftigen Wahrscheinlichkeitsverteilung der Zielgröße durch das erfindungsgemäße RCGAN;

• Bestimmung eines in der Zukunft liegenden Wertes der Zielgröße aus der berechneten Wahrscheinlichkeitsverteilung;

• Rückführung des vorhergesagten Wertes der Zielgröße in das technische System,

sodass dieses, unter Verwendung der Zielgröße, Einstellungen verändern kann. Bezugnehmend auf Fig. 1 erzeugt das erfindungsgemäße Verfahren fortlaufend, zu jedem Zeitpunkt t, zu welchem es den Wert x(t) der Zeitreihe der durch den interessierenden Sensor abgebildeten Kenngröße innehat, den künstlichen vorhergesagten zukünftigen Wert x _p(t+1), der dem realen zukünftigen Wert x _r(t+1) entsprechen soll. Analog dazu, wird im folgenden

Zeitschrift der zukünftige Wert, der im aktuellen Diagramm x _r(t+2) entspricht, vorhergesagt.

Dazu berücksichtigt das erfindungsgemäße Verfahren die Historie der Zeitreihe der

abgebildeten Kenngröße x(t) bis zu einem beliebig weit in der Vergangenheit zurückliegenden Zeitpunkt. Beispielhaft ist hierfür in Fig. 1 der Zeitraum {to, ... ,t} dargestellt. Der angewendete historische Zeitraum kann von der Abtastrate des Sensors, von der

Messdatenaufnahmeauflösung, der Messdatenverarbeitungsauflösung oder weiteren begrenzenden Eigenschaften des technischen Systems abhängig sein, sodass der historische Zeitraum und insbesondere die Intervalle zwischen den einzelnen Zeitschriften beliebig vom Anwender gewählt werden können. Die zu dem betrachteten historischen Zeitraum {t ₀,... ,t} zugehörigen Werte werden im Folgenden als das historische Bedingungszeitfenster

C={x(to), ... ,x(t)} oder auch nur Bedingungszeitfenster (C) bezeichnet.

Fig. 2 zeigt den schematischen Aufbau eines technischen Systems (1) zur Ausführung des erfindungsgemäßen Verfahrens. In einer Ausführungsform umfasst das technische System (1) eine Antriebssteuereinheit (2), ein Generatornetzwerk (G), einen interessierenden Sensor (3) und optional weitere Sensoren (4). Die Antriebssteuereinheit (2) ist eingerichtet, um vom Generatornetzwerk (G) erzeugte, künstliche vorhergesagte zukünftige Werte x _P(t+1) zu verarbeiten. Das Generatornetzwerk (G) ist eingerichtet, um das Bedingungszeitfenster C der Historie der Sensordaten vom interessierenden Sensor (3) sowie der weiteren Sensoren (4) aufzunehmen und daraus den zukünftigen Wert x _p(t+1) des interessierenden Sensors (3) vorherzusagen. Der zukünftige Wert x (t+1) wird anschließend wieder zurück in die

Antriebssteuereinheit (2) geführt, sodass diese, ausgehend von der Kenntnis über die Prognose von x(t), Vorkehrungen treffen oder Parameter verstellen kann, um den Anforderungen zu genügen, welche an das technische System gestellt werden.

In einer Ausführungsform ist die Antriebssteuereinheit (2) die Motorsteuereinheit (ECU) einer Verbrennungskraftmaschine und die Kenngröße des interessierenden Sensors (3) die

Füllungsmenge der Zylinder der Verbrennungskraftmaschine. Die Füllungsmenge kann hierbei das physikalische Äquivalent zum Steuerhub oder einem Steuerfaktor f _r einer bekannten Lambdasteuerung, welche die Füllungsmenge in einem Zylinder zumindest indirekt darstellt, sein. Alternativ kann jede weitere Kenngröße verwendet werden, welche die Füllungsmenge unmittelbar oder indirekt darstellt. In einer weiteren Ausführungsform sind weitere Kenngrößen durch die Sensordaten weiterer Sensoren (4) durch die Antriebssteuereinheit (2) oder die Motorsteuereinheit (ECU) gegeben. Die Kenngrößen der Sensordaten weiterer Sensoren (4) können beispielsweise die Motordrehzahl (n _mot), der Ansaugdruck, die Nockenwellenverstellung, die Drosselklappenstellung, Lambdawerte, Kühlmitteltemperatur (T _mot) und weitere sein, welche die Kenngröße des interessierenden Sensors (3) beeinträchtigen oder durch diese selbst beeinflusst werden. Die Kenngrößen der Sensordaten der weiteren Sensoren (4) werden im Folgenden unter dem Begriff der Hilfsgrößen zusammengefasst, die Kenngröße des

interessierenden Sensors (3) wird als Zielgröße bezeichnet.

Um einen zukünftigen Wert der Zielgröße erfindungsgemäß vorherzusagen, wird das

Generatornetzwerk (G) im Vorfeld der Anwendung trainiert. In Fig. 3 ist der schematische Aufbau eines Systems (5) zum Trainieren des erfindungsgemäßen RCGAN’s dargestellt. Das System (5) umfasst das Generatornetzwerk (G) und ein Diskriminatornetzwerk (D), wobei das Bedingungszeitfenster C={x(t ₀), ... ,x(t)} jeweils als Eingangsgröße für beide Netzwerke (G, D) dient. In einer vorteilhaften Ausführungsform werden sowohl bei der Anwendung, als auch beim Training des Generatornetzwerkes (G) die Hilfsgrößen S={y(t ₀),... ,y(t)} verwendet, wobei diese ebenfalls als Eingangsgrößen für das Generatornetzwerk (G) und das

Diskriminatornetzwerk (D) dienen. Eine weitere Eingangsgröße für das Generatornetzwerk (G) ist der Rauschvektor (Z). Der Rauschvektor (Z) folgt einer bekannten

Wahrscheinlichkeitsverteilung p _RauSch(z). In einer vorteilhaften Ausführungsform ist p _RauSch(z) eine Gauß’sche Normalverteilung, mit einem Mittelwert von 0 und einer Standardabweichung von 1. Alternativ kann jede weitere bekannte Wahrscheinlichkeitsverteilung als Vorverteilung verwendet werden. Während des Trainings erzeugt das Generatornetzwerk (G) aus dem Bedingungszeitfenster (C) und dem Rauschvektor (Z) künstliche zukünftige Werte x (t+1).

Zusätzlich werden aus einem Trainingsdatensatz (6) reale zukünftige Werte x _r(t+1) entnommen. Sowohl die künstlich erzeugten, als auch die realen zukünftigen Werte (x _p(t+1), x _r(t+1 )) dienen als Eingangsgröße für das Diskriminatornetzwerk (D). Das Diskriminatornetzwerk (D) erstellt für jeden Zeitschrift aus dem Bedingungszeitfenster (C) und dem künstlich erzeugten oder realen zukünftigen Wert (x _p(t+1), x _r(t+1 )) eine Bewertung (7), wobei in dieser hinterlegt ist, ob es sich bei dem vorhergesagten zukünftigen Wert um einen richtigen (R) oder falschen (F) Wert handelt. Richtig (R) im Sinne der Erfindung bedeutet, dass der vorhergesagte zukünftige Wert (x _t+i = x (t+1) = x _r(t+1)) einer bekannten Wahrscheinlichkeitsverteilung folgt und falsch (F) entsprechend, dass der Wert x _t+i dieser Wahrscheinlichkeitsverteilung nicht folgt.

In Fig. 4 ist das Verfahren zum Trainieren des erfindungsgemäßen RCGAN’s dargestellt. Für jedes Training wird ein bekannter, vorhandener Datensatz in drei Teildatensätze unterteilt. In einer Ausführungsform werden 50% des vorhandenen Datensatzes als Trainingsdatensatz,

10% als Validierungsdatensatz und 40% als Testdatensatz (11) verwendet. Alternativ ist jede weitere Aufteilung des Datensatzes möglich. Ein Datensatz im Sinne der Erfindung besteht aus mehreren Wertepaaren der Sensordaten, die durch das technische System (1) erzeugt wurden. Auf diese Art und Weise kann für das Training des RCGAN das reale Verhalten der

spezifischen Anwendung des technischen Systems (1) abgebildet werden. Alternativ kann ein Datensatz künstlich erzeugt werden, beispielsweise durch Simulation des gesamten oder von Teilen des technischen Systems (1). In einem Trainingsdurchlauf wird in einem ersten

Schritt (S010) ein Teil des Trainingsdatensatzes entnommen, an welchem dann in einem weiteren Schritt (S020) das Generatornetzwerk (G) trainiert wird. In einem weiteren

Schritt (S030) wird das Diskriminatornetzwerk (D), unter Verwendung eines weiteren unabhängigen Teils des Trainingsdatensatzes (6), trainiert. In einem weiteren Schritt (S040) wird das Ergebnis des Trainings unter Verwendung des Validierungsdatensatzes bewertet und anschließend überprüft, ob das Ergebnis den Anforderungen der Anwendung im technischen System (1) genügt (S050). Ist dies nicht der Fall (n), erfolgt ein weiterer Trainingsdurchlauf, beginnend beim ersten Schritt (S010). Genügt das Ergebnis den Anforderungen (j), ist das Training beendet.

Der gesamte Datensatz weist eine unbekannte Wahrscheinlichkeitsverteilung p _Data(x) auf, von der die bekannte Generatorverteilung p _G(x) zunächst abweicht (Fig. 4, oben). Während des Trainings wird aus der bekannten Vorverteilung p _RauSch(z) der Rauschvektor (Z) entnommen.

Das Generatornetzwerk (G) versucht aus dem Rauschvektor (Z) und dem

Bedingungszeitfenster (C) eine Probe zu erzeugen, die der unbekannten

Wahrscheinlichkeitsverteilung p _Data(x) folgt. Gleichzeitig versucht das Diskriminatornetzwerk (D) zwischen der künstlichen Probe und einer realen Probe aus dem Trainingsdatensatz (6) zu unterscheiden. Mathematisch betrachtet, wird während des Trainings die Wertefunktion V(G, D) nach GI.1 berechnet:

Mit anderen Worten lernt das Generatornetzwerk (G), unter Verwendung der bekannten Wahrscheinlichkeitsverteilung p _Rausch(z), eine Generatorverteilung p _G(x) zu erzeugen, welche der Wahrscheinlichkeitsverteilung p _Data(x) des Trainingsdatensatzes ähnelt (Fig. 4, unten). In einer vorteilhaften Ausführungsform, wobei Hilfsgrößen in die Vorhersage der Zielgröße einbezogen werden, kann das erfindungsgemäße RCGAN auf die zusätzlichen Informationen y(t) konditioniert werden. Diese können jede Art von Informationen sein, wie bspw.

Klassenlables oder weitere Daten. In einer vorteilhaften Ausführungsform entsprechen diese Information den Hilfsgrößen S={y(to), ... ,y(t)} und sind somit Kenngrößen des technischen Systems (1), die durch weitere Sensoren (4) produziert werden können. Die Hilfsgrößen können hierbei sowohl dem Generatornetzwerk (G) als auch dem Diskriminatornetzwerk (D) als zusätzliche Eingangsgröße dienen. Hierbei ergibt sich die Wertefunktion V(G, D) nach Gl. 2: [logD(x|y)] + E _z„Pz(z) pog(l - D(G(z|y)))] (2)

Um nun die Wahrscheinlichkeitsverteilung des zukünftigen Wertes x _t+i zu modellieren, wird die Gl. 2 auf das Bedingungszeitfenster C={x(to), ... ,x(t)} abgebildet, wobei die

Hilfsgrößen S={y(to), ... ,y(t)} in C integriert werden, sodass C={ x(to),... ,x(t); y(to), ... ,y(t)} und die Wertefunktion V(G, D) nach Gl. 3 wie folgt berechnet wird: ) pog(l - D(G(z|c)))] (3)

In Fig. 5 ist der Aufbau des Generatornetzwerkes (G) dargestellt. Das Generatornetzwerk (G) umfasst eine erste RNN-Schicht (8) und zwei dichte NN-Schichten (10, 11). Die erste RNN- Schicht (8) ist eingerichtet, um das Bedingungszeitfenster (C) zu verarbeiten und in einem Zustandsvektor (9) darzustellen. Die erste dichte NN-Schicht (10) ist eingerichtet, um den Zustandsvektor (9) und den Rauschvektor (Z) zu verarbeiten. Die zweite dichte NN-Schicht (11) ist eingerichtet, um die Ausgänge der ersten dichten NN-Schicht (10) zu verarbeiten und den künstlichen vorhergesagten zukünftigen Wert x _P(t+1) zu erzeugen.

Das Generatornetzwerk (G) nimmt dazu das Bedingungszeitfenster (C) und den

Rauschvektor (Z) als Eingangsgrößen auf und führt das Bedingungszeitfenster (C) in die erste RNN-Schicht (8). Die erste RNN-Schicht (8) erzeugt aus dem Bedingungszeitfenster (C) den Zustandsvektor (9) und verknüpft diesen mit dem Rauschvektor (Z). Zustandsvektor (9) und Rauschvektor (Z) werden in die erste dichte NN-Schicht (10) geführt, welche diese

weiterverarbeitet und in die zweite dichte NN-Schicht (11) führt. Hierfür umfasst die erste RNN- Schicht (8) eine definierte Anzahl an Zellen, welche im Folgenden mit der Variable RG beschrieben wird. Der Rauschvektor (Z) umfasst eine Anzahl von N Stichproben. Entsprechend umfasst die erste dichte NN-Schicht (10) eine Anzahl von RG + N Zellen. Die zweite dichte NN- Schicht (11) umfasst lediglich eine Zelle.

In Fig. 6 ist der Aufbau des Diskriminatornetzwerkes (D) dargestellt. Das

Diskriminatornetzwerk (D) umfasst eine erste RNN-Schicht (8) und eine dichte NN-Schicht (10). Die erste RNN-Schicht (8) ist eingerichtet, um das Bedingungszeitfenster (C) und einen zukünftigen realen Wert x _r(t+1) oder einen vorhergesagten künstlichen Wert x _p(t+1) zu verarbeiten und die Ergebnisse als Zustandsvektor in die dichte NN-Schicht (10) zu führen. Die dichte NN-Schicht (10) ist eingerichtet, um aus den Ergebnissen der ersten RNN-Schicht (8) eine Bewertung (7) zu erzeugen, wobei diese eine Gültigkeitsinformation (R, F) enthält. Das Diskriminatornetzwerk (D) nimmt also den künstlichen vorhergesagten zukünftigen Wert x _p(t+1) des Generatornetzwerks (G) für den Wert x _t+i oder den realen Wert x _r(t+1) aus dem Trainingsdatensatz (6), verknüpft diesen mit dem Bedingungszeitfenster (C) und führt dieses in die erste RNN-Schicht (8). Hierfür umfasst die erste RNN-Schicht (8) eine definierte Anzahl an Zellen, welche im Folgenden mit der Variable RD beschrieben wird. Die dichte NN-Schicht (10) umfasst lediglich eine Zelle.

In einer Ausführungsform sind die ersten RNN-Schichten (8) des Generatornetzwerks (G) und des Diskriminatornetzwerkes (D) LSTM („long short-term memory) oder GRU („gated recurerent unit“). Die Auswahl dieses Zelltyps wird im Folgenden in der Variable T beschrieben. Für die hier genannten Variablen, welche im Folgenden als Hyperparameter bezeichnet werden, wurden verschiedene Werte aufgestellt, welche in Kombination unterschiedliche

Ausführungsformen ergeben können. In Tab. 1 sind mögliche Werte für die Hyperparameter für das erfindungsgemäße Verfahren aufgelistet. Andere Werte und Typen sind möglich.

Bezeichnung Variable Werte

Zelltyp T GRU, LSTM

Zellanzahl Generator RG 1 , 2, 4, 8, 16, 32, 64, 128, 256

Zellanzahl Diskriminator RD 1 , 2, 4, 8, 16, 32, 64, 128, 256

Größe Rauschvektor Z 1 , 2, 4, 8, 16, 32

Größe der Bedingungen C 1 , 2, 4, 8, 16, 32, 64, 128, 256

Anzahl Trainingsiteration Diskriminator Di _ter 1 , 2, 3, 4, 5, 6, 7

Tabelle 1

Während des Trainings des erfindungsgemäßen RCGAN ^'s wird bei jedem Durchlauf des Verfahrens nach Fig. 4 das Generatornetzwerk (G) einmal und das Diskriminatornetzwerk (D) mehrmals trainiert. Bezugnehmend auf Tab. 1 wird die Anzahl der Iterationen, mit welchen das Diskriminatornetzwerk (D) innerhalb eines Trainingsdurchlaufes trainiert wird, als die Variable Di _ter bezeichnet. Sämtliche Hyperparameter, welche in Tab. 1 aufgeführt sind, werden für jeden Anwendungsfall spezifisch eingestellt. In einer vorteilhaften Ausführungsform des

erfindungsgemäßen Verfahrens erfolgt die Einstellung der Hyperparameter durch einen genetischen Algorithmus. Der genetische Algorithmus verwendet gerichtete Zufallsversuche, um optimale Lösungen in komplexen Problemen zu finden. Hierbei sind alle Hyperparameter in einem Vektor codiert, welcher als Gen bezeichnet wird. Der Algorithmus beginnt mit einer Reihe von zufällig initialisierten Genen, die einen Genpool bilden und versucht, das am besten optimierte Gen durch iterativen Fortschritt zu finden. Bei jeder Iteration werden die Gene im Genpool mit einer Anpassungsfunktion bewertet und diejenigen mit niedrigen Werten eliminiert. Dann werden die restlichen Gene verwendet, um Nachkommen zu bilden. Nach mehreren Iterationen konvergiert der Algorithmus zu einem Gen mit der am besten optimierten

Wertekombination. In einer Ausführungsform hat der Algorithmus einen Genpool der Größe 8 und es werden 8 Iterationen durchgeführt. Bei jeder Iteration werden hierbei die 4 Gene mit den besten Werten verwendet, um Nachkommen zu erzeugen. Dabei werden jeweils 4 Gene durch Gentausch erzeugt und 4 weitere durch Mutation. Mit dem nach solcherart erzeugten Gen wird anschließend eine Variante des erfindungsgemäßen RCGAN ^'s konstruiert und mit einem Trainingsdatensatz (6) trainiert, wobei dieses mittels Bewertung der Kullback-Leibler- Divergenz (KLD) durch einen Validierungsdatensatz validiert wird. Die KLD ist definiert durch:

Hierbei wird die Abweichung zwischen den Wahrscheinlichkeitsverteilungen P und Q bestimmt, wobei P die Datenverteilung und Q die Verteilung der Vorhersagewahrscheinlichkeit ist. Wenn daher, aufgrund des Auftretens von Q im Nenner, die vorhergesagte Verteilung die

Datenverteilung nicht korrekt abbildet, ist die KLD nicht definiert.

In einer alternativen Ausführungsform werden zur Bewertung des nach solcherart erzeugten erfindungsgemäßen RCGAN ^'s die bekannten punktuellen Fehlerkennzahlen RMSE und/oder MAE und/oder MAPE verwendet, welche wie folgt definiert sind:

Hierbei ist N die Anzahl der Datenproben, x, und £) sind die aktuellen Vorhersagen. Punktuelle Fehlerkennzahlen als Verlustfunktionen sind jedoch nur bedingt geeignet, um

Verteilungsähnlichkeiten zu beurteilen. Erfindungsgemäß vorteilhaft wird daher gegnerisches Training angewendet, um die neuronalen Netze für die Prognose zu trainieren.

In einer vorteilhaften Ausführungsform des erfindungsgemäßen Verfahrens wird ein Generator- Regressionsmodell konstruiert, welches die identische Struktur des Generators des

erfindungsgemäßen RCGAN ^'s aufweist. In diesem Generator-Regressionsmodell wird die Fehlerkennzahl RMSE als Verlustfunktion optimiert und dessen Ergebnisse dienen als Vergleich der konventionellen Methoden der Datenvorhersage mittels neuronalen Netzen, zu dem erfindungsgemäßen RCGAN. Bezugnehmend auf Fig. 4, wird das nach dem

erfindungsgemäßen Verfahren trainierte RCGAN während des Trainings, im Schritt der Validierung S040, mit dem trainierten Generator-Regressionsmodell verglichen. Zur Bewertung der jeweiligen Ergebnisse können die Fehlerkennzahlen RMSE, MAE, MAPE und/oder die KLD herangezogen werden.

In einer vorteilhaften Ausführungsform des erfindungsgemäßen Verfahrens werden zur Bewertung des erfindungsgemäßen RCGAN ^'s 100 Prognosen von x _t+i für jede Bedingung aus einem Testdatensatz entnommen und es wird die Vorhersagewahrscheinlichkeitsverteilung für den gesamten Testdatensatz berechnet. Anschließend wird KLD zwischen der

Vorhersagewahrscheinlichkeitsverteilung und der Datenverteilung des Testdatensatzes gebildet. Zum Vergleich wird, ausgehend von den Daten des Histogramms der Vorhersagen des Generator-Regressionsmodells, die KLD für dieses Modell bestimmt. Zur Bewertung mittels punktueller Fehlerkennzahlen kann die Prognose durch das erfindungsgemäße RCGAN 100- mal auf den Testdatensatz angewendet werden und daraus ein Mittelwert und die

Standardabweichung für die entsprechenden Fehlerkennzahlen berechnet werden. Alternativ kann die Anwendung des erfindungsgemäßen RCGAN ^'s auf den Datensatz beliebig oft erfolgen. Das Ergebnis der KLD gibt somit an, wie genau das erfindungsgemäße RCGAN die Verteilung aus dem Datensatz gelernt hat.

Je nach Anwendungsgebiet können unterschiedliche Datensätze als Trainingsdaten eingesetzt werden. In einer vorteilhaften Ausführungsform, in welcher das erfindungsgemäße Verfahren zur Prognose der Füllung der Zylinder einer Verbrennungskraftmaschine angewendet wird, wird ein Datensatz verwendet, welcher auf Grundlage der Lorenz-Gleichungen basiert. Die Lorenz- Gleichungen beschreiben die atmosphärische Konvektion a, die horizontale

Temperaturänderung b und die vertikale Temperatur c in Abhängigkeit von der Zeit t. Mit einem Punkt für die zeitliche Ableitung wird das System der gekoppelten Differentialgleichungen gegeben durch: ά = a(b— d),

b = a( - c), (8) c = ba— ßc wobei s proportional zur Prandtl-Zahl, g proportional zur Rayleigh-Zahl und ß mit den physikalischen Abmessungen der interessierenden Atmosphärenschicht verbunden ist. Eines der interessantesten Merkmale der Lorenz-Gleichungen ist die Entstehung von chaotischem Verhalten für bestimmte Werte der Parameter s, g und ß. In einer Ausführungsform werden die Parameter o = 16, g = 45,92 und ß = 4 verwendet. Alternativ kann jede weitere Kombination der Parameter s, g und ß erfolgen. Durch weiteres Festlegen der Ausgangsbedingungen für ao, bo und Co können aus diesem Gleichungssystem beliebige Zeitreihen x(t) entwickelt werden. Aus diesen Zeitreihen können weiterhin Stichproben entnommen werden, welche dann die

Wahrscheinlichkeitsverteilung der Daten abbilden und als Bedingungszeitfenster (C) verwendet werden können.

Alternativ können Daten nach dem Mackey-Glass-Ansatz erzeugt werden, welcher auf der folgenden Differentialgleichung zur Zeitverzögerung basiert:

In einer vorteilhaften Ausführung werden die Parameter dieser Differentialgleichung zu a = 0,1 , b = 0,2 und T = 17 gesetzt, um ein chaotisches Verhalten abzubilden.

Alternativ können Daten aus dem Internet-Traffic- Datensatz entnommen werden, der die Vorhersage des Internetverkehrs beinhaltet und auch als A5M bekannt ist.

Aufgrund der einzelnen Schritte, der Erhebung der zeitlichen Verläufe der Sensordaten, der Berechnung der Wahrscheinlichkeitsverteilung der Zielgröße durch das erfindungsgemäße RCGAN, der Rückführung des Ergebnisses in die Antriebssteuereinheit und die Verarbeitung des Ergebnisses durch diese, kann es zu einer zeitlichen Verzögerung kommen, sodass das erfindungsgemäße RCGAN auch Werte der Zielgröße berechnen kann, die weiter in der Zukunft liegen, als der nächste unmittelbar folgende Zeitschrift.

Ausführungsbeispiel

Nachfolgend werden Ausführungsbeispiele der beschriebenen Ausführungsformen aufgezeigt. Diese dienen der prinzipiellen Veranschaulichung, wobei das erfindungsgemäße Verfahren nicht durch die aufgezeigten Ausführungsbeispiele limitiert sein soll. Weitere Besonderheiten und Vorteile ergeben sich zusätzlich aus den unterstützenden Schaubildern, hierbei zeigen:

Fig. 7a Zeitreihen aus den Lösungen der Lorenz-Gleichungen, bei verschiedenen b ₀,

Fig. 7b zusätzliches Rauschen um die Zeitreihen,

Fig. 8a mögliche zukünftige Werte x _t+i, bei verschiedenen bo,

Fig. 8b die Gesamtheit der Wahrscheinlichkeitsverteilung x _t+i (Grundwahrheit),

Fig. 9 die prognostizierte Wahrscheinlichkeitsverteilung der Beispieldatensätze, Fig. 10 prognostizierte Wahrscheinlichkeitsverteilungen bei zufällig gewähltem Bedingungszeitfenster,

Fig. 11 ein System und Verfahren zur Füllungsvorhersage von Zylindern einer

Verbrennungskraftmaschine.

Bezugnehmend auf Tab. 2 werden nachfolgend 3 Ausführungsbeispiele beschrieben, wobei jedem ein spezieller Beispieldatensatz sowie eine Kombination aus Hyperparametern zugeordnet ist. In einer ersten Ausführungsform werden aus einem Lorenz-Datensatz chaotische Datenverteilungen erzeugt. Bezugnehmend auf Gl. (8) werden die Parameter der Lorenz-Gleichungen auf die Werte o = 16, g = 45,92 und ß = 4 gesetzt. Um den Datensatz zu erzeugen, werden zunächst 5 Zahlenwerte für die Ausgangsbedingung b ₀ und das dazugehörige relative Auftreten davon nach Tab. 3 gewählt.

Mackey-Glass- Internet-Traffic-

Variable Lorenz-Datensatz

Datensatz Datensatz

T GRU LSTM GRU

RG 8 64 8

RD 64 256 128

Z 32 4 16

C 24 32 32

Diter 2 6 3

Tabelle 2

Index b ₀ Relatives Auftreten

0 1 ,0001 5,5%

1 1 ,000001 22%

2 1 ,00000001 42%

3 1 ,0000000001 24%

4 1 ,000000000001 6,5%

Tabelle 3

Die Ausgangsbedingungen für ao und Co werden zu ao = 1 und Co = 1 gesetzt. Es werden 100.000 Datenproben mit der Länge von 26s und der Auflösung von 0,02s erzeugt. Dadurch entstehen Zeitreihen, die auszugsweise in Fig. 7a abgebildet sind. Zu den in Fig. 7a dargestellten Zeitreihen wird ein Gauß’sches Rauschen mit dem Mittelwert 0 und einer

Standardabweichung von 7,2 hinzugefügt, um einzigartige Zeitfenster mit chaotischen

Datenreihen zu erzeugen. Bezugnehmend auf Fig. 7b wird aus den nach solcherart

entstandenen Daten das Bedingungszeitfenster (C) zwischen Sekunde 12 und 17 gewählt. Der Datensatz der Bedingungszeitfenster ist in Fig. 7b dargestellt. Weiterhin werden Stichproben für die Zielgrößen x _t+i mit den Werten t e (20, 22, 25) entnommen. Die entnommenen Stichproben bilden Wahrscheinlichkeitsverteilungen für x _t+i für die jeweiligen Startwerte bo. (i={0,... ,4}), welche in Fig. 8a abgebildet sind. Bezugnehmend auf Fig. 8a weisen die

Wahrscheinlichkeitsverteilungen der zu prognostizierenden Zielgrößen x _t+i, für t e (20, 22, 25) für die unterschiedlichen Startwerte b ₀, (i={0,... ,4}) unterschiedliche

Wahrscheinlichkeitsverteilungen auf. In Fig. 8b ist die vollständige

Wahrscheinlichkeitsverteilung der gewählten x _t+i für den gesamten Datensatz abgebildet.

Durch Anwendung eines genetischen Algorithmus mit einem Genpool der Größe 8 und 8 ausgeführten Iterationen werden die Hyperparameter für diese Ausführungsform entsprechend Tab. 2 festgelegt. Somit ergibt sich ein RCGAN mit GRU als Zelltyp (T), 8 Generatorzellen (RG), 64 Diskriminatorzellen (RD), ein Rauschvektor (Z) der Länge 32, ein Bedingungsvektor (C) der Länge 24, mit 2 Iterationen (D _iter) des Diskriminatortrainings.

Das nach solcherart erzeugte erfindungsgemäße RCGAN wird entsprechend dem Verfahren von Fig. 4 auf den erzeugten Lorenz- Datensatz trainiert. Zur Bewertung des nach solcherart erzeugten erfindungsgemäßen RCGAN wird ein Generator-Regressionsmodell mit identischer Struktur des Generators (G) des erfindungsgemäßen RCGAN ^'s konstruiert und die

Fehlerkennzahl RMSE (Gl. 5) als Verlustfunktion optimiert. Anschließend werden sowohl für das erfindungsgemäße RCGAN als auch für das Generator-Regressionsmodell 100 Prognosen von x _t+i für das gewählte Bedingungszeitfenster (C) durchgeführt. Dieser Vorgang wird für jeden Startwert bo, (i={0,... ,4}) und für den gesamten Lorenz-Datensatz durchgeführt. In Fig. 9 sind die Ergebnisse der prognostizierten Wahrscheinlichkeitsverteilung des erfindungsgemäßen

RCGAN ^'s, des Generator-Regressionsmodells und des wahren Wertes (Grundwahrheit) für den Lorenz- Datensatz dargestellt. Weil das Generator-Regressionsmodell keine

Wahrscheinlichkeitsverteilung abbilden kann, ist für dieses das Histogramm der Ergebnisse der 100 Durchläufe dargestellt. Es ist zu erkennen, dass das erfindungsgemäße RCGAN die wahren Werte (Grundwahrheit) sowohl über die einzelnen Startwerte bo, (i={0,... ,4}) als auch über den gesamten Datensatz mit einer hohen Übereinstimmung abbildet, wohingegen das auf konventionelle Art und Weise trainierte Generator-Regressions-Modell eher die gewichteten Mittelwerte abbildet. Erfindungsgemäß vorteilhaft stellt der Vergleich mit der Grundwahrheit eine Möglichkeit der Bewertung der Güte des nach solcherart entwickelten RCGAN ^'s dar. Wird das soeben beschriebene Ausführungsbeispiel in analoger Art und Weise auf die weiteren Beispieldatensätze des Mackey-Datensatzes und des Internet-Traffic-Datensatzes, wie in Tab. 2 abgebildet, angewendet, werden folgende Ergebnisse erzielt, welche in Tab. 4 dargestellt sind. Bezüglich der berechneten Fehlerkennzahlen des Lorenz-Datensatzes aus Tab. 4 sind die Fehlerwerte der Generator-Regression niedriger als jene des

erfindungsgemäßen RCGAN ^'s. Für die Anwendung des Mackey-Glass-Datensatzes weist jedoch das erfindungsgemäße RCGAN niedrigere Fehlerwerte auf, als die Generator- Regression. Das ist insbesondere im Hinblick auf die Fehlerkennzahl RMSE interessant, da das Generator-Regressionsmodell direkt auf RMSE optimiert wurde. Bezüglich des Internet-Traffic- Datensatzes sind die erzielten Ergebnisse von Generator-Regression und dem

erfindungsgemäßen RCGAN in Waage.

Generator-

Datensatz Bewertung RCGAN

Regression

RMSE 2,91 4,06

Lorenz- MAE 2,39 2,94

Datensatz MAPE 2,25% 3,35%

KLD NaN 1 ,67 x I O- ²

RMSE 5,63 x 10- ⁴ 3,82 x 10- ⁴

Mackey-Glass- MAE 4,92 x IO- ⁴ 2,93 x 10- ⁴

Datensatz MA ^pE 6,29 x 10- ²% 3,46 x 10- ²%

KLD 8,00 x 10- ³ 3, 18 x 10- ³

Internet-Traffic- RMSE 1 ,27 x 10 ⁸ 1 ,31 x 10 ⁸

Datensatz MAE 9,01 x 10 ⁷ 9,29 x 10 ⁷

MA ^pE 2,85% 2,94%

(A5M)

KLD 5,31 x 10 ¹¹ 2,84 x 10 ¹¹

Tabelle 4

Daraus lässt sich ableiten, dass das erfindungsgemäße RCGAN für die ^prognose von zukünftigen Werten aus gegebenen Zeitreihen vergleichbare Ergebnisse erzielt, wie

konventionelle ^prognosemodelle, welche zu einem Ergebnis der Mittenregression korrelieren und zusätzlich in vorteilhafter Art und Weise die Wahrscheinlichkeitsverteilung von Datensätzen mit einer hohen Übereinstimmung abbilden können, was den konventionellen Methoden vorenthalten bleibt. Um diese Fähigkeit zu verdeutlichen, sind in Fig. 10 zwei weitere

Wahrscheinlichkeitsverteilungen abgebildet, wobei das Bedingungszeitfenster (C) zufällig ausgewählt wurde. Die Testdaten entstammen auch hier dem Lorenz-Datensatz. Es ist auch hier ersichtlich, dass das erfindungsgemäße Verfahren in der Lage ist, aus zufälligen

Stichproben die Wahrscheinlichkeitsverteilung der gegebenen Daten zu lernen. Wird das erfindungsgemäße Verfahren auf technische Systeme, wie beispielsweise auf die Steuerung einer Verbrennungskraftmaschine, angewendet, erzeugt es somit die Möglichkeit, die Wahrscheinlichkeitsverteilung des Verhaltens der Verbrennungskraftmaschine, auf

Grundlage der Zeitverläufe sensorischer Daten, zu lernen und somit zukünftige Werte der Sensoren mit einer hohen Realitätstreue vorauszubestimmen. In Fig. 11 ist hierzu ein

Systemschaubild zur Füllungsvorhersage der Zylinder der Verbrennungskraftmaschine eines Fahrzeuges dargestellt. Ausgangspunkt ist das Motorsteuergerät (ECU), das die Sensordaten der Verbrennungskraftmaschine und des Fahrzeuges verwaltet. Die Verwaltung von

Sensordaten im Sinne der Erfindung bezieht sich auf die Erfassung, Berechnung und

Weiterverarbeitung. Zur Vorhersage der Füllung der Zylinder der Verbrennungskraftmaschine gehört die Zielgröße, z.B. der Steuerhub f _r, selbst zu den Sensordaten und bildet somit den interessierenden Sensor (3). Zur Bestimmung des Steuerhubs (f _r) innerhalb des

Motorsteuergerätes (ECU) sind jedoch weitere Parameter erforderlich. So werden innerhalb des Motorsteuergerätes (ECU) die weiteren Sensordaten (4a, 4b, 4c, ...) verarbeitet. Diese sind die physikalische Zeitverzögerung, die Motordrehzahl (n _mot), die relative Zylinderfüllung (rl), die Nockenwellenverstellung, die Drosselklappenstellung, der Ansaugdruck, das Luft- Kraftstoff- Verhältnis, die Kühlmitteltemperatur (T _mot), die Ansauglufttemperatur, und weitere Parameter, die für die Motorsteuerung von Verbrennungskraftmaschinen bekannt sind.

Die Zielgröße f _r beinhaltet in der Motorsteuerung weitere Informationen über die

Gewichtung (W), die bekannter Art und Weise für die Berechnung innerhalb neuronaler Netze verwendet werden. Weiterhin wird aus dem zeitlichen Verlauf der Sensordaten des

interessierenden Sensors (3) das Bedingungszeitfenster (C) gewählt. Die weiteren

Sensordaten (4a, 4b, 4c,...) werden als Hilfsgrößen (S) verwendet. Für die Hilfsgrößen (S) wird ebenfalls die Historie des zeitlichen Verlaufs entsprechend dem Bedingungszeitfenster berücksichtigt, sodass bei einem Bedingungszeitfenster von C(f _r) = {f _r(t-1 ),... , f _r(to)} auch sämtliche Hilfsgrößen (S) in der Form S(n _mot, T _mot.) = { n _mot(t- 1 ) , ... , n _mot (to) ; T _mot(t-1), ... , Tmot (to); ... } dargestellt werden. Die Gewichtung (W) der Zielgröße (f _r), das Bedingungszeitfenster (C), die Hilfsgrößen (S) und der Rauschvektor (Z) dienen nunmehr als Eingangsgrößen in das erfindungsgemäße RCGAN, welches bereits im Vorfeld, wie vorher beschrieben, trainiert wurde. In dem RCGAN wird nur noch das trainierte Generatornetzwerk (G) verwendet, welches aus den vorhandenen Eingangsgrößen die Wahrscheinlichkeitsverteilung p(f _r(t+1)) des zukünftigen Wertes der Zielgröße als Ausgangsgröße erzeugt und daraus letztendlich einen zukünftigen Wert f _r(t+1) für die Zielgröße bestimmt. Dieser wird anschließend in das

Motorsteuergerät (ECU) zurückgeführt, welches diese Information verwenden kann, um ihre Parameter entsprechend den Anforderungen an die Verbrennungskraftmaschine einzustellen. Aufgrund der physikalischen Zeitverzögerung durch die Berechnung der Wahrscheinlichkeitsverteilung p(f _r(t+1)) der Zielgröße, kann es erforderlich sein, dass das erfindungsgemäße RCGAN Werte für die Zielgröße (f _r) berechnet, die weiter in der Zukunft liegen, als der nächstfolgende Zeitschrift, wie beispielsweise f _r(t > t+1).

Bezugszeichenliste

1 technisches System

2 Antriebssteuereinheit

3 interessierender Sensor

4 weitere Sensoren

5 Trainingssystem

6 Trainingsdatensatz

7 Bewertung

8 erste RNN-Schicht

9 Zustandsvektor

10 erste dichte NN-Schicht

1 1 zweite dichte NN-Schicht

12 Wahrscheinlichkeitsverteilung Zielgröße

S010 Entnahme Trainingsdatensatz

S020 Generatornetzwerk trainieren

S030 Diskriminatornetzwerk trainieren

S040 Ergebnis validieren

S050 Validierung überprüfen

C Bedingungszeitfenster

D Diskriminator

Diter Iterationen Diskriminatortraining

ECU Motorsteuereinheit

fr Steuerfaktor

F Falsch

G Generator

GRU Gated Recurrent Unit

j Ja

LSTM Long-Short-T erm-Memory

n Nein

rimot Motordrehzahl

N Anzahl Stichproben

P Datenverteilung

Q Vorhersagewahrscheinlichkeitsverteilung rl relative Füllungsmenge

R richtig RD Zellenanzahl Diskriminatornetzwerk

RG Zellenanzahl Generatornetzwerk

S Hilfsgrößen

t Zeit

T Zelltyp

Kühlmitteltemperatur

x, y Sensorwert

^XP künstlicher zukünftiger Sensorwert

Xr realer zukünftiger Sensorwert z Rauschwerte

Z Rauschvektor

P Wahrscheinlichkeitsverteilung ß Atmosphärenschicht

Y Rayleigh-Zahl

o Prandtl-Zahl

Previous Patent: LOCK FOR A MOTOR VEHICLE

Next Patent: EXPANDED FOODSTUFF- OR ANIMAL FEED EXTRUDATE