Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD AND CONTROL DEVICE FOR AUTOMATICALLY SELECTING DATA SETS FOR A METHOD FOR MACHINE LEARNING
Document Type and Number:
WIPO Patent Application WO/2021/073995
Kind Code:
A1
Abstract:
The invention relates to a method for automatically selecting data sets for a method for machine learning for capturing operating variables of a motor vehicle, in which method measurement signal sequences for specific operating variable ranges (10.3.1, 10.3.2, A, B, C) of the motor vehicle are captured during operation of the motor vehicle. The method is characterised in that memory areas are assigned to the operating variable ranges (10.3.1, 10.3.2, A, B, C), said memory areas each having a plurality of slots (30), each of which is designed to store a data set containing a captured measurement signal sequence, and data sets already stored in the slots (30) can be overwritten with up-to-date newly captured data sets for each of said memory areas. For each slot (30) of a memory area in which a data set is stored, an estimated slot error value is formed and stored together with the measurement signal sequence. Preferably the data sets of which the estimated slot error value is comparatively small are overwritten.

Inventors:
WEISSENMAYER SIMON (DE)
STUEMKE DANIEL (DE)
Application Number:
PCT/EP2020/078224
Publication Date:
April 22, 2021
Filing Date:
October 08, 2020
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
BOSCH GMBH ROBERT (DE)
International Classes:
G05B13/04; B60W50/06; G05B13/02; G06F3/06; G06F30/27; G06N20/00
Domestic Patent References:
WO2019040349A12019-02-28
Foreign References:
DE102016219594A12018-04-12
Download PDF:
Claims:
Ansprüche

1. Verfahren zum automatisierten Selektieren von Datensätzen für ein Verfahren zum maschinellen Lernen für eine Erfassung von Betriebsgrößen eines Kraftfahrzeuges, bei welchem Verfahren Messsignalsequenzen für bestimmte Betriebsgrößenbereiche (10.3.1, 10.3.2, A, B, C) des Kraftfahrzeuges im Betrieb des Kraftfahrzeugs erfasst werden, dadurch gekennzeichnet, dass den Betriebsgrößenbereichen (10.3.1, 10.3.2, A, B, C) Speicherbereiche zugeordnet sind, die jeweils mehrere Slots (30) aufweisen, von denen jeder zum Speichern eines eine erfasste Messsignalsequenz enthaltenden Datensatzes eingerichtet ist, und wobei in den Slots (30) bereits gespeicherte Datensätze mit aktuell für jeweils denselben Speicherbereich neu erfassten Datensätzen überschreibbar sind, dass für jeden Slot (30) eines Speicherbereiches, in dem ein Datensatz gespeichert ist, ein Slotfehlerschätzwert der in diesem Datensatz enthaltenen Messsignalsequenz gebildet und zusammen mit der Messsignalsequenz gespeichert wird, und dass beim Überschreiben bevorzugt die Datensätze überschrieben werden, deren Slotfehlerschätzwert kleiner sind als andere Slotfehlerschätzwerte, die für denselben Speicherbereich gebildet worden sind.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass aus einer aktuell erfassten Messsignalsequenz mit einem Rechenmodell (12) eine Betriebskenngröße des Kraftfahrzeugs berechnet wird, dass die Betriebskenngröße parallel dazu mit einem Referenzwertsensor (14) gemessen wird, und dass der Slotfehlerschätzwert als Funktion einer Abweichung der berechneten Betriebskenngröße von der gemessenen Betriebskenngröße gebildet wird. 3. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Rechenmodell (12) ein durch das Verfahren zum maschinellen Lernen zu trainierendes Rechenmodell (12) ist.

4. Verfahren nach Anspruch 2 und 3, dadurch gekennzeichnet, dass nur solche Datensätze zum Überschreiben freigegeben werden, für die bereits ein Slotfehlerschätzwert beim maschinellen Lernen berechnet worden ist.

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass in einem Fahrzyklus des Kraftfahrzeugs nur ein vorbestimmter Anteil der Datensätze, für die bereits ein Slotfehlerschätzwert beim maschinellen Lernen berechnet worden ist, zum Überschreiben freigegeben wird.

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass dann, wenn bereits alle zum Überschreiben freigegebenen Datensätze überschrieben worden sind, bevor ein maschineller Lernvorgang gestartet werden konnte, der nächste Datensatz, der erneut überschrieben werden soll, nach einem Zufallsprinzip ausgewählt wird.

7. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass Datensätze an einen außerhalb des Kraftfahrzeugs lokalisierten Speicher (22) übertragen werden.

8. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass die im Kraftfahrzeug gespeicherten Datensätze nach deren Slotfehlerschätzwert absteigend sortiert werden und die Übertragung in dieser Sortierreihenfolge und beginnend mit dem Datensatz erfolgt, der den größten Slotfehlerschätzwert aufweist.

9. Computerprogramm, dadurch gekennzeichnet, dass das Computerprogramm computerlesbare Instruktionen umfasst, bei deren Ausführen auf einem Computer ein Verfahren nach einem der Ansprüche 1 bis 8 abläuft.

10. Computerprogrammprodukt, gekennzeichnet durch ein maschinenlesbares Speichermedium, auf dem das Computerprogramm nach Anspruch 9 gespeichert ist. 11. Steuergerät (13) eines Kraftfahrzeugs, das dazu eingerichtet ist, ein Verfahren zum automatisierten Selektieren von Datensätzen für ein Verfahren zum maschinellen Lernen für eine Erfassung von Betriebsgrößen eines Kraftfahrzeuges durchzuführen, bei welchem Verfahren Messsignalsequenzen für bestimmte Betriebsgrößenbereiche (10.3.1,

10.3.2, A, B, C) des Kraftfahrzeuges im Betrieb des Kraftfahrzeugs erfasst werden, dadurch gekennzeichnet, dass den Betriebsgrößenbereichen (10.3.1, 10.3.2, A, B, C) Speicherbereiche des Steuergeräts (13) zugeordnet sind, die jeweils mehrere Slots (30) aufweisen, von denen jeder zum Speichern eines eine erfasste Messsignalsequenz enthaltenden Datensatzes eingerichtet ist, und wobei in den Slots (30) bereits gespeicherte Datensätze mit aktuell für jeweils denselben Speicherbereich neu erfassten Datensätzen überschreibbar sind, dass das Steuergerät (13) dazu eingerichtet ist, für jeden Slot eines Speicherbereiches, in dem ein Datensatz gespeichert ist, einen Slotfehlerschätzwert dieser gespeicherten Messsignalsequenz zu bilden, und beim Überschreiben bevorzugt die Messsignalsequenzen zu überschreiben, deren Slotfehlerschätzwert kleiner ist andere Slotfehlerschätzwerte, die für denselben Speicherbereich gebildet worden sind.

12. Steuergerät (13) nach Anspruch 11, dadurch gekennzeichnet, dass es dazu eingerichtet ist, einen Ablauf eines Verfahrens nach einem der Ansprüche 2 bis 9 zu steuern.

Description:
Beschreibung

Titel

Verfahren und Steuergerät zum automatischen Selektieren von Datensätzen für ein Verfahren zum maschinellen Lernen

Stand der Technik

Die vorliegende Erfindung betrifft ein Verfahren zum automatisierten Selektieren von Datensätzen für ein Verfahren zum maschinellen Lernen für eine Erfassung von Betriebsgrößen eines Kraftfahrzeuges, bei welchem Verfahren Messsignalsequenzen für bestimmte Betriebsgrößenbereiche des Kraftfahrzeuges im Betrieb des Kraftfahrzeugs erfasst werden. Mit Blick auf Vorrichtungsaspekte betrifft die Erfindung ein Steuergerät nach dem Oberbegriff des Anspruchs 11. Ein solches Verfahren und ein solches Steuergerät werden als per se bekannt vorausgesetzt.

Daten sind der „Treibstoff“ für Machine Learning Algorithmen, bei welchen anhand einer großen Datenbasis eine Funktion zur Bestimmung schwer erfassbarer Größen modelliert wird. In technischen Systemen werden Signale mit Datenloggern aufgezeichnet und entweder lokal, oder in einem dezentralen Speicher (z.B. einer Cloud), für die spätere Weiterverarbeitung abgelegt.

Auf diesem Weg fallen sehr große Datenmengen an, die oft nicht ohne weiteres für das maschinelle Lernen verwendet werden können. Neben der Datenvorverarbeitung ist es für die meisten Methoden des maschinellen Lernens notwendig, aus den verfügbaren Daten Trainings-, Validierungs- und Testdatensätze zu erzeugen.

Als konkretes Beispiel soll im Folgenden zunächst das folgende Szenario betrachtet werden. Es soll ein Rechenmodell zum maschinellen Lernen vor dem Anlauf der Serienfertigung eines Kraftfahrzeuges trainiert, validiert und getestet werden, das die Wasserfilmtiefe auf der Fahrbahnoberfläche bestimmen kann. Die Wasserfilmtiefe ist ein Beispiel einer zu erfassenden Betriebsgröße eines Straßenkraftfahrzeuges. Eingabegrößen für das Rechenmodell sind die Fahrgeschwindigkeit, die Umgebungstemperatur und das Schallfrequenzspektrum, welches vom Abrollgeräusch der Reifen stammt.

In einer Reihe von Messfahrten werden über mehrere hundert Stunden an Messdaten gesammelt. Werden jetzt die Trainings-, Validierungs- und Testdatensätze ungeschickt aus den Messdaten heraus erzeugt, kann es passieren, dass die gewählten Messsignalsequenzen z.B. für nasse Straßenverhältnisse zufällig immer Geschwindigkeiten in einem bestimmten Bereich aufweisen. Das Verfahren zum maschinellen Lernen wird beim Training diesen akausalen Zusammenhang lernen. Das vor dem Anlauf der Serienproduktion gelernte Rechenmodell wird bei der späteren Serienfertigung in die Steuergeräte übernommen und nicht mehr verändert. Akausale Zusammenhänge, die in der Vorserienphase gelernt worden sind, können dann beim Betrieb der später in Serie hergestellten Kraftfahrzeuge zu falschen Ergebnissen führen.

Um solche Szenarien zu vermeiden, werden die gesammelten Daten üblicherweise genau analysiert, bevor sie in Trainings-, Validierungs- und Testdatensätze aufgeteilt werden. Die gesammelten Daten umfassen unter Umständen mehrere Terabyte. Meistens werden aus Praktikabilitätsgründen dann auch nicht alle verfügbaren Daten, sondern nur eine Teilmenge dieser Daten analysiert und verwendet. Bei der Validierung und den Tests von gelernten Modellen kommen außerdem Techniken wie die Kreuzvalidierung zum Einsatz, bei denen solche „ungünstigen“ Verteilungen der Datensätze erkannt werden.

Offenbarung der Erfindung

Die Erfindung unterscheidet sich von diesem Stand der Technik jeweils durch die kennzeichnenden Merkmale ihrer unabhängigen Ansprüche. Das erfindungsgemäße Verfahren zeichnet sich dadurch aus, dass den Betriebsgrößenbereichen Speicherbereiche zugeordnet sind, die jeweils mehrere Slots aufweisen, von denen jeder zum Speichern eines eine Messsignalsequenz enthaltenden Datensatzes eingerichtet ist, und wobei in den Slots bereits gespeicherte Datensätze mit aktuell für jeweils denselben Speicherbereich neu erfassten Datensätzen überschreibbar sind, dass für jeden Slot eines Speicherbereiches, in dem ein Datensatz gespeichert ist, ein Slotfehlerschätzwert der in diesem Datensatz enthaltenen Messsignalsequenz gebildet und zusammen mit der Messsignalsequenz gespeichert wird, und dass beim Überschreiben bevorzugt die Datensätze überschrieben werden, deren Slotfehlerschätzwert kleiner ist andere Slotfehlerschätzwerte, die für denselben Speicherbereich gebildet worden sind. Das erfindungsgemäße Steuergerät zeichnet sich dadurch aus, dass es dazu eingerichtet ist, einen Ablauf des erfindungsgemäßen Verfahrens zu steuern und das erfindungsgemäße Verfahren damit durchzuführen.

Die Datensätze werden direkt bei der Erfassung in zu speichernde und nicht zu speichernde Datensätze unterteilt. Damit erspart man sich die aufwendige Analyse von eventuell sehr großen Datenmengen. Außerdem vermeidet man die Speicherung unnötig vieler, redundanter Signalbereiche die keinen zusätzlichen Informationsgehalt liefern, weshalb weniger Speicherplatz benötigt wird. So kann die benötigte Datenmenge für maschinelles Lernen und auch der Analyseaufwand drastisch reduziert und Rechenzeit, Speicherkapazität sowie Datenvolumen gespart werden.

Die erfindungsgemäß bereits bei der Speicherung der Messdaten im Fahrzeug erfolgende Selektion relevanter Messsignalsequenzen hält die Kosten, die für das Zwischenspeichern der Daten und die Rechenzeit für das Lernen im Fahrzeug sowie für eine Übertragung der Daten für ggf. in der Cloud erfolgendes Berechnen erforderlich sind, gering.

Beim maschinellen Lernen wird mit Daten jedes Slots dessen individueller Slotfehlerschätzwert berechnet, was gleichbedeutend mit dem Fehler der in dem Slot gespeicherten Messsignalsequenz, bzw. des zugehörigen Datensatzes ist. Je größer der Slotfehlerschätzwert ist, umso interessanter bzw. lehrreicher und damit wertvoller ist der Datensatz für später erfolgende Iterationen des maschinellen Lernens. Beim Überschreiben der Slotinhalte mit neuen Datensätzen (insbesondere Messsignalsequenzen und zugehörige Slotfehlerschätzwerte) werden darum bevorzugt Datensätze verwendet, d.h. überschrieben, deren Slotfehlerschätzwerte im Vergleich zu Slotfehlerschätzwerten vergleichbarer Slots kleiner sind. Vergleichbare Slots sind solche Slots, die gleichen oder ähnlichen Messsignalsequenzen zugeordnet sind. Dadurch verbleiben vor allem die Datensätze im Speicher, deren Messsignalsequenzen mit vergleichsweise großen Fehlern behaftet sind. Dies hat Vorteile für das maschinelle Lernen, da mit Datensätzen, die mit einem vergleichsweise großen Fehler behaftet sind, effizienter trainiert werden kann, als mit Datensätzen, die mit einem vergleichsweise kleinen Fehler behaftet sind. Dadurch kann Speicher, Rechenzeit und, bei einer Übertragung zu externen Servern, zu übertragendes Datenvolumen gespart werden.

Eine bevorzugte Ausgestaltung zeichnet sich dadurch aus, dass aus einer aktuell erfassten Messsignalsequenz mit einem Rechenmodell eine Betriebskenngröße des Kraftfahrzeugs berechnet wird, dass die Betriebskenngröße parallel dazu mit einem Referenzwertsensor gemessen wird, und dass der Slotfehlerschätzwert als Funktion einer Abweichung der berechneten Betriebskenngröße von der gemessenen Betriebskenngröße gebildet wird.

Eine weitere bevorzugte Ausgestaltung zeichnet sich dadurch aus, dass das Rechenmodell ein durch das Verfahren zum maschinellen Lernen zu trainierendes Rechenmodell ist.

Bevorzugt ist auch, dass nur solche Datensätze zum Überschreiben freigegeben werden, für die bereits ein Slotfehlerschätzwert beim maschinellen Lernen berechnet worden ist.

Weiter ist bevorzugt, dass dann, wenn bereits alle zum Überschreiben freigegebenen Slotinhalte überschrieben worden sind, bevor ein maschineller Lernvorgang gestartet werden konnte, der nächste Datensatz, der erneut überschrieben werden soll, nach einem Zufallsprinzip ausgewählt wird.

Durch das zufällige mehrmalige Überschreiben kann erreicht werden, dass nicht nur die aktuellsten Daten, sondern auch teilweise viel ältere Daten für das Training zur Verfügung stehen. Dadurch ist die Wahrscheinlichkeit größer dass im Speicher neue Daten zur Verfügung stehen, die besonders interessant sind. Weiter ist bevorzugt, dass in einem Fahrzyklus des Kraftfahrzeugs nur ein vorbestimmter Anteil der Datensätze, für die bereits ein Slotfehlerschätzwert beim maschinellen Lernen berechnet worden ist, zum Überschreiben freigegeben werden.

Eine weitere bevorzugte Ausgestaltung zeichnet sich dadurch aus, dass Datensätze an einen außerhalb des Kraftfahrzeugs lokalisierten Speicher übertragen werden.

Weiter ist bevorzugt, dass die im Kraftfahrzeug gespeicherten Datensätze nach deren Slotfehlerschätzwert absteigend sortiert werden und die Übertragung in dieser Sortierreihenfolge und beginnend mit der Messsignalsequenz erfolgt, die den größten Slotfehlerschätzwert aufweist.

Dadurch stehen dem Server und anderen Fahrzeugen immer die interessantesten Datensätze für deren Lernalgorithmen zur Verfügung, wodurch der Speicherbedarf und die Rechenzeit für das Lernen gegenüber einer wahllosen Auswahl an Messdaten drastisch reduziert werden kann.

Idealerweise sind im Fahrzeug darüber hinaus auch Datensätze von speziellen Fahrmanövern oder von Referenzfahrten vorab hinterlegt, die nicht überschrieben werden können und die für die Validierung des maschinellen Lernens verwendet werden. Dadurch kann sichergestellt werden, dass das Modell die notwendige Robustheit behält, auch wenn das Ergebnis jedes individuellen Lernvorgangs nicht vom Menschen überwacht wird.

Ein erfindungsgemäßes Computerprogramm zeichnet sich dadurch aus, dass es computerlesbare Instruktionen umfasst, bei deren Ausführen auf einem Computer ein Verfahren nach einem der oben genannten Verfahren abläuft. Ein erfindungsgemäßes Computerprogramm zeichnet sich durch ein maschinenlesbares Speichermedium aus, auf dem das Computerprogramm gespeichert ist. Ausgestaltungen erfindungsgemäßer Steuergeräte zeichnen sich dadurch aus, dass sie dazu eingerichtet sind, einen Ablauf eines der oben genannten Verfahren zu steuern und das Verfahren damit durchzuführen.

Figurenbeschreibung

Weitere Vorteile ergeben sich aus der nachfolgenden Beschreibung, den Zeichnungen und den Unteransprüchen. Es versteht sich, dass die vorstehend genannten und die nachstehend noch zu erläuternden Merkmale nicht nur in der jeweils angegebenen Kombination, sondern auch in Alleinstellung verwendbar sind, ohne den Rahmen der vorliegenden Erfindung zu verlassen.

Ausführungsbeispiele der Erfindung sind in den Zeichnungen dargestellt und werden in der nachfolgenden Beschreibung näher erläutert. Dabei zeigen, jeweils in schematischer Form:

Figur 1 ein Funktionsblockdiagramm mit Verfahrens- und Vorrichtungsaspekten eines Ausführungsbeispiels der Erfindung; und

Figur 2 ein Ausführungsbeispiel einer Merkmale der Erfindung aufweisenden

Selektion von Messsignalsequenzen, wie sie im Aufzeichnungsblock der Figur 1 erfolgen kann.

Im Einzelnen zeigt die Figur 1 einen Block 10, der ein Ensemble verschiedener Sensoren eines Kraftfahrzeugs repräsentiert. Das Ensemble weist in einem Ausführungsbeispiel einen Umgebungstemperatursensor, einen die Fahrzeuggeschwindigkeit erfassenden Sensor und einen das Schallfrequenzspektrum, welches vom Abrollgeräusch der Reifen stammt, erfassenden Sensor auf. Das Ensemble kann auch weitere und/oder andere Sensoren aufweisen, die Betriebsgrößen des Kraftfahrzeuges erfassen.

Aus von diesen Sensoren erfassten Messsignalsequenzen wird in einem Rechenmodell 12 eine Betriebskenngröße des Kraftfahrzeugs berechnet. Bei der Betriebskenngröße handelt es sich zum Beispiel um eine im Betrieb nur schwer, aufwändig oder teuer messbare Betriebskenngröße wie die Tiefe eines Wasserfilms auf einer nassen Fahrbahn. Die Berechnungen des Rechenmodells werden in einem Steuergerät 13 des Kraftfahrzeugs ausgeführt. Die Berechnungen werden bevorzugt in zwei Betriebsmodi des Rechenmodells ausgeführt.

In einem ersten Betriebsmodus wird das Rechenmodell 12 als Basisrechenmodell betrieben, in dem die Betriebsgröße mit einer vereinfachten Berechnung und damit eingeschränkter Genauigkeit berechnet wird. Diese Berechnung erfolgt während das Fährbetriebs auf der Basis der erfassten Betriebsgrößen. Das Rechenmodell 12 ist bevorzugt ein Bestandteil eines Steuergerätes 13 des Kraftfahrzeuges, bspw. in Form eines Programms, das in einem Speicher des Steuergerätes 13 gespeichert und von einem Prozessor des Steuergeräts 13 abgearbeitet wird. Dies gilt analog für die weiteren Funktionsblöcke des Steuergeräts, die insofern sowohl Vorrichtungsaspekte als auch Verfahrensaspekte repräsentieren.

In einem zweiten Betriebsmodus, der in einem Stillstand des Kraftfahrzeugs aktiv ist, wird das Rechenmodell mit den in vorhergehenden ersten Betriebsmodi gespeicherten Datensätzen trainiert

In einer Datenakquisitionsphase wird die Betriebskenngröße parallel zu ihrer Berechnung durch einen Referenzsensor 14 gemessen. In dem Beispiel des Wasserfilms kann es sich dabei um einen teuren Lasersensor handeln. Der Referenzsensor wird unter Umständen nur in der Datenakquisitionsphase verwendet und ist bei den später in Serie hergestellten Kraftfahrzeugen nicht vorhanden. Die Datenakquisitionsphase ist eine Phase, in der mit einem oder mit vergleichsweise wenigen Testfahrzeugen, zum Beispiel Vorserienfahrzeugen, Daten gesammelt werden. Mit den gesammelten Daten werden Rechenmodelle trainiert, die, in trainiertem Zustand, später für eine größere Zahl von Fahrzeugen, beispielsweise nach einem Anlauf einer Serienfertigung der Fahrzeuge, verwendet werden.

In einem Differenzbildungsblock 16 des Steuergerätes 13 wird eine Differenz zwischen der im Basisrechenmodell 12 berechneten und parallel dazu mit dem Referenzsensor 14 gemessenen Betriebskenngröße berechnet. In einem nachfolgenden Funktionsblock 18 des Steuergerätes 13 wird die Differenz quadriert, um einen positiven Wert zu erzeugen. An Stelle des Quadrierens könnte auch der Absolutbetrag der Differenz gebildet werden.

Diese Differenz, bzw. deren Quadrat oder Absolutbetrag wird in dieser Anmeldung als ein Fehlerschätzwert betrachtet, mit den Messsignalsequenzen behaftet sind, aus denen die Betriebskenngröße mit dem Basis-Rechenmodell 12 berechnet worden ist.

In einem Selektions- und Aufzeichnungsblock 20 findet eine Selektion der von den Sensoren 10 des Kraftfahrzeugs erfassten Messsignalsequenzen und/oder von diesen Messsignalsequenzen enthaltenden Datensätzen statt. Dem Aufzeichnungsblock 20 werden dazu die von den Sensoren 12 des Kraftfahrzeugs erfassten Messsignalsequenzen, die Slotfehlerschätzwerte und ggf. auch noch die jeweils zugehörigen Werte des Referenzsensors 14 zugeführt. Die Selektion findet in dem Steuergerät 13 des Kraftfahrzeuges statt, so dass auch der Aufzeichnungsblock 20 sowohl Verfahrensaspekte als auch Vorrichtungsaspekte repräsentiert.

Die selektierten Daten werden in einem Trainingsdatenspeicher 22 als neue Trainingsdaten gespeichert und zeitlich getrennt von der Aquisitionsphase für das Training eines trainierbaren Rechenmodells für die Betriebskenngröße (z.B. Wasserfilmtiefe) verwendet. Der Trainingsdatenspeicher 22 kann ein Speicher des Steuergerätes des Kraftfahrzeuges sein. Alternativ dazu kann der Speicher 22 auch ein dezentraler Speicher (z.B. cloud) sein, der sich außerhalb des Kraftfahrzeugs befindet und in dem erfindungsgemäß selektierte Trainingsdaten abgelegt werden können, die von mehreren Kraftfahrzeugen stammen. Der Datenaustausch kann zum Beispiel über eine Mobilfunkverbindung erfolgen.

Bei dem trainierbaren Rechenmodell kann es sich um das bereits genannte Basis-Rechenmodell handeln, das dann in einer Trainingsphase betrieben wird.

Figur 2 veranschaulicht ein Ausführungsbeispiel einer Merkmale der Erfindung aufweisenden Selektion von Messsignalsequenzen, wie sie im Aufzeichnungsblock 20 der Figur 1 erfolgen kann. Der Aufzeichnungsblock 20 liegt mit Blick auf seine Eingangssignale und seine Ausgangssignale zwischen einer Aufzeichnungsschnittstelle 21 und einer Datenspeicherschnittstelle 23. Über die Aufzeichnungsschnittstelle 21 werden dem Aufzeichnungsblock die Messsignalsequenzen der Sensoren 10, die Fehlerschätzwerte des Blockes 18 und die Signale des Referenzsensors 14 zugeführt. Die Aufzeichnungsschnittstelle 21 stellt einen Datenlogger für diese Daten dar. Die Datenspeicherschnittstelle 23 stellt zum Beispiel eine innerhalb des Kraftfahrzeuges, insbesondere innerhalb eines das Rechenmodell ausführenden Steuergerätes 13 des Kraftfahrzeuges liegende Schnittstelle zu dem Trainingsdatenspeicher dar. Alternativ oder ergänzend ist die Datenspeicherschnittstelle 23 eine Verbindung zu einer serverseitigen Datenbank in der cloud.

In dem Beispiel, das in der Figur 2 dargestellt ist, werden dem Selektions- und Aufzeichnungsblock 20 über den Pfad 24 Messsignalsequenzen von zwei Sensoren 10.1, 10.2, über den Pfad 26 Fehlerschätzwerte und über den Pfad 28 Messwerte des Referenzsensors 14 zugeführt.

Ein erster Sensor 10.1 hat zum Beispiel einen Wertebereich 10.3 von 0 bis 100, und ein zweiter Sensor 10.2 hat zum Beispiel einen drei diskrete Werte A, B, C aufweisenden Wertebereich 10.4.

Der Wertebereich 10.3 des ersten Sensors 10.1 wird in Betriebsgrößenbereiche 10.3.1, der einem Intervall [0...50] entspricht, und 10.3.2, der einem Intervall [50... 100] entspricht, eingeteilt.

Der Wertebereich 10.4 des zweiten Sensors 10.2 wird in Betriebsgrößenbereiche A, B, C aufgeteilt. Im dargestellten Beispiel ergeben sich damit 6 Kombinationsmöglichkeiten. Für jede mögliche Kombination aus den Betriebsgrößenbereichen 10.3.1, 10.3.2 des ersten Sensors 10.1 und den Betriebsgrößenbereichen A, B, C des zweiten Sensors 10.2 stehen n Slots 30 im Speicher zur Verfügung. Die Zahl n der Slots ist zum Beispiel eine Zahl zwischen 10 und 100. In den vorkonfigurierten Slots werden pro Slot jeweils eine Messsignalsequenz der Sensoren 10.1, 10.2 zusammen mit einem zugehörigen Fehlerschätzwert und optional noch zusammen mit dem zugehörigen Referenzwert gespeichert.

Der Mechanismus mit den Slots dient primär dazu, möglichst heterogene und diverse Daten zu sammeln (also zum Beispiel nicht nur Daten aus einem einzelnen, schmalen Geschwindigkeitsbereich).

Wenn jetzt während einer Datenakquisitionsphase für eine Kombination von Kategorien die freien Slots durch eine nach und nach erfolgende Belegung ausgehen, wird anhand der Fehlerschätzwerte der für diese Kombination bereits gespeicherten Messfehlersequenzen entschieden, welcher bereits belegte Slot überschrieben werden kann. Ein kleiner Fehlerschätzwert bedeutet, dass das Rechenmodell die hinterlegte Messsignalsequenz bereits gut verarbeiten konnte. Deshalb sind diese Messsignalsequenzen weniger interessant und können mit neuen Messsignalsequenzen, die größere Slotfehlerschätzwerte aufweisen, überschrieben werden. Sequenzen mit großem zugeordnetem Slotfehlerschätzwert sollte man dagegen behalten (d.h. nicht überschreiben), damit das Rechenmodell später mit diesen Informationen neu trainiert werden kann.

Durch diese direkt bei der Aufzeichnung erfolgende Selektion der Daten (Messsignalsequenzen, Slotfehlerschätzwerte, Referenzwertsensorwerte) in zu speichernde und zu überschreibende Daten erspart man sich eine aufwendige Analyse von eventuell sehr großen Datenmengen. Außerdem vermeidet man die Speicherung unnötig vieler, redundanter Messsignalsequenzen, die keinen zusätzlichen Informationsgehalt liefern, weshalb weniger Speicherplatz benötigt wird.

So kann die benötigte Datenmenge für maschinelles Lernen und auch der Analyseaufwand drastisch reduziert und Rechenzeit und Speicherkapazität gespart werden. Bei einer Übertragung der selektierten Daten zwischen einem externen Speicher und Kraftfahrzeugsteuergeräten kann das ggf. über eine Mobilfunkverbindung zu übertragende Datenvolumen im Vergleich zu einer Datenmenge, die ohne eine solche Selektion zu übertragen wäre, drastisch reduziert werden.

In allen Ausführungsbeispielen findet das Training nicht parallel zur Datenerfassung statt. Die während der Datenerfassung erfolgende Ausführung des Rechenmodells im ersten Betriebsmodus dient dazu, zu bewerten ob die erfassten Daten den mit den Referenzsensor erfassten Daten bereits weitgehend entsprechen oder nicht und sie im letzteren Fall abzuspeichern. Nach einer Datenerfassungssession (z.B. einer Testfahrt) wird dann das Rechenmodell mit den erfassten Daten neu trainiert.

Das Rechenmodell 16 kann auch losgelöst von dem Steuergerät des Kraftfahrzeuges auf einem externen Server ausgeführt werden, Das hat den Vorteil, dass viele baugleiche Fahrzeuge gleichzeitig für das selbe Rechenmodell Daten sammeln können. In diesem Fall findet das Speichern und Überschreiben auf dem externen Server statt. Das Fahrzeug liefert dem Server nur die Echtzeitdaten von Betriebsgrößen und Messwerten des Referenzsensors.