METHOD AND ARRANGEMENT FOR COMPUTER-ASSISTED DETERMINATION OF A REPRESENTATION SPECIFICATION

Title:

METHOD AND ARRANGEMENT FOR COMPUTER-ASSISTED DETERMINATION OF A REPRESENTATION SPECIFICATION

Document Type and Number:

WIPO Patent Application WO/1999/048020

Kind Code:

A2

Abstract:

The invention relates to a method and an arrangement for computer-assisted determination of a representation specification, describing a technical process in a predetermined space, wherein said technical process in a predetermined space is described by partial models. An approximative representation specification describing approximatively the technical process and including first partial models is determined. Subsequently, the representation specification is determined in such a way that the first partial models can be expanded with at least a second partial model, whereby the representation specification can be stabilized in comparison with the approximative representation specification.

More Like This:

JP3243795	INDUSTRIAL APPLICABILITY [Title of Invention] Maximum value Minimum value detection circuit
JPS5798040	COMPARATOR FOR SERIAL MAGNITUDE
JP2001022557	LOGIC CIRCUIT

Inventors:

LANG BERNHARD (DE)
POPPE THOMAS (DE)

Application Number:

PCT/DE1999/000524

Publication Date:

September 23, 1999

Filing Date:

February 26, 1999

Export Citation:

Click for automatic bibliography generation Help

Assignee:

SIEMENS AG (DE)
LANG BERNHARD (DE)
POPPE THOMAS (DE)

International Classes:

G06F7/02; G05B13/02; G06V10/75; G06F9/44; G06F17/00; G06N3/00; G06N7/02; B21B37/00; (IPC1-7): G06F17/00

Foreign References:

US5513097A

1996-04-30

Other References:

LIN Y ET AL: "USING FUZZY PARTITIONS TO CREATE FUZZY SYSTEMS FROM INPUT-OUTPUT DATA AND SET THE INITIAL WEIGHTS IN A FUZZY NEURAL NETWORK" IEEE TRANSACTIONS ON FUZZY SYSTEMS, Bd. 5, Nr. 4, 1. November 1997 (1997-11-01), Seiten 614-621, XP000725072 ISSN: 1063-6706
DELGADO M ET AL: "A FUZZY CLUSTERING-BASED RAPID PROTOTYPING FOR FUZZY RULE-BASED MODELING" IEEE TRANSACTIONS ON FUZZY SYSTEMS, Bd. 5, Nr. 2, 1. Mai 1997 (1997-05-01), Seiten 223-233, XP000688811 ISSN: 1063-6706
LOTFI A ET AL: "LEARNING FUZZY INFERENCE SYSTEMS USING AN ADAPTIVE MEMBERSHIP FUNCTION SCHEME" IEEE TRANSACTIONS ON SYSTEMS, MAN AND CYBERNETICS. PART B: CYBERNETICS, Bd. 26, Nr. 2, 1. April 1996 (1996-04-01), Seiten 326-331, XP000582920 ISSN: 1083-4419
KUEPPER K: "SELF LEARNING FUZZY MODELS USING STOCHASTIC APPROXIMATION" PROCEEDINGS OF THE CONFERENCE ON CONTROL APPLICATIONS, GLASGOW, AUG. 24 - 26, 1994, Bd. 3, Nr. CONF. 3, 24. August 1994 (1994-08-24), Seiten 1723-1728, XP000679403 INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERSISBN: 0-7803-1873-0
ZIA F ET AL: "NEURO-FUZZY CONTROL USING SELF-ORGANIZING NEURAL NETS" PROCEEDINGS OF THE CONFERENCE ON FUZZY SYSTEMS, ORLANDO, JUNE 26 - 29, 1994, Bd. 1, Nr. CONF. 3, 26. Juni 1994 (1994-06-26), Seiten 70-75, XP000529239 INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERSISBN: 0-7803-1897-8
VALENZUELA-RENDON M: "THE FUZZY CLASSIFIER SYSTEM: A CLASSIFIER SYSTEM FOR CONTINUOUSLY VARYING VARIABLES" PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON GENETIC ALGORITHMS, SAN DIEGO, JULY 13 - 16, 1991, Nr. CONF. 4, 13. Juli 1991 (1991-07-13), Seiten 346-353, XP000260123 BELEW R K;BOOKER L B

Attorney, Agent or Firm:

SIEMENS AKTIENGESELLSCHAFT (Postfach 22 16 34 München, DE)
SIEMENS AKTIENGESELLSCHAFT (Postfach 22 16 34 München, DE)

Download PDF:

View/Download PDF PDF Help

Claims:

Patentansprüche

1.

Verfahren zur rechnergestützten Ermittlung einer Abbil dungsvorschrift, welche einen technischen Prozeß in einem vorgegeben Raum beschreibt, wobei der technische Prozeß in dem vorgegebenen Raum durch Teilmodelle beschrieben wird, dadurchgekennzeichnet,daß eine approximative Abbildungsvorschrift, welche den technischen Prozeß approximativ beschreibt und welche erste Teilmodelle umfaßt, ermittelt wird, und anschließend die Abbildungsvorschrift derart ermittelt wird, daß die ersten Teilmodelle mit mindestens einem zweiten Teilmodell erweitert werden, wobei die Abbil dungsvorschrift im Vergleich zu der approximativen Ab bildungsvorschrift stabilisiert wird.

2.	Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Abbil dungsvorschrift mit mehreren zweiten Teilmodellen erweitert wird.

3.	Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß das zweite Teilmodell mit mehreren ersten Teilmodellen überlagert wird.

4.	Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Aus gangsgröße und/oder die Eingangsgröße mehrdimensionale Grö ßen sind/ist.

5.	Verfahren nach einem der Ansprüche 1 bis 4, <BR> <BR> <BR> d a d u r c h g e k e n n z e i c h n e t, d a ß die Uberla gerung des zweiten Teilmodells unter Verwendung einer Ge wichtungsfunktion durchgeführt wird.

6.	Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die Gewich tungsfunktion unter Verwendung einer Summe von Gewichtungen ermittelt wird.

7.	Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß die Abbil dungsvorschrift im Rahmen eines neuronalen Netzes verwendet wird.

8.	Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß das neuro nale Netz vom Typ Multi Adaline ist.

9.	Verfahren nach einem der Ansprüche 1 bis 8, d a d u r c h g e k e n n z e i c h n e t, d a ß das zweite Teilmodell vom Typ Adaline ist.

10.

Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß die Abbil dungsvorschrift wie folgt beschrieben wird : wobei : actk = (xZk) * ak + bk (15) 1 gk = exp ( * (x µk)2) (17) 2 * #k2 mit : x, y Eingangsgröße, Ausgangsgröße k Laufvariable nk Zahl der Clusterzentren der ersten Teilmodelle ak Steigung bk Biaswert SG Summe von Gewichtungen Gewichtungsfunktionengk,g0 #kPartitionsfunktion actk lineares Adaline Clusterzentrum Ck Varianz.

11.	Verfahren nach einem der Ansprüche 1 bis 10, dadurch gekennzeichnet, daß die Aus gangsgröße und/oder die Eingangsgröße eine Prozeßgröße und/oder eine Steuergröße einer technischen Anlage sind/ist.

12.	Verfahren nach einem der Ansprüche 1 bis 11, g e k e n n z e i c h n e t durch den Einsatz zur Uberwachung und/oder Regelung einer technischen Anlage.

13.	Verfahren nach Anspruch 12, g e k e n n z e i c h n e t durch den Einsatz zur Uberwachung und/oder Regelung einer Stahlwalzanlage.

14.	Verfahren nach einem der Ansprüche 1 bis 13, g e k e n n z e i c h n e t durch den Einsatz im Rahmen eines Trainings und/oder eines online Lernens des neuronalen Netzes.

15.

Anordnung zur rechnergestützten Ermittlung einer Abbil dungsvorschrift, welche einen technischen Prozeß in einem vorgegeben Raum beschreibt, wobei der technische Prozeß in dem vorgegebenen Raum durch Teilmodelle beschrieben wird, d a d u r c h g e k e n n z e i c h n e t, daß die Anordnung einen Prozessor aufweist, der derart einge richtet ist, daß folgende Schritte durchführbar sind : eine approximative Abbildungsvorschrift, welche den technischen Prozeß approximativ beschreibt und welche erste Teilmodelle umfaßt, ist ermittelbar, und anschließend ist die Abbildungsvorschrift derart er mittelbar, daß die ersten Teilmodelle mit mindestens ei nem zweiten Teilmodell erweitert werden, wobei die Ab bildungsvorschrift im Vergleich zu der approximativen Abbildungsvorschrift stabilisiert wird.

16.	Anordnung nach Anspruch 15, d a d u r c h g e k e n n z e i c h n e t, d a ß die ersten Teilmodelle mit mehreren zweiten Teilmodellen erweiterbar sind.

17.	Anordnung nach Anspruch 15 oder 16, dadurch gekennzeichnet, daß das zweite Teilmodell mit mehreren ersten Teilmodellen überlagerbar ist.

18.	Anordnung nach einem der Ansprüche 15 bis 17, dadurch gekennzeichnet, daß die Aus gangsgröße und/oder die Eingangsgröße mehrdimensionale Grö ßen sind/ist.

19.	Anordnung nach einem der Ansprüche 15 bis 18, dadurch gekennzeichnet, daß die Abbil dungsvorschrift ein neuronales Netz beschreibt.

20.	Anordnung nach einem der Ansprüche 15 bis 19, d a d u r c h g e k e n n z e i c h n e t, d a f3 das neuro nale Netz vom Typ Multi Adaline ist.

21.	Anordnung nach einem der Ansprüche 15 bis 20, dadurch gekennzeichnet, daß das zweite Teilmodell vom Typ Adaline ist.

22.	Anordnung nach einem der Ansprüche 15 bis 21, d a d u r c h g e k e n n z e i c h n e t, d a t3 die Aus gangsgröße und/oder die Eingangsgröße eine Prozeßgröße und/oder eine Steuergröße einer technischen Anlage sind/ist.

23.	Anordnung nach einem der Ansprüche 15 bis 22, g e k e n n z e i c h n e t durch den Einsatz zur Uberwachung und/oder Regelung einer technischen Anlage.

24.	Anordnung nach Anspruch 23, g e k e n n z e i c h n e t durch den Einsatz zur Uberwachung und/oder Regelung einer Stahlwalzanlage.

25.	Anordnung nach einem der Ansprüche 15 bis 24, g e k e n n z e i c h n e t durch den Einsatz im Rahmen eines Trainings und/oder eines online Lernens des neuronalen Net zes.

Description:

Beschreibung Verfahren und Anordnung zur rechnergestützten Ermittlung ei- ner Abbildungsvorschrift Die Erfindung bezieht sich auf die Ermittlung einer Abbil- dungsvorschrift. Durch eine solche Abbildungsvorschrift wird im Rahmen einer Abbildung durch ein neuronales Netz oder durch ein Fuzzy-System eine Eingangsgröße auf eine Ausgangs- größe abgebildet.

Eine Ermittlung einer derartigen Abbildungsvorschrift für ei- ne Abbildung durch ein sogenanntes Radiale-Basisfunktionen- Netz (RBF-Netz) vom Typ Local Linear Map oder Multi Adaline ist aus [1] bekannt.

Grundlagen eines Radiale-Basisfunktionen-Netzes (RBF-Netz) sind aus [4] bekannt.

Ein Radiale-Basisfunktionen-Netz ist ein spezielles vorwärts- gerichtetes neuronales Netz, welches eine Abbildung be- schreibt, durch die eine Eingangsgröße auf eine Ausgangsgröße abgebildet wird, und welches nur eine Schicht von verdeckten Neuronen besitzt. Ein verdecktes Neuron weist jeweils eine spezielle, radialsymmetrische (radiale) Zugehörigkeitsfunkti- on (Aktivierungsfunktion) auf.

Eine Zugehörigkeitsfunktion bzw. Aktivierungsfunktion ist ma- thematisch gesehen eine Basisfunktion eines Teilsystems (Teilmodell) eines Systems von Funktionen auf einem Raum (Ge- samtmodell). Das Gesamtmodell wird für eine Abbildung, welche eine Eingangsgröße auf eine Ausgangsgröße in dem Raum abbil- det, eingesetzt.

Dabei beschreibt eine Zugehörigkeitsfunktion bzw. Aktivie- rungsfunktion eine Zugehörigkeit eines Datenpunkts in dem Raum zu dem entsprechenden Teilmodell.

Das Teilmodell weist ein sogenanntes Zentrum auf, welches ein Datenpunkt in dem Raum ist, für welchen Datenpunkt die Zuge- hörigkeitsfunktion ein absolutes Maximum liefert. Mit zuneh- mendem Abstand eines ausgewählten Datenpunkts von dem Zentrum verringert sich der Wert der Zugehörigkeitsfunktion für den ausgewählten Datenpunkt.

Aus [4] ist bekannt, als eine Zugehörigkeitsfunktion eine Gaußfunktion zu verwenden.

Ein RBF-Netz, wie es aus [4] bekannt ist, läßt sich wie folgt beschreiben : Es sei f : Rn#R eine Funktion von R nach R, die durch N Stützstellen gegeben ist. Jede Stützstelle i besteht aus ei- nem n-dimensionalen Eingabevektor Xi= (xil,..., xin) und ei- nem dazugehörigen reellwertigen Funktionswert yisR. Als In- terpolationsbedingung gilt : f (Xi) =yi für alle i=l, ..., N. (1) Das für eine Approximation verwendete Funktionensystem be- steht aus radialsymmetrischen Basisfunktionen hi, die jeweils einer Stützstelle als jeweiligem Zentrum zugeordnet sind. Sie sind wie folgt definiert : hi (X) : =f (|| X - Xi ||). (2)

Die Basisfunktion hi hat positive skalare Werte. Sie ist nur abhängig von einem Abstand eines Vektors X von der entspre- chenden Stützstelle Xi, die einem Neuron i zugeordnet ist, in einer beliebigen, vorgegebenen Norm. Meist wird ein euklidi- scher Abstand zwischen den Vektoren X und Xi im R als Norm verwendet. Damit erhält man folgende Darstellung für das RBF- Netz : mit : ci : Gewichtungsfaktor für das Zentrum i.

In dieser Darstellung weist die radiale Basisfunktion hi ei- nen Index i auf, weil die radiale Basisfunktion hi jeweils für ein zugeordnetes Zentrum i unterschiedliche Charakteri- stika, wie beispielsweise eine Breite oder eine Varianz einer Gaußfunktion, aufweist.

Ferner ist aus [4] ein Verfahren zu einem Training eines RBF- Netzes bekannt.

Das aus [1] bekannte RBF-Netz vom Typ Multi Adaline weist an- stelle des Gewichtungsfaktors Ci ein sogenanntes lineares Adaline actk auf und läßt sich wie folgt beschreiben :

mit : i, k Laufvariable nk Zahl der Zentren ni Wert der Dimensionalität eines Eingangsraums ai, k Steigung bk Biaswert #kPartitionsfunktion µi,kZentrum xi, y Eingangsgröße, Ausgangsgröße #kVarianz Aus [2] und [3] ist ein sogenanntes Fuzzy-Clustering- Verfahren zur Datenanalyse bekannt.

Im Rahmen des Fuzzy-Clusterings werden c Cluster und entspre- chende Zugehörigkeiten von Datenvektoren xk derart bestimmt, daß Datenvektoren, die in einem Datenraum nahe bei einem Clu- ster liegen, eine möglichst hohe Zugehörigkeit und weit von dem Cluster entfernt liegende Datenvektoren xk eine möglichst geringe Zugehörigkeit zu dem jeweiligen Cluster aufweisen.

Dies wird durch Minimierung einer Summe der mit Zugehörigkei- ten umk gewichteten quadratischen euklidischen Abständen dik erreicht. Es soll also eine Menge X von Datenvektoren xk X = {x1, x2, ..., xk, ..., xn} in c Cluster (Untermengen der Menge von Datenvektoren) grup- piert werden.

Die Cluster werden beschrieben durch eine Zugehörigkeitsma- trix U, welche c Zeilen und n Spalten aufweist. Jedes Element uik der Zugehörigkeitsmatrix U weist einen Wert innerhalb des Intervalls [0,1] auf und beschreibt eine Zugehörigkeit des Datenvektors xk zu dem i-ten Cluster.

Die Summe der Zugehörigkeiten des Datenvektors xk in den c Clustern muß folgender Vorschrift genügen : Ein Cluster muß mindestens ein Element enthalten, so daß gilt : Die Kostenfunktion Jm der Zugehörigkeitswerte wird gemäß fol- gender Vorschrift gebildet : Ein Abstand dik wird gebildet gemäß folgender Vorschrift :

Es wird mit A eine vorgebbare induzierte Norm des inneren Produkts gemäß Vorschrift (4) bezeichnet, die üblicherweise durch die Identitätsmatrix gegeben ist (Euklidischer Ab- stand).

Die Minimierung der Kostenfunktion Jm erfolgt unter Einsatz einer sogenannten Picard-Iteration.

Nacheinander werden Zugehörigkeitswerte uik und Clusterzen- tren vi gemäß folgenden Vorschriften gebildet :

Die Ermittlung der Zugehörigkeitswerte uik und der Cluster- zentren vi wird solange wiederholt, bis eine festgelegte An- zahl von Iterationen durchgeführt worden ist oder bis eine Änderung der Zugehörigkeitswerte uik und/oder bis eine Ände- rung der Clusterzentren vi unter einem vorgegebenen Schwel- lenwert liegt.

Bei diesem oben beschriebenen, auch als Fuzzy-C-Means- Clustering bezeichneten Verfahren werden die Cluster durch ihre Clusterzentren vi beschrieben.

Eine Abbildung, die durch eine bekannte Abbildungsvorschrift ein Systemverhalten eines technischen Systems bzw. Prozesses beschreibt, weist in vielen Fällen den Nachteil auf, daß die Abbildung mangelhaft stabil gegenüber einem fehlerhaften Da- tenpunkt oder Meßfehler ist.

Der Erfindung liegt das Problem zugrunde, ein Verfahren und eine Anordnung zur Ermittlung einer Abbildungsvorschrift ei- ner Abbildung, welche einen technischen Prozeß beschreibt, anzugeben, mit welchen die Abbildung hinsichtlich der Stabi- lität gegenüber einem fehlerhaften Datenpunkt verbessert wird.

Das Problem wird durch das Verfahren sowie durch die Anord- nung mit den Merkmalen gemäß den unabhängigen Patentansprü- chen gelöst.

Bei einem Verfahren zur rechnergestützten Ermittlung einer Abbildungsvorschrift, welche einen technischen Prozeß in ei- nem vorgegeben Raum beschreibt, wobei der technische Prozeß in dem vorgegebenen Raum durch Teilmodelle beschrieben wird, wird eine approximative Abbildungsvorschrift, welche den technischen Prozeß approximativ beschreibt und welche erste Teilmodelle umfaßt, ermittelt. Anschließend wird die Abbil- dungsvorschrift derart ermittelt, daß die ersten Teilmodelle mit mindestens einem zweiten Teilmodell erweitert werden, wo- bei die Abbildungsvorschrift im Vergleich zu der approximati- ven Abbildungsvorschrift stabilisiert wird.

Eine Anordnung zur rechnergestützten Ermittlung einer Abbil- dungsvorschrift, welche einen technischen Prozeß in einem vorgegeben Raum beschreibt, wobei der technische Prozeß in dem vorgegebenen Raum durch Teilmodelle beschrieben wird, weist einen Prozessor auf, der derart eingerichtet ist, daß eine approximative Abbildungsvorschrift, welche den techni- schen Prozeß approximativ beschreibt und welche erste Teilmo-

delle umfaßt, ermittelbar ist. Ferner ist der Prozessor der- art eingerichtet, daß anschließend die Abbildungsvorschrift derart ermittelbar ist, daß die ersten Teilmodelle mit minde- stens einem zweiten Teilmodell erweitert werden, wobei die Abbildungsvorschrift im Vergleich zu der approximativen Ab- bildungsvorschrift stabilisiert wird.

Diese Anordnung ist insbesondere geeignet zur Durchführung des erfindungsgemäßen Verfahrens oder einer seiner nachfol- gend erläuterten Weiterbildungen.

Der besondere Vorteil der Erfindung liegt darin, daß die Sta- bilität der Abbildung gegenüber einem fehlerhaften Datenpunkt erheblich verbessert wird. Gerade durch die Überlagerung der ersten Teilmodelle mit dem zweiten Teilmodell wird eine In- stabilität einer Abbildung, welche Abbildung nur erste Teil- modelle aufweist, und welche Instabilität insbesondere in ei- nem Bereich in dem vorgegebenen Raum, der nur eine geringe Dichte von vorgegebenen Trainingsdatenpunkten aufweist, redu- ziert. Des Weiteren wird durch diese Vorgehensweise auch eine Genauigkeit der Beschreibung des technischen Prozesses durch die Abbildungsvorschrift verbessert.

Bevorzugte Weiterbildungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.

Bevorzugt wird die Abbildungsvorschrift mit mehreren zweiten Teilmodellen erweitert und/oder das zweite Teilmodell mit mehreren ersten Teilmodellen überlagert.

Bei der Beschreibung komplexer technischer Prozesse sind/ist die Ausgangsgröße und/oder die Eingangsgröße mehrdimensiona- le/ein mehrdimensionale Größen/Größe.

Eine weitere Verbesserung der Beschreibung wird dadurch er- reicht, daß die Überlagerung des zweiten Teilmodells unter Verwendung einer Gewichtungsfunktion durchgeführt wird.

In einer Weiterbildung wird die Gewichtungsfunktion unter Verwendung einer Summe von Gewichtungen ermittelt.

Bevorzugt wird die Abbildungsvorschrift im Rahmen eines neu- ronalen Netzes verwendet.

In einer Weiterbildung sind/ist das neuronale Netz und/oder das zweite Teilmodell vom Typ Multi Adaline.

Bevorzugt wird die Abbildungsvorschrift wie folgt beschrie- ben : wobei : actk = (x-Zk) * ak + bk (15) gk = exp (-----*(x-|)2)(17) 2 * au mit : x, y Eingangsgröße, Ausgangsgröße k Laufvariable nk Zahl der Clusterzentren der ersten Teilmodelle ak Steigung

bk Biaswert SG Summe von Gewichtungen gk, g0 Gewichtungsfunktionen Xk Partitionsfunktion actk lineares Adaline Clusterzentrum ak Varianz Bevorzugt sind/ist die Ausgangsgröße und/oder die Eingangs- größe eine Prozeßgröße und/oder eine Steuergröße einer tech- nischen Anlage.

Einer Weiterbildung wird zur Überwachung und/oder Regelung einer technischen Anlage eingesetzt.

Bevorzugt ist die technische Anlage eine Stahlwalzanlage.

Eine vorteilhafte Weiterbildung wird im Rahmen eines Trai- nings eines neuronalen Netzes eingesetzt. Von besonderem Vor- teil ist es, eine Weiterbildung bei einem Online-Lernen des neuronalen Netzes einzusetzen. Damit wird die Stabilität der Abbildung des technischen Prozesses im Betrieb des techni- schen Prozesses weiter verbessert. Dies ist dadurch möglich, daß bei dem Online-Lernen die Beschreibung des technischen Prozesses im Betrieb des technischen Prozesses an ein sich änderndes Systemverhalten angepaßt wird.

Ausführungsbeispiele der Erfindung sind in Figuren darge- stellt und werden im weiteren näher erläutert.

Es zeigen :

Figur 1 Schematische Darstellung von Komponenten einer durch ein neuronales Netz bzw. ein Fuzzy-System über- wachten und gesteuerten Stahlwalzanlage Figur 2 Verfahrensschritte für ein Training des neuronalen Netzes bzw. Fuzzy-Systems Figur 3 Darstellung eines Abbildungsverhalten eines neuro- nalen Netzes In Figur 1 sind schematisch Komponenten einer unter Verwen- dung eines neuronalen Netzes überwachten und gesteuerten Stahlwalzanlage zu einer Stahlverarbeitung dargestellt.

Figur 1 zeigt ein System der Stahlwalzanlage 101 zur Stahl- verarbeitung (Walzprozeß). Das System der Stahlwalzanlage 101 wird unter Verwendung eines neuronalen Netzes 102 überwacht und gesteuert. Ein Systemverhalten der Stahlwalzanlage 101 wird durch das neuronale Netzes 102, welches vom Typ Radiale- Basisfunktionen-Netz ist, beschrieben.

Anstelle des neuronalen Netzes 102 kann auch ein Fuzzy-System 110 für die Überwachung und die Steuerung der Stahlwalzanlage 101 eingesetzt werden.

Ferner sind geeignete Meßmittel 103, beispielsweise Sensoren 103, dargestellt, mit denen Prozeßgrößen, die den Prozeß der Stahlverarbeitung beeinflussen, gemessen werden. Die Meßmit- tel 103 sind über einem Bus 104 mit einem Speicher 105 ver- bunden. Zu vorgebbaren Zeitpunkten werden die Prozeßgrößen gemessen und in dem Speicher 105 gespeichert.

Die gemessenen Prozeßgrößen sind chemische Prozeßgrößen, wie beispielsweise eine Kohlenstoffkonzentration oder eine Man- gankonzentration, eine Endbandtemperatur eines gewalzten Stahlbandes, eine Endbanddicke des gewalzten Stahlbandes so- wie eine Walzengeschwindigkeit.

Ferner ist ein weiteres Meßmittel 106 dargestellt, mit dem eine weitere Prozeßgröße, eine Walzkraft, die eine zu überwa- chende Größe und eine Steuergröße des Prozesses bzw. des Sy- stems der Stahlwalzanlage 101 ist, gemessen wird. Das weitere Meßmittel 106 ist ebenfalls über den Bus 104 mit dem Speicher 105 verbunden. Die weitere Prozeßgröße wird ebenfalls an dem System Stahlwalzanlage 101 zu den vorgebbaren Zeitpunkten ge- messen und in dem Speicher 105 gespeichert.

Der Speicher 105 ist über einen weiteren Bus 115 mit einer Verarbeitungseinheit 107, die einen Prozessor 108 aufweist, beispielsweise ein Rechner, verbunden. Das neuronale Netz 102 bzw. das Fuzzy-System 110 ist in Form von Software in der Verarbeitungseinheit 107 gespeichert. Der Prozessor 108 führt die Software aus.

Die Walzkraft ist eine Ausgangsgröße des neuronalen Netzes 102 bzw. des Fuzzy-Systems 110, welches das Systemverhalten der Stahlwalzanlage 101 beschreibt. Die Walzkraft wird aus Eingangsgrößen, die an das neuronale Netz 101 bzw. an das Fuzzy-System 110 angelegt werden, wobei das neuronale Netz 101 bzw. das Fuzzy-System 110 ein vorgebbares Abbildungsver- halten aufweist, bestimmt wird.

Für die Bestimmung der Eingangsgrößen des neuronalen Netzes 102 bzw. des Fuzzy-Systems 110 werden aus den gemessenen Pro- zeßgrößen solche Prozeßgrößen ausgewählt, die den Prozeß der Stahlverarbeitung maßgeblich beeinflussen. Der Einfluß je- weils einer Prozeßgröße auf den Prozeß wird durch eine Sensi- tivitätsanalyse bestimmt. Es werden folgende Eingangsgrößen ausgewählt : -Kohlenstoffkonzentration des verarbeiteten Stahls -Mangankonzentration des verarbeiteten Stahls -Endbandtemperatur eines gewalzten Stahlbandes

-Endbanddicke des gewalzten Stahlbandes -Walzengeschwindigkeit einer Stahlwalze Die Eingangsgrößen werden an das neuronale Netz 102 bzw. an das Fuzzy-System 110 angelegt. Das neuronale Netz 102 bzw. das Fuzzy-System 110 bestimmt unter Verwendung der Eingangs- größen die Ausgangsgröße Walzkraft. Die Ausgangsgröße wird an dem neuronalen Netz 102 bzw. an dem Fuzzy-System 110 mittels eines Mittels 108 abgegriffen und über eine Datenleitung 109, welche das neuronale Netz 102 bzw. das Fuzzy-System 110 mit dem System der Stahlwalzanlage 101 verbindet, an das System der Stahlwalzanlage 101 übertragen.

Unter Verwendung der Ausgangsgröße Walzkraft wird das System Stahlwalzanlage 101 unter Verwendung geeigneter Mittel 111 überwacht und gesteuert, wobei durch eine geeignete Einstel- lung der Walzkraft eine vorgegebene Endbanddicke des Stahl- bandes erzeugt wird.

Die einzustellende Walzkraft wird unter Verwendung des neuro- nalen Netzes 102 bzw. des Fuzzy-Systems 110 für eine vorgege- bene Endbanddicke des Stahlbandes bestimmt.

Figur 2 zeigt Verfahrensschritte, die im Rahmen eines Trai- nings des neuronalen Netzes, mit welchem Training ein vorgeb- bares Abbildungsverhalten bestimmt wird, durchgeführt werden.

Die Verfahrensschritte werden entsprechend bei dem Fuzzy- Systems durchgeführt.

Für das Training des neuronalen Netzes werden Trainingsdaten derart ermittelt, daß die ausgewählten Prozeßgrößen 201 und die Walzkraft 202 an der Stahlwalzanlage zu vorgebbaren Zeit- punkten gemessen, jeweils für einen Zeitpunkt als ein Trai-

ningsdatenvektor 203 zusammengefaßt und in dem Speicher ge- speichert werden 204.

Die Trainingsdatenvektoren werden an das neuronale Netz ange- legt 205.

Als eine Targetgröße für das Training des neuronalen Netzes wird ein unter Verwendung der Ausgangsgröße Walzkraft be- stimmter sogenannter Walzkraftkorrekturfaktor ermittelt 206.

Unter Verwendung der Trainingsdatenvektoren und der Target- größe wird das neuronale Netz mit einem bekannten Trainings- verfahren, wie es in [1] beschrieben ist, trainiert 207.

Das Training des neuronalen Netzes wird bevorzugt im Betrieb der Stahlwalzanlage durchgeführt, wobei die Trainingsdaten im Betrieb der Stahlwalzanlage gemessen werden und damit auch Anwendungsdaten für das neuronale Netz sind. Ein derartiges Training wird als ein sogenanntes Online-Training bezeichnet.

Das Online-Training weist den Vorteil auf, daß eine Ånderung in dem Systemverhalten der Stahlwalzanlage ohne große Zeit- verzögerung in dem Abbildungsverhalten des neuronalen Netzes berücksichtigt wird. Eine solche Änderung kann beispielsweise durch eine-Abnutzung von einer Komponente der Stahlwalzanlage verursacht werden.

Im folgenden wird ein Abbildungsverhalten eines neuronalen Netzes, wie es für eine Überwachung und ein Steuerung eines Systems eines technischen Systems, beispielsweise das oben beschriebene System der Stahlwalzanlage, eingesetzt wird, nä- her beschrieben.

Figur 3 zeigt in einer vereinfachten Darstellung eine Abbil- dung durch ein neuronales Netz.

Für die vereinfachte Darstellung wird ein eindimensionaler Eingangsraum (x) als ein Eingangsraum des neuronalen Netzes mit einer eindimensionalen Eingangsgröße x verwendet. Im All- gemeinen wird eine Dimension des Eingangsraums durch eine An- zahl von Eingangsgrößen bestimmt. Das oben beschriebene neu- ronale Netz zur Überwachung und Steuerung der Stahlwalzanlage weist beispielsweise einen mehrdimensionalen Eingangsraum auf. Die Ausgangsgröße des neuronalen Netzes ist eine eindi- mensionale Ausgangsgröße y. Damit erfolgt durch das neuronale Netz, das ein Systemverhalten eines technischen Systems be- schreibt, eine Abbildung der Eingangsgröße xi auf die Aus- gangsgröße y in einem Zustandsraum (x, y) 315.

Figur 3 zeigt den Zustandsraum (x, y) 315, in dem das System- verhalten des Prozesses durch sogenannte Arbeitspunkte 304 des Prozesses beschrieben ist.

In Figur 3 sind weitere Arbeitspunkte 305 dargestellt, die fehlerhafte Arbeitspunkte 305 sind, wie sie beispielsweise durch eine falsche Messung von Prozeßgrößen auftreten können.

Liegen die fehlerhaften Arbeitspunkte 305 in einem Bereich in dem Zustandsraum (x, y) 315, in dem eine Dichte der Ar- beitspunkte 304 gering ist, so wird durch ein Training des neuronalen Netzes, welches nur erste Teilmodelle umfaßt, eine Abbildungvorschrift bzw. eine Abbildung 306 derart falsch be- stimmt, daß die Abbildungsvorschrift bzw. die Abbildung 306 für Datenpunkte in dem Bereich instabil ist. Des Weiteren be- schreibt die Abbildungsvorschrift bzw. die Abbildung 306 den technischen Prozeß in dem Bereich in dem Zustandsraum (x, y) 315 nicht mit einer ausreichender Genauigkeit.

Ferner sind in Figur 3 die drei ersten Teilmodelle durch je- weils ein einem ersten Teilmodell zugeordneten Clusterzentrum

Rk 301,302,303, jeweils einer einem ersten Teilmodell zuge- ordneten Partitionsfunktion #k 309,310,311 und jeweils ein einem ersten Teilmodell zugeordneten lineares Adaline actk 320,321,322 dargestellt.

Das Clusterzentrum Fk 301,302,303 wird durch ein Cluste- ringverfahren, wie es in [2] und [3] beschrieben ist, be- stimmt.

Die Stabilität der Abbildung und damit auch die Genauigkeit der Beschreibung des technischen Prozesses werden dadurch verbessert, daß die ersten Teilmodelle mit einem zweiten Teilmodell überlagert werden. Die verbesserte Beschreibung 308 ist ebenfalls in der Figur 3 dargestellt.

Das zweite Teilmodell umfaßt ein globales lineares Adaline acto 323 mit einem Zentrum Lo = 0.

Das neuronale Netz, welches ein Radiale-Basisfunktionen-Netz vom Typ Multi Adaline, wie es in [1] beschrieben ist, ist, läßt sich unter Berücksichtigung der Überlagerung mit dem zweiten Teilmodell wie folgt darstellen : wobei : actk = µk)*ak+bk- gk = exp (-1 * (x-pk)) (17) 2 * ak

mit : x, y Eingangsgröße, Ausgangsgröße k Laufvariable nk Zahl der Clusterzentren der ersten Teilmodelle ak Steigung bk Biaswert SG Summe von Gewichtungen gk, g0 Gewichtungsfunktionen bk Partitionsfunktion actk lineares Adaline Clusterzentrum Ck Varianz Die Summe von den Gewichtungen ist ein Maß für eine Zugehö- rigkeit eines ausgewählten Datenpunkts zu den ersten Teilmo- delle. Kleine Werte von SG für einen ausgewählten Datenpunkt bedeuten, daß der ausgewählte Datenpunkt durch kein Cluster- zentrum repräsentiert wird, wie beispielsweise die falschen Arbeitspunkte 305. Große Werte von SG für einen ausgewählten Datenpunkt bedeuten, daß der ausgewählte Datenpunkt einen ge- ringen Abstand in dem Zustandsraum (x, y) 315 von einem der Clusterzentren 301,302,303 aufweist.

Die Zugehörigkeitsfunktion go des zweiten Teilmodell ist eine Konstante. Die Konstante wird derart gewählt, daß folgende Abschätzungen gelten : Für große Werte von SG :

Xk k-% l (für die ersten Teilmodelle, 1 1 # 3) go « SG Für kleine Werte von SG : xl = 0 (für die ersten Teilmodelle, 1 < l < 3) xo =l g0 SG Die Konstante go wird in Abhängigkeit einer gegebenen Vertei- lung von SG gewählt. Absolute Werte von SG und die Verteilung von SG hängen von einer Datenverteilung in dem Zustandsraum (x, y) 315, einer Normierung, einer Lage und der Anzahl der Clusterzentren Ah 301,302,303 und einem Smoothing-Wert ab.

Die Wahl der Konstante erfolgt durch eine Optimierung der Verteilung von SG. Beispielsweise wird go = 0.25 gewählt.

Die beschriebene Abbildung durch das neuronale Netz wird als ein Sourcecode in einer C/C++ Bibliothek mit einer Schnitt- stelle zu MATLAB in einer Verarbeitungseinheit, beispielswei- se ein Rechner mit einem Prozessor, implementiert.

Im folgenden werden Alternativen des Ausführungsbeispiels dargestellt.

Eine Überlagerung der ersten und der zweiten Teilmodelle kann auch derart erfolgen, daß jeweils ein erstes Teilmodell mit einem zugeordneten zweiten Teilmodell überlagert wird. Dabei können die zweiten Teilmodelle vom Typ lineares Adaline sein.

Die Überlagerung kann, wie beschrieben, unter Verwendung der Summe der Gewichte erfolgen.

Ebenso kann eine Überlagerung derart ausgestaltet sein, daß die ersten Teilmodelle mit einem zweiten Teilmodell und zu- gleich jeweils ein ersten Teilmodell mit einem zugeordneten weiteren zweiten Teilmodell überlagert wird.

Das zweite Teilmodell kann auch vom Typ Polynom sein. Ferner kann das zweite Teilmodell ein analytisches Modell, welches den technischen Prozeß oder Teile des technischen Prozesses beschreibt, oder eine andere Form von Vorwissen sein.

Die Abbildung kann auch durch ein Fuzzy-System beschrieben werden. Die oben beschriebene Zusammenhänge gelten entspre- chend für das Fuzzy-System.

Anstelle des im Ausführungsbeispiel beschriebenen Fuzzy- Clustering-Verfahrens kann das Clustering unter Verwendung eines K-Means-Verfahrens (KM) oder durch ein Neural-Gas- Verfahren (NG) erfolgen.

Ferner kann die Erfindung, die bei dem beschriebenen Ausfüh- rungsbeispiel für eine Überwachung und eine Steuerung einer Stahlwalzanlage eingesetzt wird, auch für die Überwachung und Steuerung eines beliebigen technischen Systems, wie bei- spielsweise eine Papierwickelvorrichtung oder eine Kläranlage eingesetzt-werden.

Im Rahmen dieses Dokuments wurden folgende Veröffentlichungen zitiert : [1] 0. Nelles, LOLIMOT-Lokale, lineare Modelle zur Identi- fikation nichtlinearer, dynamischer Systeme, in : Automa- tisierungstechnik, Bd. 45 (1997), S. 163-174, R. Olden- bourg Verlag, 1997 [2] J. Hollatz und T. Runkler, Datenanalyse und Regelerzeu- gung mit Fuzzy-Clustering, Fuzzy-Systeme in Theorie und Anwendungen, in : Hellendoorn Adamy Prehn Wegmann und Lin- zenkirchner, Kapitel 5.6, Siemens AG, Nürnberg, 1997 [3] J. C. Bezdek et al, Detection and Characterization of Cluster Substructure, II. Fuzzy c Varieties and Convex Combinations thereof SIAM Journal on Applied Mathematics, Volume 40, No. 2, Seite 358-370,1981 [4] A. Zell, Simulation Neuronaler Netze, S. 225-240, Addi- son-Wesley Publishing Company, 1994

Previous Patent: METHOD AND ARRANGEMENT FOR COMPUTER-ASSISTED DETERMINATION OF A MEMBERSHIP FUNCTION

Next Patent: COMPUTER SYSTEM FOR MOTOR VEHICLES