Risiken beim Einsatz neuronaler Netze vermeiden

Sicherheit geht vor

01.08.2000 // Fachartikel
Abb. 1 Werden neuronale Netze mit zu wenigen Datensätzen trainiert, bringt das System zufällige Werte hervor
Abb. 1 Werden neuronale Netze mit zu wenigen Datensätzen trainiert, bringt das System zufällige Werte hervor
Abb.2 Der SecurityNet-Algorithmus stellt sicher, dass die Ungenauigkeit jeder lokalen Prognose des neuronalen Netzes bekannt ist. Diese Ergebnisse werden in der Abbildung als Farben dargestellt.
Abb.2 Der SecurityNet-Algorithmus stellt sicher, dass die Ungenauigkeit jeder lokalen Prognose des neuronalen Netzes bekannt ist. Diese Ergebnisse werden in der Abbildung als Farben dargestellt.
Abb. 3 3D-Schnitt durch das Modell einer chemischen Produktionsanlage: Die grüne Farbe codiert einen kleinen Prognosefehler des Modells und zeigt den Bereich auf, in dem der Optimierer nach datenhinterlegten Ergebnissen suchen kann
Abb. 3 3D-Schnitt durch das Modell einer chemischen Produktionsanlage: Die grüne Farbe codiert einen kleinen Prognosefehler des Modells und zeigt den Bereich auf, in dem der Optimierer nach datenhinterlegten Ergebnissen suchen kann

Neuronale Netze setzen sich in der Optimierung verfahrenstechnischer Prozesse und Rezepturen immer mehr durch. Grund dafür ist, dass sich die Charakteristik eines Prozesses ohne Störungen der Anlage modellieren lässt. Um Risiken durch die Anwendung neuronaler Netze in der industriellen Praxis zu verhindern, ist jedoch eine differenziertere Bewertung der Ergebnisse notwendig.

Neuronale Modelle errechnen gegenüber anderen datengetriebenen Modellierungsverfahren wie statistischen Methoden auf der Basis sehr weniger Datensätze gute nichtlineare Modelle mit vielen Eingängen. Auf diese Weise lassen sich gegebene Größen, zum Beispiel Messgrößen und Rezepturen, auf unbekannte Größen wie Analysen und Qualitätsparameter abbilden. Die so entstandenen Modelle können dann für Prognosen, Softsensoren, Rezepturoptimierung und Parameteroptimierung eingesetzt werden. Neben einem neuronalen Netz benötigt der Anwender dazu Datensätze, in denen der Zusammenhang beispielhaft enthalten ist. An diesen Beispielen lernt das neuronale Netz allgemeine Gesetzmäßigkeiten und erzeugt so ein Modell des Zusammenhanges. Die Güte dieses Modells steht und fällt mit der Güte der zugrunde liegenden Daten.

Folgen bei geringenDatenmengen

Häufig werden neuronale Netze mit zu wenigen Datensätzen trainiert. Dadurch ist die Funktion des neuronalen Netzes unterbestimmt und bringt an bestimmten Stellen zufällige Werte hervor. Abbildung 1 veranschaulicht grafisch die Folgen bei einer zu geringen Anzahl an Datensätzen. Zwei Datensätze (rote Ringe) werden zum Training eines NN-Tools verwendet. Das NN-Modell zeigt bei verschiedenen Versuchen mit den gleichen Datensätzen an den Ecken des Werteraums ohne Stützstellen ein völlig unterschiedliches, zufälliges Verhalten. Bei zweifacher Wiederholung desselben Arbeitsschrittes werden daher unterschiedliche Ergebnisse erzielt.

In der Literatur gibt es Regeln, wie viele unterschiedliche Datensätze zum Training eines verwendbaren neuronalen Modells zu verwenden sind. Die geforderten Datensätze dürfen sich nicht ähnlich sein, sondern müssen absolut gleichmäßig und symmetrisch über den gesamten Werteraum verteilt sein. Die geforderte Gleichverteilung der Datensätze verbietet sich jedoch fast immer aus praktischen Gründen, da in der Verfahrenstechnik die Eingangsvariablen wie Druck und Temperatur meist miteinander gekoppelt sind. Damit ist die Erfüllung dieser Forderung nur in Ausnahmefällen möglich. Zudem muss die Anzahl der unterschiedlichen und gleich verteilten Datensätze mindestens so hoch sein, wie die Anzahl der trainierbaren Größen im neuronalen Netz. Die Anzahl der hiernach notwendigen Datensätze wird ab einer bestimmten Anzahl von Modelleingangsgrößen zu hoch, um noch praktisch angewendet werden zu können. Wegen der Nichtlinearität neuronaler Modelle ist die Anzahl der tatsächlich notwendigen Datensätze zur Erzeugung eines brauchbaren neuronalen Netzes lokal noch viel höher, als die Regeln dies suggerieren.

Prognosefehler darstellen

Die meisten NN-Tools sind zu unsicher für technische Anwendungen, da immer zu wenig Datensätze gegeben sind, um Modelle auf Basis unausgereifter neuronaler Netze statistisch abzusichern. Sie liefern daher nur an den Trainingsstützstellen auswendig gelernte Ergebnisse, ansonsten sind die Ergebnisse zufällig.

Das patentierte SecurityNet-Verfahren zeigt genau die unsicheren Bereiche im neuronalen Modell an. Der SecurityNet-Algorithmus in der Software NeuroModel stellt sicher, dass die Ungenauigkeit jeder lokalen Prognose des neuronalen Netzes bekannt ist. Diese Ergebnisse werden als numerische Werte in der Größenordnung einer Standardabweichung, als Farben oder als Linie in mehrdimensionalen Grafiken dargestellt und für jedes Modell berechnet. Je nichtlinearer das Modell an einer Stelle des Werteraumes ist und je geringer die Datensatzdichte an einer Stelle ist, desto größer ist der ausgegebene Fehlerwert. NeuroModel informiert den Anwender sehr umfassend und gibt den Fehler - hier als Farbe - als Standardabweichung aus (Abb. 2). Da das hinterlegte Fehlererkennungssystem in SecurityNet, ebenso wie das neuronale Modell selbst, nichtlinear ist, sind die lokalen Fehlerprognosen sehr zuverlässig. Das Verfahren hebt sich deutlich von der scheinbaren Sicherheit ab, die lineare statistische Fehlermodelle einem neuronalen Modell verleihen. Da die Komplexität des neuronalen Netzes höher ist, als die der linearen Fehlerfunktionen, kann mit solchen Systemen der Prognosefehler eines neuronalen Netzes nur in Ausnahmefällen grob vorhersagt werden.

Einsatzgebiete

SecurityNet ermöglicht genaue Prognosen mit Ausgabe einer Information über die individuelle Genauigkeit der Prognosen. Damit ist es möglich, zum Beispiel Softsensoren oder Prädiktoren für prädiktive Regelungen zu trainieren. Auf diese Weise ist eine sichere Prozessführung möglich. Des Weiteren lässt sich mit dem System eine Post-Mortem-Versuchsplanung durchführen. Diese führt zu einer systematischen Verbesserung des neuronalen Netzes. Ein neuronales Netz wird dazu mit Rohdaten trainiert und danach von einem speziellen Suchalgorithmus nach Wertebereichen mit hohem Fehler durchsucht. Diese Liste liefert Vorlagen für durchzuführende Versuche. Die Versuche verbessern wiederum die Güte des Modells. Mit der Kombination aus den Rohdaten des Prozesses und der Durchführung von Versuchen werden die vielen gefahrvollen und teuren Zwangsversuche der MPC-Methoden und statistischer Systeme überflüssig. Ein dritter Vorteil des SecurityNet besteht darin, dass eine datengetriebene Methode zur Verfügung steht, die realistische Optimierungsergebnisse ohne komplizierte Rechenmethoden erlaubt. Oft sind die an datengetriebenen Modellen erzielten Optimierungsergebnisse nicht verwendbar, da die Wertebereiche im Modell technisch nicht erreichbar sind. Kann beispielsweise ein Prozess nur in bestimmten Temperatur- und Druckbereichen betrieben werden, die nicht rechteckig angeordnet sind (Abb. 3), wird ein Optimierer, der den gesamten rechteckigen Modellbereich durchfährt, Kombinationen von Temperatur und Druck errechnen, die ebenfalls unrealistisch sind.

SecurityNet dagegen gibt eine Bewertung der einzelnen Ergebnisse aus. Der Optimierer nutzt diese, um Bereiche des Modells zu meiden, die durch reale Daten nicht abgesichert sind. Dadurch werden Ergebnisse vermieden, die technisch keine Entsprechung haben.

E cav 242

Features NeuroModel im Überblick

Die Software NeuroModel erstellt Modelle auf der Basis künstlicher neuronaler Netze und ist speziell auf die Bedürfnisse der chemischen und verfahrenstechnischen Industrie abgestimmt. Sie vermittelt in kürzester Zeit Wissen über die Zusammenhänge der Variablen in einer Anlage und findet optimale Parameter zur Prozessführung. Dafür werden aus historischen Daten Modelle gebildet und diese dann einer Lern- und Analysephase unterzogen. Der Algorithmus ermöglicht die Arbeit mit wenigen chaotisch verteilten und redundanten Datensätzen. Die Konfigurationszeit beträgt nur wenige Minuten.

NeuroModel kann bis zu 255 Variablen aufeinander abbilden, so dass sich auch sehr komplexe Prozesse mit hunderten von Variablen leicht und schnell veranschaulichen und modellieren lassen. Eine wichtige Besonderheit von NeuroModel liegt in dem SecurityNet-Algorithmus und der daraus resultierenden Möglichkeit der Post-Mortem-Versuchsplanung. Der SecurityNet-Algorithmus liefert für jede Aussage des Modells Vertrauensintervalle, die während der Prognose deren Genauigkeit sichtbar machen. Die Post-Mortem-Versuchsplanung ermöglicht es, mit wenigen Versuchen das Modell einer Anlage effizient abzusichern, indem aus wenigen Datensätzen vorab ein prototypisches Modell gebildet und dieses dann von NeuroModel gescannt wird. Die berechneten Werte zeigen dann Bereiche an, in denen das Modell genau oder ungenau arbeitet. Dadurch lassen sich gezielt an den entsprechenden Stellen Versuche durchführen.


Suche Online-Info:
AusgabeJahrKennziffer, Bsp. 0809432

 Messen

Berichte rund um die Powtech und Technopharm  2010
Hier klicken  
Hier gibt es Berichte
rund um die Hannover
Messe 2010
Hier klicken

 


 cav zum Nachlesen

Lesen Sie hier die letzten Ausgaben als PDF.

Zu den PDFs

 Quergerätselt

Juli 2010

 

Wohltäter der Menschheit

  

 

 

Nein, es war nicht die Büchse der Pandora, die die Veranstalter auf der Weltausstellung in London öffneten. Stattdessen – Wunder, oh Wunder – entnahm man dem Behälter eine Art Brotzeit....

 

Gewinnen Sie mit
cav, dei und Pharmaproduktion

 

1. Preis:  Ein Jahresabonnement 
                "Bild der Wissenschaft"
2. Preis:  Ein 3-D-Laserbild in

                Kristallglas (Weltall)
3. Preis:  Ein Buch "Irren ist

                bequem"

 

Hier geht es zum Online-Rätsel

 

 

 Pharmaproduktion

 

 

Das Fachmagazin für die GMP-gerechte Produktion!  Lesen Sie mehr.

 

Bestellen Sie hier Ihr kostenloses Probeexemplar.


Durchfluss-Regelventil, Pulslaser, CNC-Bearbeitungszentrum, Schweißbrenner, Antrieb

Direct Industry
 
Die virtuelle Messe im Netz

 

 

 

 


 Job & Karriere

 

 


 Konradin InvestGuide

 

Der Konradin InvestGuide „ERP in der Prozessindustrie“ gibt Orientierung bei der Systembeschaffung.  

 

Konradin InvestGuide kostenlos
  herunterladen. 

 


   Lesen Sie hier Artikel aus den
   aktuellen Ausgaben unseres
   Partners zum Thema
   Wissenschaft und Forschung


 Verrückte Geschenke

 

Hier geht es zum Wissenschaftsshop von Bild der Wissenschaft.


Chemie