Drawing Drawing











Anwendungen emergenzbasierter KI
in Produktion und Betriebswirtschaft



Zentrum für Emergenzbasierte Statistik
http://zes.dhbw-vs.de


kuck@dhbw-vs.de

Inhalt

  1. Warum ist eine neue statistische Methodik überhaupt notwendig?

  2. Anwendungsbeispiele zentraler Vorteile emergenzbasierter Statistik

    • 2.1. KnowledgeNets: Gesetze über immer unterschiedliche Raten von Kündigungen
    • 2.2. Ursachenanalyse und Policies: Gesetze über die Konsequenzen der Veränderung von Auswahlregeln
    • 2.3. Multizielanalysen: CNC-Prozessanalyse
    • 2.4. Policies mit den größten Effekten: Dauer der Qualitätssicherung
    • 2.5. KnowledgeWarehouses: Stabilitätskontrolle technischer Systeme

  3. Das Fundament aller Anwendungen: Metagesetze und der Emergente Induktionsschluss

1. Warum ist eine neue statistische Methodik überhaupt notwendig?

  • Unterschiedliche statistische und ML-Verfahren erzeugen aus den gleichen Datensatz unterschiedliche Modelle für dieselbe Größe. Es ist nicht eindeutig überprüfbar, welches Modell und welche Prognose "richtig" ist. Es lässt sich kein widerspruchsfreies "Wissen" generieren.
  • Derzeit verwendete Formen der Relevanzanalyse für einzelne erklärende Variablen basieren meist auf sehr fragwürdigen Metriken und sind nur schwer interpretierbar. Die für die praktische Verwendung so wichtige Interpretation der Modelle als Basis für Ursachenanalysen sind nur sehr eingeschränkt möglich.
  • Sie erzeugen Modelle, die nur als Ganzes zur Prognose verwendbar sind. Eine Weiterverwendung von "Wissensbausteinen" ist nicht vorgesehen.

2. Anwendungsbeispiele zentraler Vorteile emergenzbasierter Statistik

  • Muster sind definiert als Relationen zwischen Funktionen von Sequenzen von Messungen
  • Ein emergentes Gesetz ist eine bisher wahre Allaussage darüber, dass ein "Muster" in Daten bisher immer beobachtet wurde.

Emergente Gesetze sind objektiv, sie machen objektiv überprüfbare Prognosen, sie sind eindeutig interpretierbar und Modelle bestehen aus Wissensbausteinen die vielseitig verwendbar sind.

Was bisher immer so war kann sich nicht widersprechen. Emergente Gesetze erlauben die Generierung von widerspruchsfreiem "Wissen" darüber was bisher immer war. (KnowledgeBases)

Unsere Algorithmen generieren SQL-Datenbanken mit unterschiedlichen Arten von emergenten Gesetzen, die die Vorteile unserer Methodik nutzbar machen.

Use Cases:

  • Analyse von Produktionsfehlern
  • Analyse von Maschinenstillstandszeiten
  • Call-Center-Planung
  • Personalplanung
  • Absatz- und Umsatzprognose
  • Makroökonomische Modelle und Prognosen
  • Erklärbare algorithmische Entscheidungen in Banken und Versicherungen

2.1. KnowledgeNets: Gesetze über immer unterschiedliche Raten von Kündigungen

Beispiel für Gesetze zur Vorhersage von Kündigungen von Mitarbeitern von IBM (34 exogene Variablen).

Drawing

KnowledgeNet:
Menge von im Bezug auf die durchschnittliche Kündigungsrate bisher immer geordneten Auswahlregeln (Pairwise Net).

Ein emergentes Gesetz aus diesem KnowledgeNet:

Beschäftigte

  • auf dem untersten Job-Level (JobLevel==1)
  • die im letzten Jahr Überstunden gemacht haben (Overtime=='Yes')
  • die nicht 3 Trainings im letzten Jahr gemacht haben (~(TraingTimesLastYear==3))

hatten in jeder Sequenz von T=64 Beschäftigen eine größere Kündigungsrate als die Beschäftigten, die mit allen anderen Auswahlregeln im Netz ausgewählt werden.

Die Vorhersage, dass dies auch in der nächsten Gruppe von 64 Beschäftigten wieder so sein wird, gehört zu einer Kategorie von Prognosen, die bisher immer in mindestens 80% der Fälle richtig waren. In der Evaluierungsstichprobe wurde diese Prognose auch bestätigt (Mean (oos) = 0.5>0.4118).

2.2. Ursachenanalyse und Policies: Gesetze über die Konsequenzen der Veränderung von Auswahlregeln

Emergente Gesetze und darauf basierende Prognosen sind vollständig erklärbar. Dies erlaubt Gesetze über die Ergebnisse von "Was war wenn"-Experimenten zur Ursachenanalyse und zur Prognose der Konsequenzen von Handlungen. (Pseudo-Experimente)

Beispiel für Gesetze über die Ergebnisse hypothetischer Experimente über Policies:

Drawing

Modifiziert man obige Auswahlregel in dem man statt

  • Beschäftigte die Überstunden gemacht haben (Overtime=='Yes')
  • nun Beschäftigte die keine Überstunden gemacht haben (Overtime=='No')

auswählt, aber die anderen Auswahlkriterien gleich lässt, so wurde in jeder Sequenz von 10 Beschäftigten die Rate von Kündigungen geringer.

Die Prognose das dies auch bei den nächsten 10 Beschäftigten so sein würde wurde in der Evaluierungsstichprobe bestätigt (Change of Mean (oos) = -0.3627)

2.3. Multizielanalysen: CNC-Prozessanalyse

Emergente Gesetze haben die Eigenschaften von Lego und nicht von Puzzles: Sie erlauben z.B. einfache Multi-Ziel-Analysen.

Beispiel: Fehleranalyse bei einem CNC-Process:

Drawing

Bei einem CNC-Prozess wurde die folgende Regel zur Auswahl von Messwerten identifiziert, die in jeder Sequenz von 8 Messungen die höchste Rate von fehlerhaften Ergebnissen (passed_visual_inspection==1) aufwies:

${e^{feedrate} \over {e^{clamp \ pressure}}}\in \{8886110,52050783; 3584912846,1316923\}$

Die Vorhersage, dass diese Messwerte auch in der nächsten Sequenz von 8 wieder die höchste Fehlerrate aufweisen würde, wurde in der Evaluierungsstichprobe bestätigt.

Weiterhin war hier auch in jeder Sequenz von 16 Messwerten der höchste Anteil abgenutzter cutting-tools zu beobachten.

2.4. Policies mit den größten Effekten: Dauer der Qualitätssicherung

Welches ist die Veränderung einer Auswahlregel, die insgesamt zur größten Reduktion der Dauer der Qualitätssicherung?

Hier werden die Objekt-Policy-Kombinationen identifiziert, in der Sequenzen von Qualitätssicherungen bisher immer insgesamt die größte Reduktion der Gesamtdauer der Qualitätssicherung zur Folge gehabt haben.

Drawing

Wenn man für alle Teile, die nach der dargestellten Regel ausgewählt werden, die Messgröße $X28$ vom Wert 0 auf den Wert 1 setzen kann, dann hätte man die insgesamt größte Reduktion der Dauer des Qualitätssicherungsprozesses erreicht.

2.5 KnowledgeWarehouses: Stabilitätskontrolle technischer Systeme

Was war in einem stabilen Prozess bisher immer so - Emergente Gesetze erlauben die eindeutige Kontrolle der Stabilität technischer und betriebswirtschaftlicher Systeme.

  • Ein KnowledgeWarehouse enthält KnowledgeBases die mit jeder neuen Beobachtung (oder nach anderen, festgelegten Ereignissen) upgedated werden.
  • Gesetze über die Intervalle, in denen interessierende Größen von Objekten eines KnowledgeNets bisher immer lagen, lassen sich dann auch graphisch als Worldview darstellen. (Kästchen im Film)
  • Diese Intervalle werden bei jeder neuen Beobachtung überprüft. (Punkte im Film)
  • Wir sagen, dass ein Objekt in einem Zeitfenster $T_{exo}$ beobachtet werden kann, wenn mindestens $T_U$ Messungen von dem Objekt im betrachteten Zeitfenster gemacht wurden.

Folgende Ereignisse lösen automatische Warnungen aus:

1. Warnungen über die Falsifikation von Gesetzen, die für die Objekte im KnowledgeNet gelten (Kästchen werden rot).

2. Warnungen über das Wiederauftreten unerwünschter (erwünschter) Objekte (graue Kästchen werden farbig)

3. Das Fundament der emergenzbasierten Statistik: Der Emergente Induktionsschluss

Ein $emergentes~Gesetz$ ist eine bisher wahre Allaussage darüber, dass ein "Muster" in Daten bisher immer beobachtet wurde.

Muster sind definiert als Relationen zwischen Funktionen von Sequenzen von Messungen

Beispiel für ein einfaches emergentes Gesetz:

(Daten: Messungen verschiedener Maße für Luftverschmutzung in einer italienischen Stadt)

In jeder Sequenz von 16 Tagen war die durchschnittliche CO-Konzentration um 18:00 Uhr größer als die um Mitternacht.

Dieses Muster wurde in $DiV=18,75$ (+1) nicht überlappenden Fenstern der Länge $T=16$ beobachtet.

Die Prognose, dass ein Muster sich auch beim nächsten mal wiederholen wird, ist eindeutig überprüfbar.

Man kann also in Teilsequenzen von Daten nach Gesetzen suchen und dann einfach zählen, wie viele Gesetze man gefunden hat und wie oft die Prognose, dass das Muster sich wiederholt, richtig war.

Für unterschiedliche Probleme ergeben sich die folgenden Zeitpfade der empirisch beobachteten Raten richtiger Prognosen (Rel) in Abhängigkeit von DiV:

Drawing

Sucht man in den Zeitpfaden von Prognosen und Bestätigungen nach emergenten Gesetzen, so findet man die folgenden Gesetze über die Mindestrate richtiger Prognosen (Rel) in Abhängigkeit von DiV:

In [5]:
pd.read_excel("C:/Users/Kuck/Documents/kuck/ZES/Homepage/RelsBeispiele.xlsx")
Out[5]:
DiV_Laws AirQuality Lending Club Crime Soccer
0 DiV=1 Rel > 0.5 Rel > 0.5 Rel > 0.5 Rel > 0.5
1 1<DiV<=2 Rel > 0.6 Rel > 0.6 Rel > 0.6 Rel > 0.5
2 2<DiV<=4 Rel > 0.7 Rel > 0.7 Rel > 0.7 Rel > 0.6
3 4<DiV<=8 Rel > 0.8 Rel > 0.8 Rel > 0.8 Rel > 0.7
4 8<DiV<=16 Rel > 0.8 Rel > 0.9 Rel > 0.8 Rel > 0.8
5 16<DiV<=32 Rel > 0.9 Rel > 0.95 Rel > 0.9 Rel > 0.95
6 32<DiV<=64 Rel > 0.95 Rel > 0.99 Rel > 0.9 Rel > 0.99
7 64<DiV<=128 Rel > 0.95 Rel > 0.99 Rel > 0.95 Rel > 0.99
8 128<DiV<=256 Rel > 0.99 Rel > 0.999 Rel > 0.99 NaN
9 256<DiV<=512 Rel > 0.99 Rel > 0.999 Rel > 0.99 NaN
10 512<DiV<=1024 Rel > 0.99 Rel > 0.999 Rel > 0.99 NaN
11 1024<DiV<=2048 Rel > 0.999 Rel > 0.999 NaN NaN
12 2048<DiV<=4096 Rel > 0.999 Rel > 0.999 NaN NaN

Über bisher alle von uns untersuchten Probleme haben wir tatsächlich (bisher) universell richtige emergente Gesetze über die untere Grenze der Rate richtiger Prognosen in Abhängigkeit von DiV gefunden.

Die Anwendung auf obiges Beispiel folgt dann dem Grundmuster emergenzbasierten induktiven Schließens:

  • In jeder Sequenz von 16 Tagen war die durchschnittliche CO-Konzentration um 18:00 Uhr größer als um Mitternacht.
  • Das Muster wurde in $DiV=18,75$ (+1) nicht überlappenden Fenstern der Länge $T=16$ beobachtet.
  • Es gab bisher für jedes Prognoseproblem eine Sequenz von Prognosen mit zwischen 16 und 32 mal bestätigten Gesetzen, für die die Rate richtiger Prognosen größer als 90% war.

-> Die Prognose, dass auch in der nächsten Sequenz von 16 Tagen die durchschnittliche CO-Konzentration um 18:00 Uhr größer sein wird als um Mitternacht, gehört zu einer Kategorie von Prognosen, für die bisher immer mindestens 90% richtig waren.

Überprübare Prognosen führen zu Gesetze über die Mindestrate richtiger Prognosen (Metagesetze). Metagesetze erlauben die annahmefreie Suche nach Gesetzen mit einer bestimmten empirischen "Mindestqualität".