Beispiel: EK-Anforderungen für die Commerzbank-Aktie bei Variation des internen Modells
Beispiele für Erklärungen:
Stochastische Interpretation eines linearen Regressionsmodells:
Weil (unter der Annahme der Normalverteilung der Störvariablen bei genau der geschätzten Varianz der Störvariablen und der Existenz eines "richtigen" linearen Modells) die Wahrscheinlichkeit, dass ein "richtiger" Koeffozient von 0 in der Grundgesamtheit einen größeren als den beobachteten Regressionskoeffizienten hervorbringt, kleiner als 1% ist, wird die Variable bei der Einschätzung der Ausfallwahrscheinlichkeit berücksichtigt (Der Koeffizient ist signifkant größer als 0).
LIME (lokale interpretierbare, modelagnostische Erklärung)
In der lokalen Umgebung des betrachteten Wertes haben die Variablen $X$ mit der jeweiligen Merkmalsausprägung $x_i$ in einer erkärbaren Approximation des betrachteten Modells nach einer Wichtigkeitsmetrik die folgenden Wichtigkeiten:
Die für die praktische Verwendung so wichtige Ursachenanalyse ist nur sehr eingeschränkt möglich.
Sie erzeugen Modelle, die nur als Ganzes zur Prognose verwendbar sind. Eine Weiterverwendung von "Wissensbausteinen" ist nicht vorgesehen.
aktlaw=LLaws(data,'df.costs',x='df.costs',bed_y='df.smoker==1',bed_x='df.smoker==0')
aktlaw.PlotLaws('ct')
display(aktlaw.DescribeLaw()[['Target','Bench','Bed_y','R','Bed_x','TU_ct','Div(TU_ct)','Min(TU_ct)','Max(TU_ct)']])
In jeder Sequenz von $32$ Versicherten waren die durchschnittlichen Kosten der Raucher größer als die der Nichtraucher.
Dieses Muster wurde in $DiV=40,825$ ($+1$) nicht überlappenden Fenstern der Länge $T=32$ beobachtet.
Diese Aussagen sind annahmefrei.
Diese Prognose ist nach 32 weiteren Beobachtungen exakt überprüfbar.
Emergente Gesetze sind objektiv, sie machen objektiv überprüfbare Prognosen, sie sind eindeutig interpretierbar und Modelle bestehen aus Wissensbausteinen, die vielseitig verwendbar sind.
Was bisher immer so war kann sich nicht widersprechen. Emergente Gesetze erlauben die Generierung von widerspruchsfreiem "Wissen" darüber was bisher immer war. (KnowledgeBases)
Unsere Algorithmen generieren SQL-Datenbanken mit unterschiedlichen Arten von emergenten Gesetzen, die die Vorteile unserer Methodik nutzbar machen.
Use Cases:
KnowledgeNet:
Menge von im Bezug auf die durchschnittliche Kosten bisher immer geordneten und im Ergebnis zu disjunkten Mengen führenden Auswahlregeln (Pairwise Net).
Ein emergentes Gesetz aus diesem KnowledgeNet:
Versicherte, die
verursachten in jeder Sequenz von T=4 Versicherten im Durchschnitt höhere Kosten als die Versicherten, die mit allen anderen Auswahlregeln im Netz ausgewählt werden.
Die Vorhersage, das dies auch in der nächsten Gruppe von 4 Beschäftigten wieder so sein wird, wurde in der Evaluierungsstichprobe bestätigt (Mean (oos) = 41082,087>37467,376).
Die Prognose, dass ein Muster sich auch beim nächsten Mal wiederholen wird, ist eindeutig überprüfbar.
Man kann also in Teilsequenzen von Daten nach Gesetzen suchen und dann einfach zählen, wie viele Gesetze man gefunden hat und wie oft die Prognose, dass das Muster sich wiederholt, richtig war.
Für unterschiedliche Probleme ergeben sich die folgenden Zeitpfade der empirisch beobachteten Raten richtiger Prognosen (Rel) in Abhängigkeit von DiV:
Sucht man in den Zeitpfaden von Prognosen und Bestätigungen nach emergenten Gesetzen, so findet man die folgenden Gesetze über die Mindestrate richtiger Prognosen (Rel) in Abhängigkeit von DiV:
pd.read_excel("C:/Users/Kuck/Documents/kuck/ZES/Homepage/RelsBeispiele.xlsx")
Über bisher alle von uns untersuchten Probleme haben wir tatsächlich (bisher) universell richtige emergente Gesetze über die untere Grenze der Rate richtiger Prognosen in Abhängigkeit von DiV gefunden.
Die Anwendung auf obiges Beispiel folgt dann dem Grundmuster emergenzbasierten induktiven Schließens:
-> Die Prognose, dass auch in der nächsten Sequenz von 32 Tagen die durchschnittlichen Kosten der Raucher größer sein werden als die der Nichtraucher, gehört zu einer Kategorie von Prognosen, für die bisher immer mindestens 95% richtig waren.
Überprübare Prognosen führen zu Gesetzen über die Mindestrate richtiger Prognosen (Metagesetze). Metagesetze erlauben die annahmefreie Suche nach Gesetzen mit einer bestimmten empirischen "Mindestqualität" zur Steuerung unserer Algorithmen.
Unser Ansatz erlaubt die fast universelle Verwendbarkeit deduktiv nomologischer Erklärungen (Hempel-Oppenheim-Schema) zur Beantwortung von Fragen:
Trage alle
so dass die Konsequenz (die Antwort auf die Frage) logisch folgt.
Falls Gesetzmäßigkeiten oder Beobachtungen zur vollständigen Erklärung fehlen, lege Deine Annahmen offen.
Die Klassifizierung auf Basis von Scores (Modellen) bietet hier einige Vorteile gegenüber gegenüber einfachen KnowledgeNets:
Ein emergenzbasiertes Modell ist eine Sequenz von (nach einer Performance-Metrik) bisher immer nach T Schätzungen prognoseverbessernden (ggf. bedingten) Prognoseheuristik:
Beispiel Fico-Score
pd.read_excel("C:/Users/Kuck/Documents/kuck/ELBS/Daten/fico_heloc/heloc_data_dictionary-2.xlsx",sheet_name='Tabelle1')
Weil Sie bei der Variablen
wird ihr Score auf 0,7361 gesetzt
Weil Sie bei der Variablen
wird ihr Score um 0.024652 auf 0.760782 erhöht.
...
Insgesamt ergibt sich bei Ihnen ein Score von 1.
Weil
Hängt ab von der verwendeten Pricing-Regel.
Emergenzbasiert könnte man z.B. den Zinssatz (die Prämie) verwenden, die in einer Ratingklasse bisher immer (in jedem Jahr oder rollierend in jeder Periode von 365 Tagen) zur Deckung der Kosten geführt hätte:
Beispiel Insurance: Wir verlangen von Ihnen die Prämie r weil
• Auf welchen Wert muss man die einzelnen Variablen setzen, um in die nächst-bessere Ratingklasse zu kommen?
pd.read_excel("C:/Users/Kuck/Documents/kuck/ELBS/Daten/fico_heloc/heloc_data_dictionary-2.xlsx",sheet_name='Tabelle2')
Kann man bei einer an das aktuelle Aufsichtsrecht angelehnten Pricingstrategie Gesetze über unprofitable Geschäftsbereiche finden?
Die üblich Vorgehensweise bei der RAROC-basierten Zinssetzung läßt sich an folgender Formel beschreiben:
$r_i=EL_i+r_e \cdot rwa_i+c_i$
mit
Wir verwenden als Datensatz die Daten der Peer-to-Peer Plattform Lending Club.
Wenn wir
verwenden, können wir nun mit einer
den auf Basis des IRBA-Ansatzes zu fordernden Zinsatz berechen.
Diesen können wir dann den tatsächlich realisierten Einnahmen gegenüberstellen und versuchen, ob unser Algorithmus Regeln zur Identifikation nicht profitabler Teilportfolien findet:
Was war in einem stabilen Prozess bisher immer so - Emergente Gesetze erlauben die eindeutige Kontrolle der Stabilität technischer und betriebswirtschaftlicher Systeme.
Folgende Ereignisse lösen automatische Warnungen aus:
1. Warnungen über die Falsifikation von Gesetzen, die für die Objekte im KnowledgeNet gelten (Kästchen werden rot).
2. Warnungen über das Wiederauftreten unerwünschter (erwünschter) Objekte (graue Kästchen werden farbig)
Beispiel Lending Club: Ein auf einem Modell basierendes Pairwise-Net wird als Grundlage verwendet
Grafische Darstellung der out-of-sample Entwicklung relevanter rollierender Mittelwerte in einem WorldView: