The R Project for Statistical Computing

Einsatz der Open Source Software R im Risikomanagement


Einsatz der Open Source Software R im Risikomanagement News

Noch immer wird Risikomanagement häufig ohne hinreichende Berücksichtigung der inhärenten Stochastizität  der Risiken betrieben.  So werden in vielen Unternehmungen weiterhin RiskMaps bzw. Heat Maps – trotz ihrer bekannten grundsätzlichen Schwächen – als Basis für das Risikomanagement eingesetzt.  Die Schwächen der RiskMaps sind dabei nicht nur von akademischer Natur, sondern können in der Praxis  zu eklatanten Fehleinschätzungen führen. Zudem sind diese Schwächen systematisch und werden daher nicht nur in Ausnahmesituationen wirksam [vgl. Gleißner/Romeike 2011 und Romeike 2010].

Zum Glück nehmen manche Unternehmungen aber doch zunehmend Abstand von der fehlerbehafteten Risikoklassifizierung durch RiskMaps und versuchen sich stattdessen an einer ernsthaften Quantifizierung der Risiken.

Aus unserer Sicht ist eine wirkliche Risikoquantifizierung einer der zentralen Bausteine eines adäquaten Risikomanagements. Dazu muss zunächst die Risikolandschaft in Einzelrisiken oder Risikoklassen segmentiert werden. Sodann sind diese Risikosegmente  zu quantifizieren, um dann schließlich zu einem Gesamtrisiko aggregiert zu werden. Der Aggregationsprozess muss die Abhängigkeitsstrukturen zwischen den einzelnen Risikosegmenten berücksichtigen, um eine Unterschätzung des Gesamtrisikos zu vermeiden.

Das alles kann zuweilen ein sehr aufwändiger Prozess sein. Zudem ist das Ganze stets nachzubessern und muss insbesondere laufend an die sich ändernden Umstände angepasst werden.  Belohnt wird ein Unternehmen, welches diesen Aufwand betreibt, dann allerdings mit Einsichten, die Basis eines aktiven Risikomanagements werden können und so zu einer besseren Kapitalallokation und beispielsweise auch zu einem ökonomisch untermauerten Versicherungseinkauf  führen können.

Risiko und Wahrscheinlichkeit

Dem Begriff des Risikos ist es inhärent, dass er sich auf mögliche Ereignisse oder Ausprägungen von Ereignissen bezieht. Die Quantifizierung von Risiken bedient sich daher des Wahrscheinlichkeitsbegriffs und damit der mathematischen Wahrscheinlichkeitstheorie. Man kann sagen, dass die Quantifizierung eines Risikos die Zuordnung einer oder mehrerer Wahrscheinlichkeitsverteilungen bedeutet.
Die Bestimmung von Wahrscheinlichkeiten beinhaltet  statistische Methoden und verwendet häufig – gerade bei komplexeren Zusammenhängen – die Methode der Monte Carlo Simulation (MCS) bzw. verwandter Simulationsmethoden. So ist MCS heute zu einer der wichtigsten Methoden der quantitativen Risikoanalyse geworden. Sobald ein gewisser Komplexitätsgrad des betrachteten Systems erreicht wird, ist MCS praktisch unverzichtbar. Über die Anwendung der MCS im Risikomanagement ist auch in dieser Zeitschrift bereits wiederholt geschrieben worden.

Gerade auch weil Expertenschätzungen von Wahrscheinlichkeiten starken – psychologisch bedingten – Verzerrungen unterliegen,  ist die adäquate Quantifizierung von Risiken ein wichtiger Bestandteil des Risikomanagements.
Amos Tversky und Daniel Kahneman, die als die Pioniere der sogenannten Verhaltensökonomie (behavioral economics) gelten, haben hierzu grundlegende Studien verfasst [vgl. Tversky/Kahneman 1974].

Tabellenkalkulationsprogramme und Monte Carlo Simulation

Die immer noch häufig verwendeten Tabellenkalkulationsprogramme stoßen bei der Durchführung komplexerer Simulationen schnell an ihre Grenzen. Die dort fertig implementierten statistischen Routinen sind limitiert und die Tabellen werden zudem höchst unübersichtlich, sobald ein gewisser Komplexitätsgrad erreicht wird.
Allein schon die Unübersichtlichkeit der Kalkulationstabellen kann bereits die Revisionssicherheit solcher Lösungen gefährden. Hinzu kommt, dass Tabellenkalkulationsprogramme  für viele Anwendungen eine zu geringe Rechengeschwindigkeit bieten, um als geeignetes Werkzeug einsetzbar zu sein. Dies gilt insbesondere dann, wenn es zu häufigen Neukalibrierungen oder gar partiellen Restrukturierungen des Modells kommt.

Spezielle Add Ons für MS Excel® wie etwa @Risk®, Crystal Ball®, ModelRisk® oder RiskKit® schaffen zwar deutliche Erleichterung, können aber die grundsätzlichen Probleme von Tabellenkalkulationsmodellen nicht vollständig beseitigen.

Die andererseits angebotenen Spezialsoftwarepakete  bieten zunächst eine anwenderfreundliche Oberfläche und sind dadurch schnell einsetzbar. Genannt seien hier insbesondere die für die Assekuranz entwickelten Systeme ReMetrica, IGLOO® und RiskExplorer® (vgl. Köhnlein/Willert/Rauschen 2006].

Auch das besonders im Bankenbereich für OpRisk im Rahmen des AMA (Advanced Measurement Approach) von Basel III zum Einsatz kommende Instrument ORC – Operational Risk Center der Interexa kann hier mit Einschränkung genannt werden. Die Einschränkung rührt daher, dass das ORC System über die Risikoanalyse bzw. die Monte Carlo Simulation hinausgeht, indem es insbesondere Prozessunterstützung für das Risikomanagement bietet.

Die aufgeführten Systeme sind aber  trotz aller Komplexität in der verwendeten Methodik im Vergleich zu einer Software wie R doch eingeschränkt und insoweit unflexibel. Ferner sind solche Softwaresysteme  typischerweise sehr kostspielig. 

Die Alternative: Das Statistikprogramm R

Einen Ausweg aus diesem Dilemma kann die Open Source Software R bieten. R ist eine frei verfügbare Statistik-Software mit einer extrem breit aufgestellten Funktionalität. Allerdings ist R als solches für viele potenzielle Anwender auf den ersten Blick eher abschreckend, da R zunächst über keinerlei benutzerfreundliche graphische Anwenderoberflächen verfügt. Mittlerweile gibt es allerdings diverse kostenlose Open-Source-Software-Pakete, um R mit graphischen Anwenderoberflächen zu versehen.

Nachfolgend werden kurz die vielfältigen Möglichkeiten der Software R aufgezeigt. Bereits heute wird R in der Industrie und im Finanzbereich intensiv verwendet. Hierunter befinden sich viele namhafte Konzerne. Genannt seien hier die Unternehmen: Unilever N.V., Merck & Co., Inc., Thomas Cook Retail Ltd, Google, Inc. und Facebook Inc..

R wird auch von vielen Banken (so etwa der Unicredit Group und der Intesa Sanpaolo S.p.A. ) und der Assekuranz (beispielsweise Lloyd's,  Asia Capital Reinsurance Group Co) verwendet.

Dessen ungeachtet übersehen immer noch viele Unternehmungen gerade auch KMUs die Möglichkeiten, die sich aus der Verwendung von R und verwandter Open Source Softwaresysteme ergeben können. Dabei kann gerade die Verwendung solcher Systeme eine sowohl kostengünstige als auch qualitativ hochstehende Alternative zu kommerziellen Softwaresystemen sein.

Was bietet R im Risikomanagement?

Neben seiner Grundausstattung verfügt R über die Möglichkeit, Zusatzpakete einzubinden. Tausende solcher Zusatzpakete lassen sich bequem und kostenlos dem System hinzufügen.  Diese Pakete decken alle klassischen und auch die jüngsten Entwicklungen in der Statistik/Datenanalyse ab. Es würde den Rahmen dieses Artikels bei weitem sprengen, einen Überblick der Möglichkeiten zu verschaffen zu wollen.

Als Beispiel sei erwähnt, dass sich etwa die Extremwerttheorie sehr bequem mittels R umsetzen lässt [vgl. Gleißner/Papenbrock 2012]. Um wenigstens noch zwei weitere für das Risikomanagement relevante Bereiche zu nennen, sei darauf verwiesen, dass zahlreiche R Pakete die Thematiken Bayessche Statistik sowie die mathematische Spieltheorie berühren.

In der Praxis ist die Anbindung einer neu zum Einsatz kommenden Software an andere im Unternehmen bereits benutze Softwaresysteme wesentlich. Gerade hier besitzt R eine seiner Stärken. Es gibt eine Vielzahl von Paketen, die es erlauben R mit anderen gängigen Softwarepaketen zu verknüpfen. So ist etwa eine Anbindung an MS Excel® und MS Access® leicht zu bewerkstelligen.

Durch seine Vielfalt an Zusatzpaketen kann R verschiedenste Aufgaben, die bei einer Risikoquantifizierung mittels MCS abzuarbeiten sind, in einer Arbeitsabfolge durchführen:

  • Datenreinigung / Datenfilterung;
  • Statistische Analysen;
  • Verteilungsanpassungen / Kurvenfitting;
  • Bestimmung von Abhängigkeitsstrukturen zwischen verschiedenen Risikoquellen;
  • Umsetzung dieser Ergebnisse in einem Monte Carlo Simulationsmodell;
  • Durchführung von Monte Carlo Simulationen;
  • Auswertung der simulierten Daten;
  • Verfassen eines Berichtes.


Die Vielfalt der Möglichkeiten dieses "Alleskönners" führt zu dem Luxusproblem einer anfänglichen Unübersichtlichkeit. Externe Beratung kann hier hilfreich sein.

Bei der Entscheidung über eine etwaige Einführung von R sollte ebenfalls im Auge behalten werden, dass R natürlich auch jenseits des Risikomanagements interessante Verwendungen finden kann. So hat sich in unserer Beratungstätigkeit gezeigt, dass sich immer wieder zusätzliche  Anwendungsfelder auftun. Als Beispiel sei hier etwa die statistische Marktanalyse genannt.

Eine zu treffende Grundsatzentscheidung ist dabei, ob man im Unternehmen eigene R Kompetenz vorhalten möchte (und ggf. in welchem Umfang) oder ob man spezialisierte R Anwendungen extern entwickeln lassen möchte. Solche Spezialsysteme  können so entworfen werden, dass der Anwender über keinerlei R  spezifisches Wissen verfügen muss.

Anbindung an andere Softwaresysteme

Eine der ersten Fragen zu einem Softwaresystem ist häufig, ob es sich in die IT-Landschaft eines Unternehmens integrieren lässt.

R verfügt mit seinen Zusatzpaketen über eine breite Palette von Import- und Exportfazilitäten. Dazu gehören beispielsweise  die oben bereits erwähnte mögliche Anbindungen an MS Excel ®, MS Access® aber beispielsweise auch  das Ein- bzw. Auslesen von/in csv-Dateien. R lässt sich außerdem an die meisten Datenbanksysteme anbinden. Es gibt auch Beratungshäuser, die in diesem Bereich Expertise aufgebaut haben und professionelle Unterstützung bieten.  So kann erreicht werden, dass die R-Funktionalität  ein integraler Bestandteil verschiedener Business Prozesse  des Unternehmens wird. Beispielsweise kann R die Einhaltung von Risiko-Limit-Systemen prüfen, statistisch auswerten und ggf. Warnmeldungen automatisiert weitergeben.

Insbesondere lässt sich auch das weit verbreitete MS Excel® als Cockpit für R Anwendungen verwenden. Auf diese Weise bleibt der Anwender in seinem ihm gewohnten Umfeld unterwegs, hat aber dennoch Zugang auf die volle Maschinerie von R.

Die Verwendung bestimmter R Pakete ermöglichen Parallel Computing. So lässt sich eine hohe Rechengeschwindigkeit erreichen, was wiederum den Umgang mit auch extrem großen Datenmengen möglich macht (Stichwort: Big Data). Auch die sich seit einiger Zeit immer mehr verbreitenden Cloudlösungen, also der Zugriff auf externe Rechenanlagen spezialisierter Anbieter, lassen sich für R fruchtbar machen. Es gibt bereits mehrere Cloudanbieter, die sich in ihren Angeboten explizit auf R beziehen.

Erstellung von Risikoberichten

Mit R lässt sich die Erstellung  von Risikoberichten bis zu dem sachlich gerechtfertigten Grad hin automatisieren. Steht also einmal eine Modellierung einer Risikolandschaft, so kann, wenn sich beispielsweise die Parametrisierung der in der Monte Carlo Simulation verwendeten Verteilungen  verändert hat, auf Knopfdruck nicht nur eine neue Simulation angestoßen werden, sondern im Anschluss auch direkt ein Report generiert werden.

Es stehen dazu mehrere Möglichkeiten zur Verfügung. So lassen sich neben MS Word® Dokumenten beispielsweise auch hochwertige druckreife LaTeX Dokumente erstellen. Hierbei können auch Graphiken und Tabellen eingebunden werden.

Graphische Darstellungen

R bietet unter anderem auch eine äußerst potente graphische Maschinerie. Diese erlaubt es die Ergebnisse in prägnanter und übersichtlicher Form darzustellen. Die Möglichkeiten gehen dabei weit über das hinaus, was etwa in MS Excel® möglich ist.

Insbesondere offeriert R auch verschiedene interaktive Graphik Anwendungen.
Dieser graphische Output erleichtert die Interpretation der Ergebnisse. In Abbildung 1, Abbildung 2 und Abbildung 3 sind einige Beispiele (Diagnoseplots zur Verteilungsanpassung, 3-dim Plot einer Copula, Geographische Darstellung eines Risikoexposures) visualisiert.

Abbildung 1: Fitting Plots in R
Abbildung 1: Fitting Plots in R

Abbildung 2: Konturplot einer Copula
Abbildung 2: Konturplot einer Copula

Abbildung 3: Darstellung des geographischen Risikosplits (unter Einbeziehung von Google Maps)

Abbildung 3: Darstellung des geographischen Risikosplits (unter Einbeziehung von Google Maps)


Neben  der einfachen Darstellung des geographischen Risikosplits lässt sich in R übrigens auch die ganze Technik  der modernen Geostatistik einbringen. Allein für diesen Spezialsektor gibt es viele Zusatzpakete welche in R geladen und genutzt werden können.

GUIS (Graphical User Interfaces/Graphische Anwenderoberflächen)

Das Standard-GUI von R ist für den Anfänger in seiner Kargheit eher abschreckend (vgl. Abbildung 4).

Abbildung 4: Standard GUI

Abbildung 4: Standard GUI


Es gibt aber einige generische GUIs, die die Anwendung von R erleichtern. Zudem lassen sich – wie oben bereits erwähnt – ohne zu großen Aufwand für jeden Anwendungszweck Spezial GUIs aufbauen, so dass der Endanwender keinerlei R Kenntnisse benötigt.

Hierbei kann es sich um eine Kombination von Eingabemasken und Ausgabefelder handeln oder etwa auch – für den fortgeschrittenen Anwender – um eine GUI, welche die Modellstruktur darstellt (vgl. Abbildung 5).

Abbildung 5: Beispiel eines Struktur GUI‘s und interaktiver Histogramme

Abbildung 5: Beispiel eines Struktur GUI‘s und interaktiver Histogramme


Fazit und Ausblick

Die Software R ist ein geeignetes Instrument zur Durchführung quantitativer Risikoanalysen auf hohem Niveau. R offeriert eine Vielzahl von Analysemethoden. Sobald die Grundstruktur eines Analysemodells steht, lässt sich hierzu eine GUI aufbauen, die es auch Nicht-R-Kennern ermöglicht, Analysen schnell durchzuführen.

R kann an verschiedenste im Unternehmen bereits vorhandene Softwaresysteme angebunden werden. Die Einführung von R ist mit gewissen zusätzlichen Anfangskosten (etwa Einarbeitung, externe Beratung, GUI-Aufbau) verbunden. Diese  Kosten werden durch Effizienzvorteile oder ggf. zusätzlich auch durch die Einsparung von Softwarelizenzgebühren überkompensiert.

Der Open Source Charakter und die extrem große weltweite Anwendergemeinschaft macht die Nutzung von R zukunftssicher.



Quellenverzeichnis sowie weiterführende Literaturhinweise
   
Gleißner, W./Romeike, F. (2011): Die größte anzunehmende Dummheit im Risikomanagement - Berechnung der Summe von Schadenserwartungswerten als Maß für den Gesamtrisikoumfang, in: Risk, Compliance & Audit (RC&A), 01/2011, S. 21-26.

Gleißner, Werner/Papenbrock, Jochen (2012): Extremrisiken und unvorhersehbare Ereignisse, in: Risikomanager, 5/2012, S. 1, 6-16.

Groß, Jürgen (2010): Grundlegende Statistik mit R: Eine anwendungsorientierte Einführung in die Verwendung der Statistik Software R, Vieweg Teubner, Wiesbaden 2010.

Handl, Andreas (ohne Jahresangabe): Einführung in die Statistik mit R,

www.wiwi.uni-bielefeld.de/~frohn/Mitarbeiter/Handl/statskript.pdf

Köhnlein, Dieter/Willert, Thomas/Rauschen, Thomas (2006): Aktuarielle Software für Risikomanagement und Unternehmenssteuerung, in: Versicherungswirtschaft, Heft 20/2006, S. 1650-1654.

Romeike, Frank (2010): Risikoadjustierte Unternehmensplanung - Optimierung risikobehafteter Entscheidungen basierend auf stochastischen Szenariomethoden, in: Risk, Compliance & Audit (RC&A), 06/2010, S. 13-19.

Tversky, Amos/Kahneman, Daniel (1974): Judgment under Uncertainty: Heuristics and Biases, Science, New Series, Vol. 185, No. 4157. (Sep. 27, 1974), pp. 1124-1131.

Zentrale Webseite zu R / Downloads:

cran.r-project.org



Autor:

Dr. Heiko Frings, Geschäftsführer der  Dr. Heiko Frings Mathematische Unternehmensberatung GbR, München.


[Bildquelle oben: © cirquedesprit - Fotolia.com]

 

Risk Academy

The seminars of the RiskAcademy® focus on methods and instruments for evolutionary and revolutionary ways in risk management.

More Information
Newsletter

The newsletter RiskNEWS informs about developments in risk management, current book publications as well as events.

Register now
Solution provider

Are you looking for a software solution or a service provider in the field of risk management, GRC, ICS or ISMS?

Find a solution provider
Ihre Daten werden selbstverständlich vertraulich behandelt und nicht an Dritte weitergegeben. Weitere Informationen finden Sie in unseren Datenschutzbestimmungen.