import numpy as np
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
%matplotlib inline
df = pd.read_csv('./data/jahresabschluss_kerndaten.csv')
df_origin = df
df['durchschnittsgehalt_2014'] = df.gesamtbezuege_2014 / df.anzahl_vorstaende_2014
df = df[df.durchschnittsgehalt_2014 > 0]
"Um die Vorstandsgehälter untereinander vergleichbar zu machen, haben wir eine Formel definiert, um die Größe einer Sparkasse darzustellen. Diese beinhaltet Kernwerte einer jeden Sparkasse: Die Bilanzsumme, das Volumen der vergebenen Kredite und das Eigenkapital."
df['bemessung_2014'] = df.bilanzsumme_2014 + df.eigenkapital_2014*10 + df.vergebene_kredite_2014
"Weit mehr als jeder zweite Sparkassen-Vorstand verdient mehr als Merkel"
"Tatsächlich zahlt rund jede zweite der ausgewerteten Sparkassen ihren Vorständen mehr als die etwa 300.000 Euro, die Merkel als Kanzlerin inklusive ihrer Bezüge als Abgeordnete erhält."
df.durchschnittsgehalt_2014.median()
len(df[df.durchschnittsgehalt_2014 > 282000].index) / len(df.index) * 100
"Wir haben die Gehälter von rund 70 Prozent aller Sparkassen ausgewertet."
len(df[df.durchschnittsgehalt_2014 > 0].index) / len(df_origin.index) * 100, len(df[df.durchschnittsgehalt_2014 > 0].index)
"Von 88.000 Euro bis 850.000 Euro" (Spanne der durchschnittl. Vorstandsgehälter)
df.durchschnittsgehalt_2014.min(), df.durchschnittsgehalt_2014.max()
"Vorne liegen die Chefs der Hamburger Sparkasse, die durchschnittlich 853.000 Euro im Jahr bekamen"
columns = ['sparkasse', 'durchschnittsgehalt_2014', 'gesamtbezuege_2014', 'anzahl_vorstaende_2014']
df[df.durchschnittsgehalt_2014 == df.durchschnittsgehalt_2014.max()][columns]
"Berliner Sparkasse zahlte ihren fünf Vorständen im Schnitt 651.833 Euro"
df[df.sparkasse == 'Berliner Sparkasse'][columns]
"und die Manager in Hannover wurden mit 613.661 Euro entlohnt."
df[df.sparkasse == 'Sparkasse Hannover'][columns]
"die Vorstände der [...] Sparkasse Günzburg-Krumbach [erhalten] durchschnittlich 296.500 Euro"
df[df.sparkasse == 'Sparkasse Günzburg-Krumbach'][columns]
"Die beiden Vorstände der Kreissparkasse Saarpfalz in Homburg erhielten 2014 im Schnitt 305.000 Euro. Rund 440 Mitarbeiter werden dort beschäftigt."
columns += ['mitarbeiter_2014']
df[df.sparkasse == 'Kreissparkasse Saarpfalz'][columns]
"Nebenan, in der Landeshauptstadt, bei der Sparkasse Saarbrücken haben die vier Vorstände die dreifache Zahl an Mitarbeitern zu verantworten und erhalten dafür trotzdem nur fast das gleiche Geld. Im Schnitt bekamen sie 300.000 Euro überwiesen"
df[df.sparkasse == 'Sparkasse Saarbrücken'][columns]
Verhältnis Mitarbeiter
451 / 1283
"Die vier Vorstände der Kasseler Sparkasse erhielten durchschnittlich 310.000 Euro. Sie verantworten rund 1.100 Mitarbeiter."
df[df.sparkasse == 'Kasseler Sparkasse'][columns]
"Rund 200km Kilometer südlich beschäftigt die Sparkasse Langen-Seligenstadt etwa 400 Mitarbeiter weniger. Dennoch werden die beiden Vorstände deutlich besser entlohnt und erhalten im Schnitt 100.000 Euro mehr als in Kassel, also 410.000 Euro."
df[df.sparkasse == 'Sparkasse Langen-Seligenstadt'][columns]
Mitarbeiter-Differenz, Gehalts-Differenz
1170 - 740, 408500.0 - 310000.0
"Die vier Vorstände der Sparkasse Münsterland Ost verantworteten im Jahr 2014 gut 1.400 Mitarbeiter und erhielten dafür durchschnittlich 556.000 Euro."
df[df.sparkasse == 'Sparkasse Münsterland Ost'][columns]
"Die Chefs der Stadtsparkasse Düsseldorf bekamen im Schnitt 487.000 Euro, obwohl die Sparkasse der Landeshauptstadt zu den größten Sparkassen in Deutschland zählt. Der Vorstand in Düsseldorf verantwortete mehr als 2.000 Mitarbeiter, trotzdem wurden die Chefs in Münster deutlicher besser bezahlt."
df[df.sparkasse == 'Stadtsparkasse Düsseldorf'][columns]
df.sort_values('bemessung_2014', ascending=False)[columns][:7]
"Sparkasse Leverkusen: Drei Vorstände, die rund 600 Mitarbeiter im Jahr 2014 beschäftigten, erhielten im Schnitt fast 430.000 Euro."
df[df.sparkasse == 'Sparkasse Leverkusen'][columns]
"Bei der Sparkasse Neuss waren doppelt so viele Mitarbeiter beschäftigt. Dennoch wurden auf der anderen Seite des Rheins an jeden der vier Vorstände rund 50.000 Euro weniger verteilt."
df[df.sparkasse == 'Sparkasse Neuss'][columns]
Mitarbeiter-Verhältnis, Gehalts-Differenz
1301.0 / 619.0, 428766 - 378950.0
"Unsere Auswertung zeigt, dass die Gehälter von gleichgroßen Sparkassen in Bayern deutlich näher beieinanderliegen als in NRW. In Bayern verdienen die Vorstände im Schnitt auch weniger."
df = df[(df.state == 'Nordrhein-Westfalen') | (df.state == 'Bayern')]
# weighted avg by 'bemessung' via groupby:
df['durchschnittsgehalt_wt_2014'] = df.durchschnittsgehalt_2014*df.bemessung_2014
df_states = df.groupby('state', as_index=False).sum()
df_states['durchschnittsgehalt_2014_wt'] = df_states.durchschnittsgehalt_wt_2014/df_states.bemessung_2014
df_states[['state', 'durchschnittsgehalt_2014_wt']]