Bullet Graph in R

BulletGraphz_h_grey

Stephen Few designed the Bullet Graph as a way to display measurements vs. goals/other benchmarks or as a comparison of benchmarks. The screenshots below shows the bullet chart build by Few’s specifications [...]

Online Clinical Data Mining

ocdm1

Tumordokumentation werden in zahlreichen Einrichtungen die Daten von Krebspatienten gesammelt. Diese werden in regelmäßigen Abständen statistisch ausgewertet und den beteiligten Ärzten zur Verfügung gestellt. Dieser langwierige und aufwändige Prozess entspricht nicht mehr dem Stand der Technik und soll durch ein modernes und einfach zu bedienendes Online Clinical Data Mining (OCDM) System ergänzt werden, ,it dessen Hilfe sollen Mediziner die Daten ihres Krebsregisters statistisch analysieren und sofort alle gängigen statistischen Kennzahlen berechnen können. Dies dient zum einen der explorativen Analyse der Daten, der Hypothesengenerierung für neue medizinische Forschungsvorhaben, wie auch für das Benchmarking, also den Vergleich zwischen Kliniken und Therapieformen.

Kategorisierung stetiger Variablen

Lageparameter

Die Kategorisierung einer stetigen Variablen mittels Median-Split ist eine relativ häufig angewendete Methode. Für den Leser/Anwender hat diese Gruppeneinteilung den Vorteil, dass man relativ schnell den Wert einordnen kann (z.B. low/high). Die Kategorisierung führt jedoch zu Problemen, zunächst einem logischen. Wenn eine stetige Variable bzgl. des Median kategorisiert wird, dann werden alle Werte oberhalb des Median als gleichwertig verwendet. Macht es Sinn einen Datenpunkt knapp oberhalb des Median genauso zu behandeln wie einen Datenpunkt am anderen Ende der Skala, aber einen Datenpunkt knapp unterhalb in eine andere Gruppe zu stecken? Nicht wirklich.

Analyse der Bundestagswahl 2013: die Alternative für Deutschland

Am vergangenen Sonntag fand die Bundestagswahl 2013 in Deutschland statt. Von besonderem Interesse bei dieser Wahl war die Alternative für Deutschland, einer Euro-kritischen Partei, die sich im April diesen Jahres gegründet hatte. Die AfD hat mit 4,7 Prozent knapp den Einzug in den deutschen Bundestag verpasst. Die Partei erhielt bei der Wahl knapp über 2 Millionen Zweitstimmen und 800.000 Erststimmen. In diesem Beitrag möchte ich die wichtigsten Zahlen und Fakten des AfD-Resultats präsentieren. Besonders interessant ist dabei, dass die Partei in den neuen Bundesländern ein außerordentlich gutes Wahlergebnis einfahren konnte, in beinahe allen Wahlkreisen der ersten vier Bundesländern konnte die 5%-Hürde geknackt werden.

Spearman vs. Pearson

exp_func

Die Pearson-Korrelation ist ein Maß für die lineare Beziehung zwischen zwei kontinuierlichen Zufallsvariablen, dabei wird für den Korrelationskoeffizienten nicht eine bivariate Normalverteilung für die beiden Zufallsvariablen vorausgesetzt, sondern nur endliche Varianzen und Kovarianzen. In den gängigen Statistik-Programmen wird für den Korrelation-Test die t-Statistik verwendet, wofür dann vorausgesetzt wird, dass eine bivariate Normalverteilung vorliegt, mittels Bootstrapping bestünde aber die Möglichkeit diese Voraussetzung zu umgehen.

t-Test versus Mann-Whitney-U-Test bei Likert-Items

Boxplot

Winter & Doudou (2012) untersuchten in ihrer Simulations-Studie [3] für 5-Punkt-Likert-Items, ob bei Fragestellungen, bei denen man die Mittelwert vergleicht, eine parametrische oder nicht-parametrische Methode geeigneter sei. Konkret: es wurde der Fehler 1. Art und der Fehler 2. Art für den t-Test und den Mann-Whitney-Test auf 14 künstlich erzeugten Datensätzen untersucht. Ihre Resultate seien hier kurz zusammengefasst: