Probleme beim Einloggen

R Statistik

In der Gruppe können sich Interessierte über die Statistik-Software R austauschen.

Dieter Gennburg R in Projekten anwenden für dummies
Das Buch "R Projects For Dummies" von Joseph Schmuller ist Dank Rainer G. Haselier aus dem Amerikanischen ins Deutsche übersetzt worden und erschien unter dem Titel "R in Projekten anwenden für dummies" auch als ebook.
Die R-Projekt-Sicht gefällt mir gut, da sie potentiellen R-Projektanwendern näher steht als allgemeine Ausführungen zur Programmiersprache R.
Aus der Einführung:
"Vielleicht sind Sie wie ich der Meinung, dass der beste Weg, etwas zu lernen, darin besteht ist, es zu tun. Lesen Sie nicht nur einfach über etwas – praktizieren Sie es. Wenn Sie Bauarbeiter sein wollen, dann bauen Sie. Wenn Sie Autor sein wollen, dann schreiben Sie. Wenn Sie Tischler sein wollen, dann tischlern Sie.
Dieses Buch basiert auf dem Prinzip »Learning by Doing«. Mein Ziel ist, dass Sie Ihre R-Kenntnisse und Fähigkeiten erweitern, in dem Sie R verwenden, um Projekte aus verschiedenen Bereichen zu erstellen. Gleichzeitig lernen Sie etwas über die Bereiche und Wissensgebiete, aus denen die Projekte stammen.
Trotz dieser noblen Absichten kann ein Buch wie dieses in eine Falle stolpern. Es kann schnell zu einem Kochbuch werden: Verwenden Sie dieses Package, verwenden Sie jene Funktion, erstellen Sie eine Grafik – und Simsalabim ist es Zeit, weiterzugehen.
Ein solches Buch wollte ich nicht schreiben. Stattdessen führen sämtliche Kapitel ab Teil 2 (das ist die Stelle, an der es mit den Projekten losgeht) Sie nicht einfach nur durch die Projekte. Stattdessen erhalten Sie zuerst etwas Hintergrundwissen zum Themenbereich und dann arbeiten Sie (in den meisten Kapiteln) ein kleines, übersichtliches Projekt aus diesem Bereich durch, damit Sie erste Erfahrungen sammeln können.
Damit jedoch nicht genug: Am Ende jedes Kapitels finden Sie einen Projektvorschlag, der Sie ermutigen soll, das neu erworbene Wissen anzuwenden. Für alle diese Projekte liefere ich Ihnen gerade so viele Informationen, dass Sie direkt loslegen können. (Falls nötig, gehören hierzu auch Tipps über mögliche Stolperfallen.)
Im Verlauf des Buches finden Sie außerdem Schnelle Projektvorschläge. Diese basieren auf kleinen Veränderungen an Projekten, die Sie bereits fertiggestellt haben, und stellen zusätzliche Herausforderungen an Ihre zunehmenden Fähigkeiten dar.
Eines noch: Jeder der behandelten Themenbereiche könnte der Ausgangspunkt für ein eigenes Buch sein, und daher kann ich immer nur an der Oberfläche kratzen. Kapitel 17 verweist auf Ressourcen mit weiterführenden Informationen.
Über dieses Buch
Ich habe dieses Buch in sechs Teile aufgeteilt.
Teil 1: Das Handwerkszeug
In diesem Teil dreht sich alles um R und RStudio. Ich erörtere R-Funktionen, Strukturen und Packages. Außerdem zeige ich Ihnen, wie Sie eine Vielzahl von Diagrammtypen erstellen.
Teil 2: Interaktion mit dem Anwender
Die Projekte beginnen in Teil 2, in dem Sie lernen, interaktive Anwendungen zu erstellen, die direkt auf Benutzereingaben reagieren. Ich stelle das Package shiny vor, das Webbrowser unterstützt und das Package shinydashboard, mit dem Sie Dashboards erstellen können.
Teil 3: Maschinelles Lernen
Dies ist der umfangreichste Teil des Buches. Zuerst erzähle ich Ihnen etwas über das Machine Learning Repository der University of California-Irvine, in dem Sie die Datensätze für die Projekte finden. Außerdem stelle ich Ihnen das Package rattle vor, mit dem Sie Anwendungen für das maschinelle Lernen erstellen können. Die Projekte behandeln Entscheidungsbäume, Random Forests, Support Vector Machines, K-Means-Clustering und neuronale Netzwerke.
Teil 4: Große Datensätze
Die beiden Projekte in Teil 4 untersuchen weit größere Datensätze als die, denen Sie in den vorderen Teilen des Buches begegnen. Das erste Projekt ist eine Analyse der Kundensegmentierung von mehr als 300.000 Kunden eines Online-Shops. Eine darauf aufbauende Analyse setzt Techniken des maschinellen Lernens ein.
Im zweiten Projekt analysieren Sie einen Datensatz mit Daten zu mehr als 500.000 Flügen.
Teil 5: Karten und Bilder
Auch in Teil 5 gibt es zwei Projekte. Das erste Projekt stellt die Lage (neben anderen Informationen) der Flughäfen eines der US-Bundesstaaten auf einer Karte dar. Das zweite Projekt zeigt Ihnen, wie Sie eine animierte Grafik und eine statische, nicht animierte Grafik miteinander kombinieren können.
Teil 6: Der Top-Ten-Teil
Das erste Kapitel in Teil 6 liefert Informationen über nützliche Packages, die bei Ihren zukünftigen Projekten hilfreich sein können. Im zweiten Kapitel erfahren Sie, wo Sie mehr über die Themenbereiche dieses Buches lernen können.":
Dieter Gennburg Six Sigma mit R
Aus der Kurzfassung der Master-Thesen von Emilio López Cano.
"Six Sigma ist eine bahnbrechende Strategie im Qualitätsmanagement, basierend auf der Gliederung DMAIC (Define, Measure, Analyze, Control) und der Verwendung von statistische Methoden. R ist eine freie statistische Softwareumgebung, die sich in der akademischen und wissenschaftlichen Welt verbreitet hat , wenn auch noch nicht im Unternehmensumfeld. Dieser Aufsatz versucht, beide Systeme zu verbinden ... . Außerdem beinhaltet es ein R-Paket.": vgl. Seite 5/63 im PDF
https://eciencia.urjc.es/bitstream/handle/10115/5794/An%20Introduction%20to%20R%20for%20Quality%20Control.pdf
Dieter Gennburg 100 Beispiele zur Datenvisualisierung mit R als Buch erschienen
Ein praktischer Helfer zur Datenvisualisierung mit R ist erschienen.
Das Buch Datendesign mit R von Thomas Rahlf erschien bei Open Source Press in München und lief mir gestern in der c’t über den Weg. Der c’t-Autor Maik Schmidt schrieb „ Rahlfs Liebe zum Detail macht das Buch zu einem Augenschmaus und zugleich zu einer Fundgrube sinnvoller Vorgehensweisen. So kombiniert er R mit dem Satzsystem LaTeX, um längere Textpassagen in Diagrammen optimal darzustellen.“ (Zitat c’t 22/2014, Seite 192) Er nennt abschließend auch die WebSite zum Buch, die gleich den R-Code für viele gut kommentierte Beispiele kopierbereit zeigt:
„Was dieses Buch sein möchte — und was nicht
Das vorliegende Buch ist keine Einführung, die systematisch die Grafikwerkzeuge von R erläutert. Es möchte vielmehr anhand von 100 vollständigen Skript-Beispielen in die Grundlagen der Gestaltung von Präsentationsgrafiken einführen und zeigen, wie Balken- und Säulendiagramme, Bevölkerungspyramiden, Lorenzkurven, Boxplots, Streudiagramme, Zeitreihendarstellungen. Radialpolygone, Gantt-Diagramme, Heatmaps, Bumpcharts, Mosaik- und Ballonplots sowie eine Reihe verschiedener thematischer Kartentypen mit dem Base Graphics System von R erstellt werden.^1 Jedes Beispiel verwendet reale Daten und erläutert die Abbildung und deren Programmierung Schritt für Schritt. Die Auswahl orientiert sich an meinem persönlichen Erfahrungsschatz — sicher wird der eine oder andere die eine oder andere Abbildung vermissen, anderes als zu ausführlich empfinden. Dennoch sollte ein großer Anwendungsbereich abgedeckt sein.
^1 Für die anderen in R verfügbaren Grafikansätze wie grid und, darauf aufbauend, lattice und ggplot2 sei auf bereits vorhandene Einführungen verwiesen.“
Bei ebay habe ich die PDF-Version des Buches für unter 40 € erhalten ;-)).
Hier eine Leseprobe:
https://download.e-bookshelf.de/download/0000/8627/47/L-G-0000862747-0002952526.pdf
Freundliche Grüße
Dieter Gennburg
Dieter Gennburg 111 Beispiele zur Datenvisualisierung mit R als Buch erschienen
Die 2. Auflage von Thomas Rahlf ist mit weiteren Beispielen erschienen.
"Gegenüber der ersten Auflage wurden 11 Beispiele neu aufgenommen, so dass der Untertitel nun „111 Beispiele“ lautet. Der Hauptitel wurde der englischen Ausgabe angepasst. Zwei wesentliche Ergänzungen haben sich ergeben. Zum einen wurde das Kapitel zu kategorialen Daten um einen Abschnitt zur Visualisierung von Netzwerkbeziehungen erweitert. Neben Beispielen für klassische Netzwerkdiagramme, einer angepassten Heatmap und einem multiplen Balkendiagramm findet man hier auch ein Chord-Diagramm und einen Riverplot.
Das Kapitel zu Karten wurde um ein Beispiel zur Verwendung von georeferenzierten Rasterformaten sowie eines zu Cartograms erweitert. Weiterhin wurden drei Beispiele für die Einbindung von mit R erstellten Daten in interaktive JavaScript-Abbildungen ergänzt.":
Wolf Riepl
Ein weiterer Kommentar
Letzter Kommentar:
Dieter Gennburg
Die Antwort gibt Thomas Rahlf auf Seite 44 im ersten Absatz:
"Alle Beispiele dieses Buches verwenden das traditionelle Grafiksystem von R 'Base Graphics'. Daneben gibt es es das von Paul Murrell entwickelte grid, das sehr flexible Möglichkeiten bietet, aber auf einer anderen Konstruktionsweise basiert. Beide bauen auf denselben Grafik-Device-Funktionen auf, sind aber weitgehend incompatibel. Es existieren zwar Brücken zwischen diesen beiden Welten, da sich ihre Vorgehensweisen jedoch grundlegend unterscheiden, sollte man sich entweder für den einen oder den anderen Ansatz entscheiden.":
Dieter Gennburg 7 Rstudio-Spickzettel in deutscher Übersetzung und r4ds im R-Markdown-Quellcode
Gestern war ich mal wieder im Dussmann-Kulturkaufhaus in Berlin stöbern. Ein Blick ins Regal, da erinnerte ich mich an Fabian Pabst, an seinen Hinweis in der xing-Gruppe R-Statistik vom - 27.09.2017, 15:06:
"Eines meiner Lieblings-R-Bücher ist ebenfalls online zu lesen: R for Data Science von Garrett Grolemund und Hadley Wickham -> http://r4ds.had.co.nz/index.html
Auf Grundlage der (laufend aktualisierten) Online-Version wird die Print-Version erzeugt, die man gerne kauft, wenn man lieber in echten Büchern blättert ;-)"
Denn vor mir lag nun die deutsche Übersetzung von Frank Langenau "R für Data Science - Daten importieren, bereinigen, umformen, modellieren und visualisieren".
Der Teil V Kommunizieren widmet sich R-Markdown als "einheitliches Autorenframework für Data Science" vgl. Seite 399
Die Autoren Garrett Grolemund und Hadley Wickham geben auf der selben Seite den Hinweis zum Download des deutschen R-Markdown-Spickzettel. Hier gleich mal Links weiterer deutscher Rstudio-Schummelzettel-Übersetzungen:
1. Daten veranschaulichen mit ggplot2 Schummelzettel:
https://www.rstudio.com/wp-content/uploads/2015/06/ggplot2-german.pdf
2. Daten bändigen mit dplyr und tidyr Schummelzettel:
https://www.rstudio.com/wp-content/uploads/2015/06/data-wrangling-german.pdf
4. R Pakete entwickeln mit devtools Schummelzettel:
https://www.rstudio.com/wp-content/uploads/2015/08/devtools-german.pdf
6. Interaktive WebAnwendungen mit shiny Schummelzettel:
https://www.rstudio.com/wp-content/uploads/2015/08/shiny-german.pdf
Der Knüller jedoch für R-Markdown Freunde zum Originaltitel - "Den Quellcode für das Buch finden Sie unter: https://github.com/hadley/r4ds. Das Buch wird von https://bookdown.org unterstützt, was es erleichtert, R-Markdown-Dateien in HTML, PDF und EPUB zu konvertieren." vgl. Buchseite XXIII
R-Markdown auch als CAFM-Dokumentenframework aufzufassen, gefällt mir super.
Bild unten Quellcodeübersicht von https://github.com/hadley/r4ds
Norbert Köhler Dieter Gennburg Wolf Riepl
+3 weitere Kommentare
Letzter Kommentar:

Moderatoren

Infos zu den Moderatoren

Über die Gruppe "R Statistik"

  • Gegründet: 28.09.2010
  • Mitglieder: 1.940
  • Sichtbarkeit: offen
  • Beiträge: 699
  • Kommentare: 677