Probleme beim Einloggen

R Statistik

In der Gruppe können sich Interessierte über die Statistik-Software R austauschen.

Vasily Nekrasov R code to detect support and resistance levels
Support and resistance levels are quite popular among traders. Although they are implemented in many apps and services, an open source implementation of the algorithm is hardly available. We try to close the gap.
https://letyourmoneygrow.com/2018/05/21/r-code-to-detect-support-and-resistance-levels/
Dieter Gennburg Wenn Statisten Statistiker mimen
Eine farbenfrohe Seite lud mich ein:
Die Grafiklösung gefällt mir ausgezeichnet.
Die versprochenen Überraschungen "Unsere Umfrage sorgt auch im dritten Jahr für viele Überraschungen" zeigten sich dann auch prompt.
Die Aussagen zum Bundesländer-Ranking "Bundesweiter Spitzenreiter ist Bayern – mit 130 Innovatoren. Wie sieht es in Ihrem Bundesland aus? Filtern Sie die Innovatoren nach Branchen und Bewertungen." enttäuschte dann doch.
Da Innovationen in der Regel Kopfarbeit verlangen, hätte ich hier ein Ranking pro Kopf und die Nennung aller oben angekündigten Bundesländer erwartet. Da die Zahl für Sachsen-Anhalt fehlt, hier meine Platzverteilung ohne Sachsen-Anhalt wenigstens pro Kopf:
#neues Ranking:
1. Hamburg
2. Berlin
3. Bayern
4. Hessen
5. Baden-Württemberg
6. Nordrhein-Westfalen
7. Thüringen
8. Rheinland-Pfalz
9. Sachsen
10. Niedersachsen
11. Brandenburg
12. Bremen
13. Schleswig-Holstein
14. Saarland
15. Mecklenburg-Vorpommern
#altes Ranking:
1. Bayern
2. Nordrhein-Westfalen
3. Baden-Württemberg
4. Berlin
5. Hessen
6. Hamburg
7. Niedersachsen
8. Rheinland-Pfalz
9. Sachsen
10. Thüringen
11. Brandenburg, Schleswig-Holstein
12. Bremen, Saarland, Mecklenburg-Vorpommern
Wie würden R-Statistiker ein Bundesländer-Ranking seriös lösen?
Dieter Gennburg Methoden der Datenrepräsentation und Klassifikation mit R
Eine umfängliche Einführung zu Methoden der Datenrepräsentation und Klassifikation mit R hier mal als Gesamtsicht zusammengeführt. Quellen:
G. Rohwer, C. Dudel "Methoden der Datenrepräsentation und Klassifikation" Wintersemester 2010/11
Kapitel 1: Einleitung:
1.1 Datenrepräsentation
- 1.1.1 Aufgaben der Datenrepräsentation
- 1.1.2 Ansätze der Datenrepräsentation
- 1.1.3 Beispiele
1.2 Variablen, Abstände, Ähnlichkeiten
- 1.2.1 Statistische und relationale Variablen
- 1.2.2 Abstände und Ähnlichkeiten
- 1.2.3 Abstandsfunktionen für Merkmalsräume
- 1.2.4 Abstandsfunktionen für Objektmengen
- 1.2.5 Abstands- bzw. Ähnlichkeitsmatrizen
- 1.2.6 Metrische und nichtmetrische Abstände
1.3 Klassifikation und Typologien
- 1.3.1 Klassifikationen für Objektmengen
- 1.3.2 Scharfe und unscharfe Klassifikationen
- 1.3.3 Darstellung durch statistische Variablen
- 1.3.4 Typologien für Merkmalsräume
- 1.3.5 Verfahren zur Bildung von Klassifikationen
- 1.3.6 Ansätze zur Konstruktion von Typologien
- 1.3.7 Verwendungen des Typenbegrifis
Kapitel 2: Abstandskonstruktionen mit R-Skript:
2.1 Abstände zwischen Merkmalswerten
- 2.1.1 Objekte und Merkmalswerte
- 2.1.2 Definitionen für Merkmalsräume
2.2 Abstände zwischen Objekten
- 2.2.1 Verwendung von Merkmalswerten
- 2.2.2 Notationen für Datenmatrizen
- 2.2.3 Abstände für Datenmatrizen
- 2.2.4 Gruppierte Daten und Abstände
- 2.2.5 Illustration mit Klausurdaten
- 2.2.6 Abstände zwischen Variablen
- 2.2.7 Kombination von Merkmalsräumen
- 2.2.8 Umgang mit fehlenden Werten
2.3 Abstände zwischen Verteilungen
- 2.3.1 Notationen für Kontingenztabellen
- 2.3.2 Illustration mit Berufsstrukturdaten
- 2.3.3 Unterschiedliche Fragestellungen
- 2.3.4 Der Dissimilaritätsindex
- 2.3.5 Länderspezifische Berufsstrukturen
- 2.3.6 Geschlechtsspezifische Verteilungen
- 2.3.7 Abstände zwischen Klausuraufgaben
2.4 Substitutionsmetriken für Verteilungen
- 2.4.1 Eine allgemeine Definition
- 2.4.2 Illustration mit Schulabschlüssen
Kapitel 3: Multidimensionale Skalierung mit R-Skript:
3.1 Konfigurationen
- 3.1.1 Konfigurationen und Abstände
- 3.1.2 Ein zweidimensionales Beispiel
- 3.1.3 Transformation von Konfigurationen
- 3.1.4 Prokrustes-Rotation
3.2 Metrische MDS -Verfahren
- 3.2.1 Die Problemstellung
- 3.2.2 Alternative Problemformulierungen
- 3.2.3 Rechentechnische Probleme
- 3.2.4 Illustration mit Klausurdaten
- 3.2.5 Metrische MDS mit R
- 3.2.6 Illustration mit Berufsstrukturdaten
- 3.2.7 Das Shepard-Diagramm
3.3 Nichtmetrische MDS -Verfahren
- 3.3.1 Die Problemstellung
- 3.3.2 Berechnungsmethoden
- 3.3.3 Nichtmetrische MDS mit R
- 3.3.4 Illustration mit Berufsstrukturdaten
3.4 Informationsgehalt von MDS-Bildern
- 3.4.1 Ergänzungen der MDS-Bilder
- 3.4.2 Illustration mit Schulabschlüssen
- 3.4.3 Konstruktion ergänzender Achsen
Kapitel 4: Eindimensionale Skalierung mit R-Skript:
4.1 Methoden der Seriation
- 4.1.1 Unterschiedliche Problemformulierungen
- 4.1.2 Ein Beispiel aus der Archäologie
- 4.1.3 Kombinatorische Bestimmung einer Reihenfolge
- 4.1.4 Nichtmetrische eindimensionale Skalierung
- 4.1.5 Berechnungen mit R
4.2 Metrische eindimensionale Skalierung
- 4.2.1 Illustration der Berechnung
- 4.2.2 Die Qualität der Skalierung
- 4.2.3 Skalierung der Klausuraufgaben
- 4.2.4 Berechnungen mit R
- 4.2.5 Größere Mengen von Objekten
Kapitel 5: Ansätze der Clusteranalyse
5.1 Unterschiedliche Ansätze
- 5.1.1 Wie können Cluster definiert werden
- 5.1.2 Abstände und Häufigkeiten
- 5.1.3 Eine unvollständige Übersicht
5.2 Partitionierende Verfahren
- 5.2.1 Ansätze mit Clusterzentren
- 5.2.2 Ansätze ohne Clusterzentren
- 5.2.3 Rechentechnische Probleme
- 5.2.4 Illustration mit artifiziellen Daten
- 5.2.5 Beispiele mit Berufsstrukturdaten
5.3 Vergleiche von Partitionen
- 5.3.1 Ein einfacher Index
- 5.3.2 Substitutionsmetriken
Kapitel 6: Hierarchische Klassifikation mit R-Skript:
6.1 Divisive Verfahren
- 6.1.1 Cluster mit minimalen Durchmessern
- 6.1.2 Varianten divisiver Verfahren
- 6.1.3 Divisive Verfahren in R
- 6.1.4 Ein monothetisches Verfahren
6.2 Agglomerative Verfahren
- 6.2.1 Ein allgemeiner Rahmen
- 6.2.2 SAHN-Algorithmen
- 6.2.3 Illustration mit Berufsstrukturdaten
- 6.2.4 Agglomerative Verfahren in R
- 6.2.5 Dendrogramme
- 6.2.6 Vergleiche der SAHN-Verfahren
- 6.2.7 Erzeugung von Partitionen
6.3 Ultrametrische Baummodelle
- 6.3.1 Hierarchien und Bäume
- 6.3.2 Einfache Baummodelle
- 6.3.3 Minimalbaumberechnung mit R
- 6.3.4 Hierarchische Klassifikationsschemas
- 6.3.5 Darstellung durch Dendrogramme
- 6.3.6 Alternative Abstandsberechnung
- 6.3.7 Optimale ultrametrische Modelle
- 6.3.8 Ultrametrische Modelle in R
Kapitel 7: Unscharfe Klassifikation mit R-Skript:
7.1 Pyramidale Klassifikation
- 7.1.1 Pyramidale Klassifikationsschemas
- 7.1.2 Ein agglomerativer Algorithmus
- 7.1.3 Illustration der Berechnung
- 7.1.4 Indexfunktionen und Abstände
- 7.1.5 Illustration mit Berufsstrukturdaten
- 7.1.6 Bildung überlappender Cluster
7.2 Abstandsmatrizen als Graphen
- 7.2.1 Vergröberung von Abstandsmatrizen
- 7.2.2 Clusterdefinitionen für Graphen
- 7.2.3 Berechnungen mit R
7.3 Graduelle Clusterzugehörigkeit
- 7.3.1 Clusteranalyse mit Prototypen
- 7.3.2 Grade der Clusterzugehörigkeit
- 7.3.3 Fuzzy-Clusteranalyse mit R
7.4 Unscharfe Archetypen
- 7.4.1 Der theoretische Ansatz
- 7.4.2 Berechnungen mit R
Tobias Schneider IBM SPSS Anwendertag am 21.6. in München
Liebe Gruppenmitglieder,
ich möchte Sie recht herzlich am 21.06.2018 zu unserem SPSS & Data Science Anwendertag nach München einladen.
Dort treffen sich neue und langjährige Kunden zum Erfahrungsaustausch.
Zusätzlich präsentieren wir Ihnen die Roadmaps von SPSS Modeler und SPSS Statistics und einen Ausblick, wie IBM Watson Ihnen in diesem Umfeld helfen kann.
Dazu erfahren Sie auch in der Diskussion, wie R in SPSS und Data Science-Lösungen der IBM integriert ist.
Die Veranstaltung ist kostenlos.

Moderatoren

Infos zu den Moderatoren

Über die Gruppe "R Statistik"

  • Gegründet: 28.09.2010
  • Mitglieder: 1.914
  • Sichtbarkeit: offen
  • Beiträge: 679
  • Kommentare: 664