Site menu:

Sprache auf englisch umschalten

cNORM - Gewichtung

Die Repräsentativität der Normstichprobe ist für die Schätzung gültiger Normwerte von wesentlicher Bedeutung. Um dies zu erreichen, wird in der Regel eine Zufallsstichprobe verwendet. Aber selbst wenn es keine systematischen Verzerrungen bei der Datenerhebung gibt, kann die resultierende Stichprobe von der Zusammensetzung der Grundgesamtheit abweichen. cNORM bietet Funktionen, um Stichprobengewichte in den Normierungsprozess zu integrieren und somit negative Auswirkungen von nicht-repräsentativen Normstichproben auf die Qualität der Normwerte zu reduzieren. Zu diesem Zweck wurde das so genannte Raking (= iterative proportionale Anpassung) implementiert, das die Poststratifikation der verwendeten Normstichprobe in Bezug auf eine oder mehrere Schichtungsvariablen (SVs) für gegebene Anteile der Populationsanteile der verwendeten SVs ermöglicht. Die Fälle werden so gewichtet, dass die Zusammensetzung des gewichteten Datensatzes der repräsentativen Grundgesamtheit entspricht.


Berechnung und Standardisierung der Raking-Gewichte

Zur Berechnung der Gewichte wird ein Data-Frame mit drei Spalten benötigt, in denen die Populationsanteile angegeben sind. Die erste Spalte gibt den Namen der Schichtungsvariablen an, die zweite die Faktorstufen der Schichtungsvariable und die dritte den Anteil für die repräsentative Grundgesamtheit. Die Funktion "computeWeights()" wird verwendet, um die Gewichte zu ermitteln. Die ursprünglichen Daten und der Data-Frame müssen als Funktionsparameter übergeben werden. Im folgenden Beispiel gibt es die beiden Schichtungsvariablen 'sex' und 'migration', und beide haben zwei Faktorstufen. Die Gewichte werden für den ppvt-Datensatz berechnet, der beide SV enthält.

marginals <- data.frame(var = c("sex", "sex", "migration", "migration"),
                        level = c(1,2,0,1),
                        prop = c(0.51, 0.49, 0.65, 0.35))

weights <- computeWeights(data = ppvt, population.margins = marginals)



Fallstricke und Empfehlungen für die Anwendung

Wir simulierten ausgiebig verzerrte Verteilungen und ermittelten, ob unser Ansatz die Auswirkungen nicht repräsentativer Stichproben abmildern kann. cNORM selbst korrigiert bereits mehrere Arten von Stichprobenfehlern, nämlich wenn Abweichungen in bestimmten Altersgruppen auftreten oder wenn gemeinsame Wahrscheinlichkeiten von Schichtungsvariablen unausgewogen sind (unter Beibehaltung der Populationsanteile). Auch bei generellen Verzerrungen funktionert die gewichtete Normierung in den meisten, aber nicht allen Anwendungsfällen sehr gut. Bitte beachten Sie das Folgende:



Datenaufbereitung
Modellierung