Willkommen im Institut für digitale Forschung und Bildung Stata FAQ Wie kann ich fehlende Werte in verschiedene Kategorien umkodieren Stata erlaubt es uns, verschiedene Arten von numerischen fehlenden Werten zu kodieren. Es hat 27 numerische fehlende Kategorien. Ldquor; z "und & ldquor; Z. B. Auf dieser Seite zeigen wir, wie man fehlende Werte in verschiedene Kategorien kodiert. Zuerst erstellen wir einen Datensatz zur Veranschaulichung. In diesem Datensatz sind alle Variablen numerisch und die Variablen female und ses fehlende Werte. Die nicht fehlenden Werte für Variable weiblich sind 0 (für männlich) und 1 (für weiblich). Die nicht fehlenden Werte für die Variable ses sind 0 (niedrig), 1 (med) und 2 (hoch). Die restlichen Werte gelten als fehlende Werte. Lassen Sie uns sagen, dass wir -999 in eine Kategorie, -99 in einen anderen und den Rest der fehlenden Werte in eine dritte Kategorie für alle Variablen. Methode 1: Verwenden von Befehl Ersetzen Man kann fehlende Werte manuell durch ".a für -999," b für -99 und. c für den Rest der fehlenden Werte ersetzen. Zum Beispiel für variable weibliche. Können wir Folgendes tun: Der obige Codebuchbefehl zeigt, dass die Variable weiblich drei Arten von fehlenden Werten und 4 fehlenden Werten hat. Methode 2: Verwenden von Befehl mvdecode Methode 1 möglicherweise nicht die beste Art, fehlende Werte in verschiedene Kategorien umzukodieren. Für eine Sache, müssen wir es tun, eine Variable zu einer Zeit. Statas mvdecode Befehl kommt praktisch für uns. Noch besser können wir mit dem Schlüsselwort alle auf alle Variablen im Datensatz verweisen. Gehen von fehlenden Wertcodes zu numerischen Werten Das andere Problem, das wir hier behandeln, ist das Ändern fehlender Wertcodes zurück zu numerischen Werten. Der Befehl mvencode ist mit dem Befehl mvdecode gekoppelt, den wir oben besprochen haben und der hier zu verwenden ist. Multiple Regression mit Qualitative unabhängigen Variablen I Neben der Pulsrate vor und nach: Der Inhalt dieser Website darf nicht als Befürwortung eines bestimmten Web-Site, ein Buch oder Software-Produkt von der Universität California. Running für Excel ausgelegt werden Das Laufen fand statt, der Datensatz, ob jeder Schüler lief oder nicht, ob sie rauchten, ihr Geschlecht, Höhe (in Zentimetern), Gewicht (in Pfund) und Aktivität Ebene. Diese letztere wird codiert und es werden kategorische Daten numerisch kodiert geordnet. (Die Zahlen spiegeln die Reihenfolge aber nicht zu wörtlich genommen werden quotmoderatequot nicht zweimal die Aktivität von quotlowquot bedeutet.) Sie können den gesamten Datensatz auf unserer Seite als Textdatei oder als Excel-Tabelle zu finden. Qualitative unabhängige Variablen mit zwei Kategorien Es gibt viele Situationen, in denen eine quantitative Variable von quantitativen und qualitativen Variablen abhängt. Wir betrachten den einfachen Fall, in dem wir eine quantitative unabhängige Variable und eine qualitative unabhängige Variable mit nur zwei Kategorien haben. Insbesondere werden wir sehen, wie das Gewicht der Schüler in der PULSE-Daten variiert mit ihren Höhen, und ob die Beziehung ist unterschiedlich für die beiden Geschlechter. Scatterplots Ein angemessenes Diagramm für das Betrachten, wie Gewicht abhängig von Höhe und Geschlecht ist, ist einfach ein scatterplot des Gewichts über der Höhe, in der die Datenpunkte irgendwie codiert werden, um Rüden von den Frauen zu unterscheiden. Um das Scatterplot für die Unterscheidung von Männchen und Weibchen zu zeichnen, gehen Sie wie folgt vor: Wir müssen zuerst sortieren Höhe und Gewicht Spalten nach Männern und Frauen. Für diese Auswahl Spalten Geschlecht, Höhe und Gewicht. Wählen Sie Option Daten auf der oberen Menüleiste, wählen Sie Sortieren. Dann klicken Sie auf Abwärtspfeil in der Option Sortieren nach. Klicken Sie auf Sex. Klicken Sie dann auf OK. Als nächstes wählen Sie die Option Insert in der oberen Menüleiste, wählen Sie Diagramm-Assistenten. Wählen Sie Diagrammtyp scatter. Klicken Sie auf Weiter. Dann klicken Sie auf Serie. Drücken Sie die Taste Hinzufügen. Geben Sie den Namen als "Männlich" ein. Geben Sie die Daten für x-Werte als Höhen für Männer, y-Werte als Gewichte für Männer ein. Drücken Sie nun erneut die Taste Add. Geben Sie den Namen als weiblich ein. Geben Sie x-Werte als Höhen für Frauen und y-Werte als Gewicht für Frauen ein. Abschließend fertig. Sie erhalten folgende Scatterplot. Wir sehen eine allgemeine lineare Tendenz mit dem Gewicht steigt mit der Höhe für beide Männer und für die Daten als Ganzes. Allerdings, wenn wir nur auf die Frauen schauen, scheinen sie etwa 120 £ plus oder minus ungeachtet der Höhe wiegen. Wir können auch zwei ungewöhnlich hohe Werte, ein Weibchen in einer Höhe von 61 und ein Gewicht von 140, das andere Männchen bei (72, 215) notieren. Notieren Sie sich das. Diese könnten Ausreißer sein, aber sie könnten auch das Ergebnis einer anderen Variablen sein, die möglicherweise ein ungewöhnliches Aktivitätsniveau ist. 0-1 Kodierung Um mit qualitativen Variablen wie Sex zu arbeiten, müssen wir sie oft numerisch kodieren. Für zwei Kategorien ist es praktisch, eins als 0 und das andere als 1 zu kodieren. Wenn wir das tun, dann haben Zusammenfassungsstatistiken für die Variable 0-1 eine nützliche Bedeutung. Solche 0-1-Variablen werden auch als Indikatorvariablen oder Dummy-Variablen bezeichnet. Um sie zu erstellen, markieren Sie die Spalte Geschlecht. Kopieren Sie die Spalte und fügen Sie die gleiche Spalte neben ActivityL in zwei Spalten ein. Ersetzen Sie nun das Label-Geschlecht durch "Male" der ersten Spalte und "Female" in der zweiten Spalte. Markieren Sie nun die Spalte "Männlich". Dann wählen Sie die Option Bearbeiten in der oberen Menüleiste, klicken Sie auf
No comments:
Post a Comment