###################################################### # # # Universität Regensburg - Lehrstuhl für Ökonometrie # # # # Kursprüfung im Fach: Programmieren mit R # # # # Wintersemester 2009/2010 # # # # Datum: 09.02.2010 # # # ###################################################### ################################################# # Bearbeitungshinweise: ################################################# # # - Die Bearbeitungszeit beträgt 60 Minuten. # - Die Klausur besteht aus drei Aufgaben (60 Punkte), die alle bearbeitet werden müssen. # - Zugelassene Hilfsmittel sind das Kursmaterial (gedruckt oder digital) sowie R-bezogene # Internetseiten. # - Benennen Sie diese Datei zunächst um in: 14_Exam_0910_Nachname_Vorname.R # und geben Sie ihren Namen an. # - Senden Sie am Ende der Bearbeitungszeit ihren R-Code an: # roland.weigand@wiwi.uni-regensburg.de # - Drucken Sie nach dem Versenden Ihren Code aus und geben Sie Ihn bei der Aufsicht ab. # - Lösen Sie die folgenden Aufgaben mittels ausführbarem Code in R (aktuelle Version) # und ergänzen Sie bei Bedarf Ihre Programmierung um aussagekräftige Kommentare. # - Interpretationen, etc. sollen ebenfalls als Kommentar angegeben werden. # - Falls Teile Ihres Programms nicht funktionieren, geben Sie ebenfalls in Kommentarform # an, was Sie hier genau machen wollten. ################################################# # Name: # Vorname: # Matrikelnummer: ################################################# ################################################# # Aufgabe 1 (26 Punkte): ################################################# # a) (5 Punkte) Laden Sie den Datensatz SwissLabor (Groß- und Kleinschreibung beachten) # aus dem AER-Paket und sorgen Sie dafür, dass man auf die Spalten direkt durch # Eingabe des Spaltennamens zugreifen kann. # Wieviele Personen sind im Datensatz enthalten? # Wieviele davon sind Schweizer Staatsangehörige? # Wieviele Schweizer Franken beträgt das Nebenerwerbseinkommen im Durchschnitt? # [Hinweis: Eine Erläuterung der Variablen finden Sie in der Hilfe zum Datensatz.] # b) (3 Punkte) Generieren Sie nun einen Datensatz SL, der nur die Variablen # income, age, education und foreign enthält. # Geben Sie eine Korrelationsmatrix dieser Variablen aus (ohne foreign) und # interpretieren Sie diese kurz. # c) (4 Punkte) Regressieren Sie income auf die übrigen Variablen in SL und speichern Sie # das Regressionsobjekt als reg1 ab. # Entfernen Sie nun alle Regressoren aus dem Modell, die keinen signifikanten Einfluss # auf income ausüben (Signifikanzniveau: 5%) und speichern Sie das reduzierte Modell # als reg2 ab. # d) (5 Punkte) Welches der Modelle ist vorzuziehen, wenn man das angepasste # Bestimmtheitsmaß als Kriterium verwendet? # Welches gemäß dem Akaike Kriterium? # Für welches der Modelle würden Sie sich entscheiden? # e) (6 Punkte) Stellen Sie den Zusammenhang zwischen education und income in einem # Streudiagramm dar. Verdeutlichen Sie farblich, ob es sich jeweils um einen Schweizer # oder Ausländer handelt. Ergänzen Sie den Plot um eine Legende und achten Sie # auf eine ordentliche Achsenbeschriftung. # g) (3 Punkte) Interpretieren Sie die wesentlichen Ergebnisse der vorigen Teilaufgaben. ################################################# # Aufgabe 2 (11 Punkte): ################################################# # a) (6 Punkte) In dieser Aufgabe sollen Sie eine Funktion f1 schreiben, der man # als Argument eine beliebige Variable übergibt. Die Funktion soll überprüfen, # ob es sich um eine stetige Variable (keinen Faktor) handelt und, falls es # sich um eine stetige Variable handelt, deren Dezile (alle 10%-Quantile) ausgeben. # b) (5 Punkte) Wenden Sie nun die Funktion aus der vorigen Teilaufgabe auf die # Variablen im Datensatz SwissLabor an (ohne participation und foreign). # [Falls Sie in der vorigen Teilaufgabe keine Funktion erhalten haben, verwenden # Sie nun die summary-Funktion.] ################################################# # Aufgabe 3 (23 Punkte): ################################################# # Betrachten Sie den folgenden datengenerierenden Prozess für y: # # x ist Chi^2-verteilt mit 2 Freiheitsgraden # u ist normalverteilt mit Erwartungswert 0 und Standardabweichung sigma # y = beta*x+u # a) (8 Punkte) Generieren Sie eine Funktion, die # bei Angabe von beta, sigma und der Stichprobengröße n # einen Datensatz mit den Variablen x und y erzeugt. # b) (8 Punkte) Simulieren Sie für beta=1, sigma=1, n=7 # Reps = 500 Realisationen des OLS Schätzer für beta (ohne Konstante) # und speichern Sie diese in den Vektor beta_dach. # [Falls hier keine Lösung: ziehen Sie beta_dach aus einer beliebigen Verteilung.] # c) (1 Punkt) Berechnen Sie Mittelwert und Standardabweichung von beta_dach # (mu_beta_dach, sigma_beta_dach). # d) (6 Punkte) Plotten sie das Histogramm der Schätzungen (probability=TRUE) # und fügen Sie die Dichtefunktion der Normalverteilung als Linie hinzu # (Erwartungswert mu_beta_dach und Varianz sigma_beta_dach). # Geben Sie der Graphik einen Titel und Achsenbeschriftungen.