###################################################### # # # Universität Regensburg - Lehrstuhl für Ökonometrie # # # # Kursprüfung im Fach: Programmieren mit R # # # # Wintersemester 2010/2011 # # # # Datum: 08.02.2011 # # # ###################################################### ################################################# # Bearbeitungshinweise: ################################################# # # - Die Bearbeitungszeit beträgt 60 Minuten. # - Die Klausur besteht aus drei Aufgaben (60 Punkte), die alle bearbeitet werden sollen. # Aufgabe 1: 30 Punkte # Aufgabe 2: 12 Punkte # Aufgabe 3: 18 Punkte # - Zugelassene Hilfsmittel sind das Kursmaterial (gedruckt oder digital) sowie R-bezogene # Internetseiten. # - Benennen Sie diese Datei zunächst um in: RKlausur1011_Nachname_Vorname.R (IHR Name...) # - Senden Sie am Ende der Bearbeitungszeit ihren R-Code an: # roland.weigand@wiwi.uni-regensburg.de # - Drucken Sie nach dem Versenden Ihren Code aus und geben Sie ihn bei der Aufsicht ab. # - Lösen Sie die folgenden Aufgaben mittels ausführbarem Code in R (aktuelle Version) # und ergänzen Sie bei Bedarf Ihre Programmierung um aussagekräftige Kommentare. # - Interpretationen, etc. sollen ebenfalls als Kommentar angegeben werden. # - Falls Teile Ihres Programms nicht funktionieren, geben Sie ebenfalls in Kommentarform # an, was Sie hier genau machen wollten. ################################################# # Name: # Vorname: # Matrikelnummer: ################################################# ################################################# # Aufgabe 1 (30 Punkte): ################################################# # a) (5 Punkte) Speichern Sie den Datensatz "Growth.txt" (siehe Kursseite) # auf die Festplatte und laden Sie ihn in R. # NUR, FALLS DAS EINLESEN NICHT KLAPPT: Aktivieren Sie die folgende Zeile: load(url("http://www-wiwi.uni-regensburg.de/images/institute/vwl/tschernig/lehre/Growth.RData")) # Der Datensatz heißt hier "GrowthData". # b) (1 Punkt) Lassen Sie sich zentrale deskriptive Statistiken (Minimum, # Maximum, Mittelwert, Quartile) ausgeben und kopieren Sie das Ergebnis in die Angabe. # c) (2 Punkte) Löschen Sie alle Beobachtungen (Zeilen) mit fehlenden Werten aus # dem Datensatz. (Überschreiben Sie den alten!) Wie viele Beobachtungen liegen # jetzt vor? # d) (4 Punkte) Erzeugen Sie eine Matrix, die die Beobachtungen für ganzzahlige und # stetige Variablen (numeric+integer) enthält. Berechnen Sie in EINER Befehlszeile die # Standardabweichungen dieser Variablen. # e) (1 Punkt) Machen Sie die Variablen des Datensatzes für den direkten Zugriff via # Variablenname verfügbar. # f) (4 Punkte) Erzeugen Sie einen "character"-Vektor "d_lit60", # der die Ausprägung "high" annimmt, falls literacy60 > 50 und "low" sonst. # Modifizieren Sie den Vektor dann so, dass er als Dummy-Variable in Regressionen # einbezogen werden kann. # g) (4 Punkte) Erzeugen Sie einen Scatterplot mit log(gdp60) auf der x-Achse und # gdpgrowth auf der y-Achse, wobei die OECD-Länder und nicht-OECD # Länder in unterschiedlichen Farben erscheinen sollen. # j) (3 Punkte) Schätzen Sie ein lineares Regressionsmodell, wobei gdpgrowth erklärt wird # durch die Regressoren log(gdp60), popgrowth, invest und school (mit Konstante). # Lassen Sie sich den Schätz-Output ausgeben. # k) (2 Punkte) Schätzen Sie nun ein Modell mit log(gdp60) als einzigem Regressor (plus Konstante). # Vergleichen Sie die beiden Modelle mithilfe des AIC-Kriteriums. # l) (2 Punkte) Testen Sie die Hypothese, dass ein um 1Prozentpunkt stärkeres # Bevölkerungswachstum zu einem um 1Prozentpunkt höheres BIP-Wachstum führt # (H0: beta_popgrowth = 1) # m) (2 Punkte) Berechnen Sie Residuen und gefittete Werte des geschätzten Modells # und berechnen Sie die Korrelation zwischen beiden Größen ################################################# # Aufgabe 2 (12 Punkte): ################################################# # a) (3 Punkte) Erzeugen Sie eine Funktion "ols", # die bei Übergabe eines Regressandenvektors y und einer Regressormatrix X # den OLS-Schätzer der Koeffizienten beta für das Modell y=X%*%beta+u berechnet. # b) (5 Punkte) Modifizieren Sie die Funktion, so dass sie außer dem Koeffizientenschätzer auch # den Standardfehler der Regression (geschätzte Standardabweichung der Residuen) ausgibt. # c) (4 Punkte) Prüfen Sie die Funktion mit beliebigen simulierten Daten und vergleichen Sie # das Ergebnis mit dem der lm-Funktion. ################################################# # Aufgabe 3 (18 Punkte): ################################################# # a) (4 Punkte) Kommentieren Sie alle Zeilen des folgenden Codes. n <- 45 x <- rt(n,df=3) t_statistic <- mean(x)/(sd(x)/sqrt(n)) abs(t_statistic) > qt(0.975, df=n-1) # b) (6 Punkte) Erzeugen Sie auf die gleiche Weise Reps=1000 simulierte Teststatistiken. # c) (2 Punkte) Plotten Sie ein Histogramm (probability=TRUE) der simulierten Teststatistiken. # d) (3 Punkte) Zeichnen Sie die Dichtefunktion der Standardnormalverteilung mit in die Graphik. # e) (3 Punkte) Wie groß ist der Anteil der H0-Ablehnungen in der Simulation?