######################################################
#                                                    #
# Universität Regensburg - Lehrstuhl für Ökonometrie #
#                                                    #
#      Kursprüfung im Fach: Programmieren mit R      #
#                                                    #
#              Wintersemester 2010/2011              #
#                                                    #
#                  Datum: 08.02.2011                 #
#                                                    #
######################################################

#################################################
# Bearbeitungshinweise:
#################################################
#
# - Die Bearbeitungszeit beträgt 60 Minuten.

# - Die Klausur besteht aus drei Aufgaben (60 Punkte), die alle bearbeitet werden sollen.

# Aufgabe 1: 30 Punkte
# Aufgabe 2: 12 Punkte
# Aufgabe 3: 18 Punkte

# - Zugelassene Hilfsmittel sind das Kursmaterial (gedruckt oder digital) sowie R-bezogene
#   Internetseiten.

# - Benennen Sie diese Datei zunächst um in: RKlausur1011_Nachname_Vorname.R (IHR Name...)

# - Senden Sie am Ende der Bearbeitungszeit ihren R-Code an:
#   roland.weigand@wiwi.uni-regensburg.de

# - Drucken Sie nach dem Versenden Ihren Code aus und geben Sie ihn bei der Aufsicht ab.

# - Lösen Sie die folgenden Aufgaben mittels ausführbarem Code in R (aktuelle Version)
#   und ergänzen Sie bei Bedarf Ihre Programmierung um aussagekräftige Kommentare.

# - Interpretationen, etc. sollen ebenfalls als Kommentar angegeben werden.

# - Falls Teile Ihres Programms nicht funktionieren, geben Sie ebenfalls in Kommentarform
#   an, was Sie hier genau machen wollten.

#################################################
# Name:
# Vorname:
# Matrikelnummer:
#################################################

#################################################
# Aufgabe 1 (30 Punkte):
#################################################

# a) (5 Punkte) Speichern Sie den Datensatz "Growth.txt" (siehe Kursseite)
#    auf die Festplatte und laden Sie ihn in R.



# NUR, FALLS DAS EINLESEN NICHT KLAPPT: Aktivieren Sie die folgende Zeile:
load(url("http://www-wiwi.uni-regensburg.de/images/institute/vwl/tschernig/lehre/Growth.RData"))
# Der Datensatz heißt hier "GrowthData".

# b) (1 Punkt)  Lassen Sie sich zentrale deskriptive Statistiken (Minimum,
#    Maximum, Mittelwert, Quartile) ausgeben und kopieren Sie das Ergebnis in die Angabe.



# c) (2 Punkte) Löschen Sie alle Beobachtungen (Zeilen) mit fehlenden Werten aus
#    dem Datensatz. (Überschreiben Sie den alten!) Wie viele Beobachtungen liegen
#    jetzt vor?


# d) (4 Punkte) Erzeugen Sie eine Matrix, die die Beobachtungen für ganzzahlige und
#    stetige Variablen (numeric+integer) enthält. Berechnen Sie in EINER Befehlszeile die
#    Standardabweichungen dieser Variablen.


# e) (1 Punkt) Machen Sie die Variablen des Datensatzes für den direkten Zugriff via
#    Variablenname verfügbar.


# f) (4 Punkte) Erzeugen Sie einen "character"-Vektor "d_lit60",
#    der die Ausprägung "high" annimmt, falls literacy60 > 50 und "low" sonst.
#    Modifizieren Sie den Vektor dann so, dass er als Dummy-Variable in Regressionen
#    einbezogen werden kann.


# g) (4 Punkte) Erzeugen Sie einen Scatterplot mit log(gdp60) auf der x-Achse und
#    gdpgrowth auf der y-Achse, wobei die OECD-Länder und nicht-OECD
#    Länder in unterschiedlichen Farben erscheinen sollen.


# j) (3 Punkte) Schätzen Sie ein lineares Regressionsmodell, wobei gdpgrowth erklärt wird
#    durch die Regressoren log(gdp60), popgrowth, invest und school (mit Konstante).
#    Lassen Sie sich den Schätz-Output ausgeben.


# k) (2 Punkte) Schätzen Sie nun ein Modell mit log(gdp60) als einzigem Regressor (plus Konstante).
#    Vergleichen Sie die beiden Modelle mithilfe des AIC-Kriteriums.


# l) (2 Punkte) Testen Sie die Hypothese, dass ein um 1Prozentpunkt stärkeres
#    Bevölkerungswachstum zu einem um 1Prozentpunkt höheres BIP-Wachstum führt
#    (H0: beta_popgrowth = 1)


# m) (2 Punkte) Berechnen Sie Residuen und gefittete Werte des geschätzten Modells
#    und berechnen Sie die Korrelation zwischen beiden Größen



#################################################
# Aufgabe 2 (12 Punkte):
#################################################


# a) (3 Punkte) Erzeugen Sie eine Funktion "ols",
#    die bei Übergabe eines Regressandenvektors y und einer Regressormatrix X
#    den OLS-Schätzer der Koeffizienten beta für das Modell y=X%*%beta+u berechnet.


# b) (5 Punkte) Modifizieren Sie die Funktion, so dass sie außer dem Koeffizientenschätzer auch
#    den Standardfehler der Regression (geschätzte Standardabweichung der Residuen) ausgibt.


# c) (4 Punkte) Prüfen Sie die Funktion mit beliebigen simulierten Daten und vergleichen Sie
#    das Ergebnis mit dem der lm-Funktion.




#################################################
# Aufgabe 3 (18 Punkte):
#################################################

# a) (4 Punkte) Kommentieren Sie alle Zeilen des folgenden Codes.

n <- 45
x <- rt(n,df=3)
t_statistic <- mean(x)/(sd(x)/sqrt(n))
abs(t_statistic) > qt(0.975, df=n-1)

# b) (6 Punkte) Erzeugen Sie auf die gleiche Weise Reps=1000 simulierte Teststatistiken.


# c) (2 Punkte) Plotten Sie ein Histogramm (probability=TRUE) der simulierten Teststatistiken.


# d) (3 Punkte) Zeichnen Sie die Dichtefunktion der Standardnormalverteilung mit in die Graphik.


# e) (3 Punkte) Wie groß ist der Anteil der H0-Ablehnungen in der Simulation?