######################################################
#                                                    #
# Universität Regensburg - Lehrstuhl für Ökonometrie #
#                                                    #
#      Kursprüfung im Fach: Programmieren mit R      #
#                                                    #
#              Wintersemester 2009/2010              #
#                                                    #
#                  Datum: 09.02.2010                 #
#                                                    #
######################################################
 
#################################################
# Bearbeitungshinweise:
#################################################
#
# - Die Bearbeitungszeit beträgt 60 Minuten.
# - Die Klausur besteht aus drei Aufgaben (60 Punkte), die alle bearbeitet werden müssen.
# - Zugelassene Hilfsmittel sind das Kursmaterial (gedruckt oder digital) sowie R-bezogene 
#   Internetseiten.
# - Benennen Sie diese Datei zunächst um in: 14_Exam_0910_Nachname_Vorname.R
#   und geben Sie ihren Namen an.
# - Senden Sie am Ende der Bearbeitungszeit ihren R-Code an:
#   roland.weigand@wiwi.uni-regensburg.de
# - Drucken Sie nach dem Versenden Ihren Code aus und geben Sie Ihn bei der Aufsicht ab.
# - Lösen Sie die folgenden Aufgaben mittels ausführbarem Code in R (aktuelle Version) 
#   und ergänzen Sie bei Bedarf Ihre Programmierung um aussagekräftige Kommentare.
# - Interpretationen, etc. sollen ebenfalls als Kommentar angegeben werden.
# - Falls Teile Ihres Programms nicht funktionieren, geben Sie ebenfalls in Kommentarform 
#   an, was Sie hier genau machen wollten.

#################################################
# Name:
# Vorname:
# Matrikelnummer:
#################################################

#################################################
# Aufgabe 1 (26 Punkte):
#################################################

# a) (5 Punkte) Laden Sie den Datensatz SwissLabor (Groß- und Kleinschreibung beachten)
#    aus dem AER-Paket und sorgen Sie dafür, dass man auf die Spalten direkt durch 
#    Eingabe des Spaltennamens zugreifen kann.
#    Wieviele Personen sind im Datensatz enthalten?
#    Wieviele davon sind Schweizer Staatsangehörige?
#    Wieviele Schweizer Franken beträgt das Nebenerwerbseinkommen im Durchschnitt?
#    [Hinweis: Eine Erläuterung der Variablen finden Sie in der Hilfe zum Datensatz.]



# b) (3 Punkte) Generieren Sie nun einen Datensatz SL, der nur die Variablen
#    income, age, education und foreign enthält.
#    Geben Sie eine Korrelationsmatrix dieser Variablen aus (ohne foreign) und 
#    interpretieren Sie diese kurz.



# c) (4 Punkte) Regressieren Sie income auf die übrigen Variablen in SL und speichern Sie
#    das Regressionsobjekt als reg1 ab.
#    Entfernen Sie nun alle Regressoren aus dem Modell, die keinen signifikanten Einfluss
#    auf income ausüben (Signifikanzniveau: 5%) und speichern Sie das reduzierte Modell 
#    als reg2 ab.



# d) (5 Punkte) Welches der Modelle ist vorzuziehen, wenn man das angepasste 
#    Bestimmtheitsmaß als Kriterium verwendet?
#    Welches gemäß dem Akaike Kriterium?
#    Für welches der Modelle würden Sie sich entscheiden?



# e) (6 Punkte) Stellen Sie den Zusammenhang zwischen education und income in einem
#    Streudiagramm dar. Verdeutlichen Sie farblich, ob es sich jeweils um einen Schweizer
#    oder Ausländer handelt. Ergänzen Sie den Plot um eine Legende und achten Sie 
#    auf eine ordentliche Achsenbeschriftung.



# g) (3 Punkte) Interpretieren Sie die wesentlichen Ergebnisse der vorigen Teilaufgaben.





#################################################
# Aufgabe 2 (11 Punkte):
#################################################

# a) (6 Punkte) In dieser Aufgabe sollen Sie eine Funktion f1 schreiben, der man 
#    als Argument eine beliebige Variable übergibt. Die Funktion soll überprüfen, 
#    ob es sich um eine stetige Variable (keinen Faktor) handelt und, falls es 
#    sich um eine stetige Variable handelt, deren Dezile (alle 10%-Quantile) ausgeben.



# b) (5 Punkte) Wenden Sie nun die Funktion aus der vorigen Teilaufgabe auf die 
#    Variablen im Datensatz SwissLabor an (ohne participation und foreign).
#    [Falls Sie in der vorigen Teilaufgabe keine Funktion erhalten haben, verwenden 
#    Sie nun die summary-Funktion.]





#################################################
# Aufgabe 3 (23 Punkte):
#################################################

# Betrachten Sie den folgenden datengenerierenden Prozess für y:
#
# x ist Chi^2-verteilt mit 2 Freiheitsgraden
# u ist normalverteilt mit Erwartungswert 0 und Standardabweichung sigma
# y = beta*x+u

# a) (8 Punkte) Generieren Sie eine Funktion, die
#    bei Angabe von beta, sigma und der Stichprobengröße n
#    einen Datensatz mit den Variablen x und y erzeugt.



# b) (8 Punkte) Simulieren Sie für beta=1, sigma=1, n=7
#    Reps = 500 Realisationen des OLS Schätzer für beta (ohne Konstante)
#    und speichern Sie diese in den Vektor beta_dach.
#    [Falls hier keine Lösung: ziehen Sie beta_dach aus einer beliebigen Verteilung.]



# c) (1 Punkt) Berechnen Sie Mittelwert und Standardabweichung von beta_dach
#    (mu_beta_dach, sigma_beta_dach).



# d) (6 Punkte) Plotten sie das Histogramm der Schätzungen (probability=TRUE)
#    und fügen Sie die Dichtefunktion der Normalverteilung als Linie hinzu
#    (Erwartungswert mu_beta_dach und Varianz sigma_beta_dach).
#    Geben Sie der Graphik einen Titel und Achsenbeschriftungen.