Loading [MathJax]/jax/output/HTML-CSS/jax.js
(Danke an Denise, May und Sophia fürs Korrekturlesen)

Das hier ist eine semi-interaktive Formelsammlung über alle wichtigen Formeln der Statistik 2 Vorlesung. Zu den meisten Formeln und Tests sind entsprechende R Beispiele zur Berechnung beigefügt, diese am besten per Copy-Paste in RStudio einfügen und eigene Werte einsetzen. Alternativ kann das ganze Notebook in RStudio ausgeführt werden: rechts oben auf Code -> Download Rmd klicken und die heruntergeladene Datei in RStudio öffnen.

Download für Offline-Nutzung: Rechtsklick irgendwo auf die Seite -> Speichern unter -> Website, nur HTML (wichtig). Anschließend das gespeicherte Dokument einfach mit dem Browser öffnen.

Falls zu unübersichtlich: rechts oben auf Code -> Hide all Code klicken. Anschließend beim entsprechenden Abschnitt rechts auf Code klicken, um die passenden wieder einzublenden.

Folgende Pakete werden zum Ausführen der Codebeispiele benötigt:

install.packages(c("DescTools", "effsize", "MBESS", "pwr", "multcomp", "forcats", "car"))
Zurück zur Homepage

Inhaltsverzeichnis

Mehrere Hypothesentests

Sonderfall: Mehrere nicht zusammengesetzte Hypothesentests mit unterschiedlichen Hypothesen niedrige FDR sicherstellen, aber keine Korrektur

Zusammengesetzte Hypothesentests

Zusammengesetzte Hypothese mit oder

H0:H01 und H02 und  und H0NH1:H11 oder H12 oder  oder H1N

Zusammengesetzte Hypothese mit und

H0:H01 oder H02 oder  oder H0NH1:H11 und H12 und  und H1N

Korrektur des Signifikanzniveaus

Grundsätzlich gilt: Nur zusammengesetzte Hypothesen mit oder müssen korrigiert werden.

α: Comparison Wise Error Rate (einzelne Tests)

α: Family Wise Error Rate (zusammengesetzter Test)

  • Wahrscheinlichkeit, bei einer Gruppe von HT mindestens einen Fehler erster Art zu machen

α=1(1α)N

alpha = 0.005
N = 5

1-(1-alpha)^N
Sidak

Für unabhängige Hypothesentests

α=1N1α

fwer = 0.005
N = 5

1-(1-fwer)^(1 / N)
Bonferroni

Auch für abhängige Hypothesentests

α=αN αα

fwer = 0.005
N = 5

fwer/N

Alternativ: p-Werte korrigieren

pjαNNpjα

p_werte = c(0.003, 0.004)
p.adjust(p_werte, method = 'bonferroni')
Tukey

Auch für abhängige Hypothesentests, jedoch nur in varianzanalytischen Modellen und Regressionsmodellen möglich. Hier höhere Power als Bonferroni.

FWER für zusammengesetzte Hypothesen mit “und”

α=αk(1β)nk

# Anzahl Studien
n = 3

# Anzahl Studien, in denen H0 korrekt ist (n*Basisrate)
k = 1

alpha = 0.05
power = 0.8


alpha**k*(power)**(n-k)

Metaanalyse (mit festen Effekten)

Mehrere Hypothesentests aus verschiedenen Stichproben mit identischen Hypothesen

Ausgangslage: N Studien schätzen Effektstärke θ mit Funktion ˆθj, Annahme: ˆθjindN(θ,σ2j)

Schätzfunktion:

ˆθ=1Nj=1WjNj=1Wjˆθj

weights = c(0.5, 0.5, 0.8)
thetas = c(-0.2, 0.5, 0.4)
  
1/(sum(weights)) * sum(weights * thetas)

Wj=1ˆσ2j

varj = 2.5

1/varj

ˆσ2j wert =n1j+n2jn1jn2j+d2j2(n1j+n2j)

n1=20
n2=20
d = 1.0

((n1+n2)/(n1*n2))+(d*d/(2*(n1+n2)))

dj=tjn1j+n2jn1jn2j

n1=20
n2=20
t = 3.2

t*sqrt((n1+n2)/(n1*n2))

dj=ˉx1jˉx2jspool ,j

data1 = c(0,0,-1)
data2 = c(2,0,1)
n1 = length(data1)
n2 = length(data2)
x1_quer = mean(data1)
x2_quer = mean(data2)
xdiff_quer = x1_quer-x2_quer
s2_1 = var(data1)
s2_2 = var(data2)
s2pool = ((n1-1)*s2_1+(n2-1)*s2_2)/(n1+n2-2)
xdiff_quer/sqrt(s2pool)

Intervall mit approximativem Konfidenzniveau von 1α:

I(ˆθ1,ˆθ2,,ˆθN)=[ˆθz1α21Nj=1Wj,ˆθ+z1α21Nj=1Wj]

conf.level = 0.95

weights = c(0.5, 0.5, 0.8)
thetas = c(-0.2, 0.5, 0.4)
theta_est = 1/(sum(weights)) * sum(weights * thetas)


c = qnorm(1-((1-conf.level)/2))/sqrt(sum(weights))
c(theta_est - c, theta_est + c)

Hypothesentest Metaanalyse:

Hypothesen:

H0:δ0H1:δ>0

Teststatistik:

T=(ˆθθ0)Nj=1WjaN(0,1)

alpha = 0.005
theta0 = 0 

weights = c(0.5, 0.5, 0.8)
thetas = c(-0.2, 0.5, 0.4)
theta_est = 1/(sum(weights)) * sum(weights * thetas)


t = (theta_est-theta0) * sqrt(sum(weights))
t

# Drei moegliche Hypothesentests
print("less/linksgerichtet:")
paste("Krit. Bereich: ] -INF;", qnorm(alpha),"]", sep="")
p = pnorm(t)
p

if(p <= alpha) print("H1 annehmen") else print("H0 annehmen")

print("greater/rechtsgerichtet:")
paste("Krit. Bereich: [", qnorm(1-alpha),";INF[", sep="")
p = 1-pnorm(t)
p

if(p <= alpha) print("H1 annehmen") else print("H0 annehmen")

print("two.sided/ungerichtet:")
paste("Krit. Bereich: ]-INF;", qnorm(alpha/2),"] [", qnorm(1-(alpha/2)), "; INF[", sep="")
p = if(t <= 0) 2*pnorm(t) else 2*pnorm(-t)
p

if(p <= alpha) print("H1 annehmen") else print("H0 annehmen")

Varianzanalyse (ANalysis Of VAriance)

Einfaktorielles statistisches Modell

Modellgleichung m-fach gestufter Faktor (erste Darstellungsform):

Yij=μj+εij mit j=1,,m und i=1,,nj

Yij ind N(μj,σ2) bzw. εij iid N(0,σ2)

Modellgleichung m-fach gestufter Faktor (zweite Darstellungsform): Yij=μ+αj+εij wobei αj=μjμ mit j=1,,m und μ=1mmj=1μj

Yij ind N(μ+αj,σ2) bzw. εij iid N(0,σ2)

Schätzfunktionen:

μj ˆμj=ˉYj=1njni=1Yij

αj ˆαj=ˉYjˉY

σ2 (falls n1=n2==nm=n)

ˆσ2=S2pool =1m(n1)(mj=1ni=1(YijˉYj)2)

Omnibustest

Wichtig: nur ein Test, deshalb keine Korrektur des Signifikanznivaus nötig

Erste Darstellungsform:

H0:μ1=μ2==μk=μmH1:μjμk für mindestens ein Paar j,k mit jk Zweite Darstellungsform:

H0:αj=0 für alle jH1:αj0 für mindestens ein j

Quadratsummen

Quadratsumme innerhalb:

QSinn=ni=1mj=1(YijˉYj)2

Quadratsumme zwischen:

QSzw=mj=1n(ˉYjˉY)2 ˉY=1m1nmj=1ni=1Yij

Quadratsumme gesamt:

QSges=mj=1ni=1(YijˉY)2 QSges=QSzw+QSinn

uv = c("A","A","A","B","B","B","C","C","C") 
av = c(1,2,3,4,5,6,7,8,9)
data = data.frame(uv,av)

qs_inn = sum(
  sapply(unique(uv),
         function(group) sum((data[data$uv==group,]$av - mean(data[data$uv==group,]$av))^2)
  )
) 

qs_zw = sum( 
  sapply(unique(uv),
         function(group) nrow(data[data$uv==group,])*(mean(data[data$uv==group,]$av) - mean(data$av))^2
  )
)

qs_inn + qs_zw

Mittlere Quadratsumme zwischen:

MQSzw=QSzwdfzw dfzw=m1 Mittlere Quadratsumme innerhalb:

MQSinn=QSinndfinn dfinn =m(n1)

MQSinn=S2pool  Weitere Eigenschaften:

E(MQSinn)=E(S2pool )=σ2

E(MQSzw)=σ2+mj=1nα2jdfzw=σ2+mj=1n(μjμ)2m1

Teststatistik Omnibustest

T=QSzw/dfzwQSinn/dfinn=MQSzwMQSinnH0F(dfzw,dfinn)

F-Verteilung

XF(v1,v2) E(X)=v2v22

df1 = 2
df2 = 10
pf(q=2, df1, df2) # Verteilungsfunktion
qf(p=0.25, df1, df2) # Quantile
Kritischer Bereich Omnibustest

KT=[krechts,[

R Code
uv = c("A","A","A","B","B","B","C","C","C") 
av = c(1,2,3,4,5,6,7,8,9)
alpha = 0.005

data = data.frame(uv,av)

# Omnibustest (unkorrigiert) von Hand - Wenn nur konkrete Werte vorliegen und keine Datenvektoren, die folgenden Variablen durch eigene Werte ersetzen

m = length(unique(uv))
n = nrow(data[data$uv==uv[[1]],]) # balanciertes design

df_zw = m-1
df_inn = m*(n-1) 

qs_inn = sum(
  sapply(unique(uv),
         function(group) sum((data[data$uv==group,]$av - mean(data[data$uv==group,]$av))^2)
  )
) 

qs_zw = sum( 
  sapply(unique(uv),
         function(group) nrow(data[data$uv==group,])*(mean(data[data$uv==group,]$av) - mean(data$av))^2
  )
)

paste("QSges: ", qs_inn + qs_zw, sep="")

mqs_in = qs_inn / df_inn
mqs_zw = (qs_zw) / df_zw

paste("Krit. Bereich: [", qf(1-alpha, df1=df_zw, df2=df_inn),";INF[", sep="")

t = mqs_zw/mqs_in
t

p = 1-pf(mqs_zw/mqs_in, df1 = df_zw, df2 = df_inn)
p

if(p <= alpha) print("H1 annehmen") else print("H0 annehmen")


# Omnibustest mit R Funktion 1 (unkorrigiert)
fit = aov(av~uv, data=data)
summary(fit)

# Omnibustest mit R Funktion 2 (korrigiert - wenn Varianzgleichheit verletzt)
oneway.test(av~uv, data) 
# Welcher Wert entspricht welchem output von R?

uv = c("A","A","A","B","B","B","C","C","C") 
av = c(1,2,3,4,5,6,7,8,9)
data = data.frame(uv,av)

fit <- aov(av ~ uv, data=data)
#str(summary(fit))

df_zw = summary(fit)[[1]]$'Df'[[1]]
df_inn = summary(fit)[[1]]$'Df'[[2]]

qs_zw = summary(fit)[[1]]$'Sum Sq'[[1]]
qs_inn = summary(fit)[[1]]$'Sum Sq'[[2]]

mqs_zw = summary(fit)[[1]]$'Mean Sq'[[1]]
mqs_inn = summary(fit)[[1]]$'Mean Sq'[[2]]

f = summary(fit)[[1]]$'F value'[[1]]

p = summary(fit)[[1]]$'Pr(>F)'[[1]]

Effektgröße im einfaktoriellen varianzanalytischen Modell

Anteil an der Gesamtvarianz der AV in der Population, der durch die UV (bzw. durch den Faktor) erklärt werden kann.

η2=σ2zwσ2ges

ˆσ2zw=1mnQSzw

ˆσ2ges=1mnQSges

Schätzfunktion:

ˆη2=QSzwQSges 

uv = c("A","A","A","B","B","B","C","C","C") 
av = c(1,2,3,4,5,6,7,8,9)

data = data.frame(uv,av)

# Berechnung Eta von Hand - Wenn nur konkrete Werte vorliegen und keine Datenvektoren, die folgenden Variablen durch eigene Werte ersetzen

n = length(unique(uv))
m = nrow(data[data$uv==uv[[1]],]) # balanciertes design

df_zw = n-1
df_inn = n*(m-1) 

qs_inn = sum(
  sapply(unique(uv),
         function(group) sum((data[data$uv==group,]$av - mean(data[data$uv==group,]$av))^2)
  )
) 

qs_zw = sum( 
  sapply(unique(uv),
         function(group) nrow(data[data$uv==group,])*(mean(data[data$uv==group,]$av) - mean(data$av))^2
  )
)

qs_zw/(qs_inn + qs_zw)


# Berechnung Eta mit R Funktion
library(DescTools)
fit = aov(av~uv, data=data)
EtaSq(fit)

# Berchnung Konfidenzintevall für Eta
library(MBESS)
ci.pvaf(summary(fit)[[1]][["F value"]][[1]] ,df.1 = df_zw, df.2 = df_inn, N=nrow(data), conf.level = 0.95)

Die statistische Hypothese des Omnibus-Tests könnte alternativ so geschrieben werden:

H0:η2=0H1:η2>0

Stichprobenplanung für Omnibustest

R funktion nimmt η2 nicht direkt, wir müssen umrechnen: f=η21η2

library(pwr)

eta = 0.05
alpha = 0.005
power = 0.8
factors=3

f = sqrt(eta/(1-eta))

pwr.anova.test(k=factors, f=f, power=power, sig.level=alpha)

Weitere statistische Verfahren im einfaktoriellen varianzanalytischen Modell - Kontrastmatrix

Ausgangspunkt:

Formulierung von Parameterbeziehungen mit mj=1ajμj

Diese Parameterbeziehng wird “Kontrast” genannt, falls die Konstanten folgende Eigenschaft haben:

mj=1aj=0

Schätzfunktion für μjμk

ˉYjˉYk Ein Konfidenzintervall mit Konfidenzniveau 1α für μjμk

[(ˉYjˉYk)t1α2S2pooln+S2pooln,(ˉYjˉYk)+t1α2S2pooln+S2pool n] tt(m(n1)) S2pool =MQSinn 

Teststatistik für den Hypothesentest bezüglich μjμk

T=(ˉYjˉYk)μ0S2pool n+S2pool nH0t(m(n1))

R Code Konfidenzintervall, ungerichteter Hypothesentest
library(multcomp)
uv = c("A","A","A","B","B","B","C","C","C") 
av = c(1,2,3,4,5,6,7,8,9)

data = data.frame(uv,av, stringsAsFactors = TRUE)

fit_aov <- aov(av ~ uv, data = data)

# "Nullhypothesen"
hyps = c(
  "A - B == 0",
  "A - C == 0"
)


# Kontrast Matrix
contrasts <- mcp(uv = hyps)
fit <- glht(fit_aov, linfct = contrasts)

confint(fit, level = 0.95, calpha = univariate_calpha())
# "single-step": Tukey Methode, univariate(): Keine Korrektur, "bonferroni": Bonferroni
summary(fit, test = adjusted(type = "single-step")) 
R Code gerichteter Hypothesentest
library(multcomp)
uv = c("A","A","A","B","B","B","C","C","C") 
av = c(1,2,3,4,5,6,7,8,9)

data = data.frame(uv,av, stringsAsFactors = TRUE)

fit_aov <- aov(av ~ uv, data = data)

# Nullhypothesen
hyps = c(
  "A - B <= 0",
  "A - C <= 0"
)


# Kontrast Matrix
contrasts <- mcp(uv = hyps)
fit <- glht(fit_aov, linfct = contrasts)

# "single-step": Tukey Methode, univariate(): Keine Korrektur, "bonferroni": Bonferroni
summary(fit, test = adjusted(type = "single-step")) 

Zweifaktorielles statistisches Modell

Modellgleichung m-fach gestufter Faktor (erste Darstellungsform):

Yijk=μjk+εijk mit i=1,,njk;j=1,,r und k=1,,c YijkindN(μjk,σ2)bzw.εijkiidN(0,σ2) Mittlere AV über bestimmte Populationen:

μ=1rcrj=1ck=1μjkμj.=1cck=1μjkμk=1rrj=1μjk Modellgleichung m-fach gestufter Faktor (zweite Darstellungsform):

Yijk=μ+αj+βk+γjk+εijk mit i=1,,njk;j=1,,r und k=1,,c Yijk ind N(μ+αj+βk+γjk,σ2) bzw. εijk iid N(0,σ2)

  • αj=μj.μ Effekt der Kategorie j des Faktors A auf die AV
  • βk=μ.kμ Effekt der Kategorie k des Faktors B auf die AV
  • γjk=μjkμαjβk Interaktionseffekt bezogen auf die Population jk
Schätzfunktionen für Parameter

Für μjk: ˆμjk=ˉYjk=1nni=1Yijk

Für σ2: ˆσ2=S2pool =1rc(n1)(rj=1ck=1ni=1(YijkˉYjk)2)

Omnibustest

Omnibustest für die Interaktion:

  • H0:γjk=0 für alle Kombinationen jk

  • H1:γjk0 für mindestens eine Kombination jk

Omnibustest für den Faktor A (UV 1):

  • H0:αj=0 für alle j
  • H1:αj0 für mindestens ein j

Omnibustest für den Faktor B (UV 2):

  • H0:βk=0 für alle k
  • H1:βk0 für mindestens ein k

Wichtig:

  • Die H0 bedeutet nicht unbedingt, das der Faktor A/B keinen Einfluss auf die AV hat.
  • Die H1 bedeutet nicht unbedingt, dass der Faktor A/B auf allen Faktorstufen des Faktors B/A einen Einfluss auf die AV hat.

Quadratsummen: QSges=QSA+QSB+QSAxB+QSinn

Teststatistiken für Faktoren:

  • TA=MQSAMQSinn folgt einer F -Verteilung mit v1=dfA und v2=dfinn .
  • TB=MQSBMQSinn folgt einer F -Verteilung mit v1=dfB und v2=dfinn .
  • TAxB=MQSAxBMQSinn folgt einer F -Verteilung mit v1=dfAxB und v2=dfinn .
uv1 = c("A","A","A","B","B","B","C","C","C") 
uv2 = c("X","X","Y","Y","Y","X","X","Y","Y")
av = c(1,2,3,4,5,6,7,8,9)

data = data.frame(uv1, uv2, av, stringsAsFactors = TRUE)


# Omnibustest mit R Funktion 1 (unkorrigiert)
fit <- aov(av ~ uv1 * uv2, data)
summary(fit)

# Omnibustest mit R Funktion 2 (korrigiert - wenn Varianzgleichheit verletzt), nur mit vielen Beobachtungen
#oneway.test(av~uv1*uv2, data) 
Effektgröße

Gesamtvarianz in zweifaktoriellen Modell:

σ2ges =σ2A+σ2B+σ2AxB+σ2 Effektgrößen:

  • Anteil der Gesamtvarianz der AV, der durch den Haupteffekt von Faktor A erklärt werden kann: η2A=σ2Aσ2ges
  • Anteil der Gesamtvarianz der AV, der durch den Haupteffekt von Faktor B erklärt werden kann : η2B=σ2Bσ2ges
  • Anteil der Gesamtvarianz der AV, der durch die Interaktion der beiden Faktoren erklärt werden kann: η2AxB=σ2AxBσ2ges
  • Partielles Eta-Quadrat: Anteil an der auf Faktor A und den Fehler zurückgehenden Varianz der AV, der durch den Haupteffekt von Faktor A erklärt werden kann: η2par ,A=σ2Aσ2A+σ2
uv1 = c("A","A","A","B","B","B","C","C","C") 
uv2 = c("X","X","Y","Y","Y","X","X","Y","Y")
av = c(1,2,3,4,5,6,7,8,9)

data = data.frame(uv1, uv2, av, stringsAsFactors = TRUE)
fit = aov(av ~ uv1 * uv2, data)

#Effekt
library(DescTools)
EtaSq(fit)

library(MBESS)
conf.level = 0.95

# Effekt uv1 Konfidenzintervall
ci.pvaf(summary(fit)[[1]][["F value"]][[1]] ,df.1 = summary(fit)[[1]][["Df"]][[1]], df.2 = summary(fit)[[1]][["Df"]][[4]], N=nrow(data), conf.level = conf.level)

# Effekt uv2 Konfidenzintervall
ci.pvaf(summary(fit)[[1]][["F value"]][[2]] ,df.1 = summary(fit)[[1]][["Df"]][[2]], df.2 = summary(fit)[[1]][["Df"]][[4]], N=nrow(data), conf.level = conf.level)

# Effekt uv1:uv2 Konfidenzintervall
ci.pvaf(summary(fit)[[1]][["F value"]][[3]] ,df.1 = summary(fit)[[1]][["Df"]][[3]], df.2 = summary(fit)[[1]][["Df"]][[4]], N=nrow(data), conf.level = conf.level)
Varianzanalyse - Kontrastmatrix

Konfidenzintervall, Hypothesentest:

library(multcomp)
library(forcats)


uv1 = c("A","A","A","B","B","B","C","C","C") 
uv2 = c("X","X","Y","Y","Y","X","X","Y","Y")
av = c(1,2,3,4,5,6,7,8,9)

data = data.frame(uv1, uv2, av, stringsAsFactors = TRUE)

data$uv1_uv2 = fct_cross(data$uv1, data$uv2, sep = '_')

fit_aov = aov(av ~ uv1_uv2, data)

# H0
hyps = mcp(uv1_uv2 = c(
  "A_X - B_X == 0",
  "B_Y - A_Y == 0")
)

fit = glht(fit_aov, hyps)
confint(fit, level = 0.95, calpha = univariate_calpha())

# "single-step": Tukey Methode, univariate(): Keine Korrektur, "bonferroni": Bonferroni
summary(fit, test=univariate())
Interaktionsplots
uv1 = c("A","A","A","B","B","B","C","C","C") 
uv2 = c("X","X","Y","Y","Y","X","X","Y","Y")
av = c(1,2,3,4,5,6,7,8,9)
    
data = data.frame(uv1, uv2, av, stringsAsFactors = TRUE)   

interaction.plot(data$uv1, data$uv2, data$av)
interaction.plot(data$uv2, data$uv1, data$av)

Regressionsanalyse

Einfache Lineare Regression

Parameterschätzung

Yi=α+βXi+εi wobei εi iid N(0,σ2) E(YiXi=xi)=μi=α+βxi

εi=YiE(YiXi=xi)

Parameter:

  • α Intercept, Achsenabschnitt
  • β Slope, Steigungsparameter
  • σ2 Fehlervarianz (Realisation s von sqrt(σ2) iste der “Standardschätzfehler”)

Schätzfunktionen:

ˆβ=B=cov(X,Y)S2x

ˆα=A=ˉYBˉX

ˆσ2=S2=1n2ni=1(Yi(A+BXi))2=1n2ni=1E2i

Gleichung der Geschätzten Regressionsgeraden:

ˆE(Yixi)=a+bxi

data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(0,23,80,90,140,182,220,300))

fit <- lm(AV ~ UV, data = data)
#summary(fit)

# a
fit$coefficients[["(Intercept)"]]

# b
fit$coefficients[["UV"]]

# Konfidenzointervall für Parameter
confint(fit, level=0.95)

# standard error
summary(fit)$sigma

Zentrierung einer ZV: Xc,i=XiˉX

data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(0,23,80,90,140,182,220,300))

data$UV <- data$UV - mean(data$UV)
# oder
data$UV <- scale(data$UV, center = TRUE, scale = FALSE)

data

# Vorhersage für durchschnittlichen UV Wert
lm(AV ~ UV, data = data)$coefficients[["(Intercept)"]]

Vorhersagewert Subjekt i: Schätzwert für μi: ˆYi=ˆμi=A+BXi

data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV, data = data)

new_uv_value = 50
data_pred <- data.frame(UV=new_uv_value)

# Alternative Berechnung des Vorhersagewerts "von Hand"
#fit$coefficients[["(Intercept)"]]+fit$coefficients[["UV"]]*new_uv_value

# Berechnung des Vorhersagewerts mit Konfidenzintervall
predict(fit, data_pred, interval="prediction", level=0.95)

Residuum Differenz zwischen Beobachtung und Realisation: Ei=YiˆYi

Hypothesentests

Hypothesentest für β: Hypothesen: H0:β=β0=0H1:ββ0=0

Teststatistik:

T=Bβ0ˆVar(B)t(n2)

Var(B)=σ2ni=1(xiˉx)2

ˆVar(B)=S2ni=1(xiˉx)2=1n2ni=1E2ini=1(xiˉx)2

data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV, data = data)
#summary(fit)

# p Wert für b
summary(fit)$coefficients[,4][["UV"]]

Multiple Regression

Parameterschätzung

Yi=α+β1Xi1+β2Xi2+εi wobei εiiidN(0,σ2)

E(YiXi1=xi1,Xi2=xi2)=μi=α+β1xi1+β2xi2

wobei r2x1x2 die quadrierte Korrelation zwischen den beiden Prädiktoren ist.

Konfidenzintervall für beta1 beta2

[Bj±t1α2^SE(Bj)]

mit t-Verteilung mit v = n - 3.

S2=ˆσ2=1n3ni=1(Yi(A+B1Xi1+B2Xi2))2=1n3ni=1E2i

data <- data.frame(UV1 = c(1,2,6,7,13,15,20,30), UV2 = c(1,2,3,4,5,6,7,8), AV = c(0,23,80,90,140,182,220,300))

fit <- lm(AV ~ UV1 + UV2, data = data)
#summary(fit)

# a
fit$coefficients[["(Intercept)"]]

# b1
fit$coefficients[["UV1"]]

# b2
fit$coefficients[["UV2"]]

# Konfidenzointervall für Parameter
confint(fit, level=0.95)

# standard error
summary(fit)$sigma

SE(B1)=Var(B1)=11r2x1x2σ2ni=1(xi1ˉx1)2

Vorhersage

ˆyi=a+b1xi1+b2xi2

Hypothesentests

Einzelne Prädiktoren
  • Bei einer MLR mit zwei Prädiktoren können folgenden zwei Hypothesen überprüft werden:

H0:β1=0H1:β10H0:β2=0H1:β20

Teststatistik: T1=B1ˆVar(B1)t(n3)

data <- data.frame(UV1 = c(1,2,6,7,13,15,20,30), UV2 = c(1,2,3,4,5,6,7,8), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV1 + UV2, data = data)
summary(fit)
Omnibustest

Hypothese:

H0:β1=β2=0H1:βj0 für mindestens ein j mit j=1,2

Teststatistik:

F=12ni=1(ˆYiˉY)2S2

Kollinearität

  • Man spricht von Kollinearität, wenn einer oder mehrere der Prädiktoren stark mit den jeweils anderen Prädiktoren zusammenhängen

  • Entstehende Probleme:

    • Größere Konfidenzintervalle
    • Geringere Power der Hypothesentests
  • Nicht beeinflusst:

    • Konfidenzintervalle für ρ2
    • Der Omnibustest im Rahmen der MLR

SE(Bj)=Var(Bj)=11r2jσ2ni=1(xijˉxj)2

Hierbei ist r2j der Determinationskoeffizient eines Regressionsmodells, in das der Prädiktor 𝑗 als Kriterium und alle anderen Prädiktoren als Prädiktoren aufgenommen werden.

Varianzinflationsfaktor
  • Kennwert für Kollinearität

  • Zeigt: Negative Auswirkungen der Kollinearität können mit großen Stichproben aufgehoben werden

VIFj=11r2j

data <- data.frame(UV1 = c(1,2,6,7,13,15,20,30), UV2 = c(1,2,3,4,5,6,7,8), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV1 + UV2, data = data)

# Beachte: Bei 2 Variablen sind beide VIFs identisch

# Berechnung von Punkt und KI mit R
library(car)
vif(fit)

library(MBESS)
ci.R2(R2 = summary(fit)$r.squared, p=ncol(data)-1, conf.level = 0.95, N=nrow(data))


# Berechnung von Punktschätzer "per Hand"
fit_uv1 <- lm(UV1 ~ UV2, data = data)
1/(1-summary(fit_uv1)$r.squared)

Effektgrößen

Effektgröße ρ2
  • Stärke des Zusammenhangs, Einheitsunabhängig

Schätzfunktion:

ˆρ2=R2=ˆσ2μiˆσ2ges=1nni=1(ˆYiˉY)21nni=1(YiˉY)2=ni=1(ˆYiˉY)2ni=1(YiˉY)2

ERL (eine UV)

  • Anteil der Gesamtvarianz der AV, der durch die UV erklärt werden kann
data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV, data = data)

# Punktschätzung rho2
rho2 <- summary(fit)$r.squared
rho2

# Konfidenzintervall rho2
library(MBESS)
ci.R2(rho2, p = 1, N = nrow(data), conf.level=0.95)

MLR (mehrere UVs)

  • Gesamte Effektstärke aller Prädiktoren im MLR Modell
  • Anteil der Gesamtvarianz der AV, die durch alle UVs gemeinsam erklärt werden kann
data <- data.frame(UV1 = c(1,2,6,7,13,15,20,30), UV2 = c(1,2,3,4,5,6,7,8), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV1 + UV2, data = data)

# Punktschätzung rho2
rho2 <- summary(fit)$r.squared
rho2

# Konfidenzintervall rho2
library(MBESS)
ci.R2(rho2, p = 2, N = nrow(data), conf.level=0.95)
Effektgröße ρ2j für MLR
  • Effektstärke eines einzelnen Prädiktors im MLR Modell

  • Anteil der Gesamtvarianz der AV, der über die anderen Prädiktoren hinaus nur durch UV j erklärt werden kann

ρ2j=ρ2ρ2j

wobei ρ2j demjenigen ρ2 entspricht, das man erhält, wenn man den Prädiktor j aus dem MLR-Modell entfernt.

data <- data.frame(UV1 = c(1,2,6,7,13,15,20,30), UV2 = c(1,2,3,4,5,6,7,8), AV = c(0,23,80,90,140,182,220,300))

# Punktschätzung rho2
fit <- lm(AV ~ UV1 + UV2, data = data)
rho2 <- summary(fit)$r.squared

# Punktschätzung rho2_1
fit2 <- lm(AV ~ UV2, data = data)
summary(fit)$r.squared - summary(fit2)$r.squared

# Punktschätzung rho2_2
fit1 <- lm(AV ~ UV1, data = data)
summary(fit)$r.squared - summary(fit1)$r.squared
Effektgröße βz für ELR
  • Stärke des Zusammenhangs, Richtung des Zusammenhangs, Einheitsunabhängig
  • im Rahmen der ELR identisch mit der Pearson-Korrelation (zwischen AV und UV) in der Stichprobe
  • “normales” β falls AV und UV z-standardisiert werden

ρ2=β2z

data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(scale(AV) ~ scale(UV), data = data)

# Punktschätzung beta_z
fit$coefficients[["scale(UV)"]]

# Konfidenzintervall beta_z
confint(fit, level=0.95)

Effektgröße βzj für MLR

  • Effektstärke eines einzelnen Prädiktors im MLR Modell
  • Stärke des Zusammenhangs, Richtung des Zusammenhangs, Einheitsunabhängig
  • Gibt an, wie stark die jeweilige UV bei Konstanthaltung aller anderen UVs mit der AV zusammenhängt.
  • Nicht (!) identisch mit Pearson Korrelation
data <- data.frame(UV1 = c(1,2,6,7,13,15,20,30), UV2 = c(1,2,3,4,5,6,7,8), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV1 + UV2, data = data.frame(scale(data)))

# Punktschätzung beta_z_1
fit$coefficients[["UV1"]]

# Punktschätzung beta_z_2
fit$coefficients[["UV2"]]

# Konfidenzintervall beta_z
confint(fit, level=0.95)

Stichprobenplanung

  • n=v+k+1 wobei k die Anzahl der Prädiktoren ist
ELR - Eine UV

Hypothese:

H0:β=0H1:β0

Benötigt alternative Effektgröße:

f2=β2z1β2z=ρ21ρ2

rho2 <- 0.1
f2 <- rho2/(1-rho2)

library(pwr)
pwr_analysis <- pwr.f2.test(u=1, f2 = f2, sig.level = 0.005, power = 0.8)
pwr_analysis

# Anzahl benötigte Versuchspersonen
ceiling(pwr_analysis$v + 2)
MLR - mehrere UVs

Einzelne Parameter

H0:βj=0H1:βj0

Benötigt alternative Effektgröße:

f2j=ρ2j1ρ2

rho2_1 <- 0.05
rho2 <- 0.1
num_of_predictors = 2

f2_1 <- rho2_1/(1-rho2)

library(pwr)
pwr_analyses <- pwr.f2.test(u=1, f2 = f2_1, sig.level = 0.005, power = 0.8)
pwr_analyses

ceiling(pwr_analyses$v + num_of_predictors + 1)

Omnibustest

H0:βj=0 für alle jH1:βj0 für mindestens ein j

f2=ρ21ρ2

rho2 <- 0.1
num_of_predictors = 2

f2 <- rho2/(1-rho2)

library(pwr)
pwr_analyses <- pwr.f2.test(u=2, f2 = f2, sig.level = 0.005, power = 0.8)
pwr_analyses

ceiling(pwr_analyses$v + num_of_predictors + 1)

Regressionsdiagnostik

Überprüfung der Modellannahmen + Außreißeranalyse

Modellannahmen:

  1. Die UV und AV hängen linear zusammen

  2. Alle Fehler ϵi sind unabhängig voneinander und folgen einer Normalverteilung mit Erwartugnswert 0 und konstanter Varianz σ2

(Achtung: Residuen müssen standardisiert werden)

Linearität

Eine stetige UV

data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV, data = data)

plot(AV~UV, data=data)
abline(fit)

Zwei stetige UVs

data <- data.frame(UV1 = c(1,2,6,7,13,15,20,30), UV2 = c(1,2,3,4,5,6,7,8), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV1 + UV2, data = data)

# Component + Residual Plots
library(car)
crPlots(fit)

Normalverteilung

data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV, data = data)

hist(rstandard(fit))

Homoskedastizität

Varianz in Y Richtung soll für gesamten Wertebereich der UV ähnlich sein

data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV, data = data)

plot(fit$fitted.values, rstandard(fit))

Ausreißer

  • Hebelwert (Leverage): Ungewöhnlich große Abweichung des UV-Werts vom Durchschnitt

  • Diskrepanzwert (Discrepancy): Ungewöhnlich große Abweichung des AV-Werts vom Durchschnitt

  • Einflusswert (Influence): Kombination aus Hebel- und Diskrepanzwert ! Vor allem problematisch !

Cook’s Distaz: Wie stark würden sich alle Vorhersagewerte ändern, wenn diese Beobachtung noicht mit ins Modell einfließt (Empfehlung: Werte mit distance > 4n ausschließen)

data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UV, data = data)

cutoff <- 4/nrow(data)
plot(cooks.distance(fit))
abline(h=cutoff)

which(cooks.distance(fit) > cutoff)

Diskrete Prädiktoren

Dummy-Kodierung

Di={1, falls Person i nicht zur Referenzkategorie gehört 0, falls Person i zur Referenzkategorie gehört 

Modellgleichung:

Yi=α+βDi+εi mit εiiidN(0,σ2)

  • Referenzkategorie:

E(Yi)=E(α+εi)=α+0=α

  • andere Kategorie

E(Yi)=E(α+β+εi)=α+β+0=α+β

Mehrere Stufen

Dji={1, falls Person i zur Kategorie j gehört 0, falls Person i nicht zur Kategorie j gehört 

  • Referenzkategorie: Dij=0 für alle j
  • Diskreter Prädiktor mit k Ausprägungen benötigt k - 1 Dummy Variablen

Yi=α+β1D1i++β(k1)D(k1)i+εi mit εiiidN(0,σ2)

  • Damit ergibt sich:
    • α ist der Erwartungswert der AV in der Referenzkategorie.
    • α+βj ist der Erwartungswert der AV in Kategorie j.
    • βj ist die Erwartungswertdifferenz der AV zwischen der Kategorie j und der Referenzkategorie.

Kombination von diskret und stetig

Yi=α+β1Xi+β2Di+β3(XiDi)+εi mit εiiidN(0,σ2)

  • Modell für Referenzkategorie

Yi=α+β1Xi+εi

  • Modell für andere Kategorie

Yi=(α+β2)+(β1+β3)Xi+εi

  • Damit ergibt sich die folgende Interpretation der Parameter:
    • α ist der Intercept in der Referenzkategorie.
    • β1 ist der Steigungsparameter in der Referenzkategorie.
    • α+β2 ist der Intercept in der anderen Kategorie.
    • β1+β3 ist der Steigungsparameter in der anderen Kategorie.
    • β2 ist die Differenz der Intercepts der anderen Kategorie und der Referenzkategorie.
    • β3 ist die Differenz der Steigungsparameter der anderen Kategorie und der Referenzkategorie.
data <- data.frame(UVS = c(1,2,6,7,13,15,20,30), UVD = c(1,0,1,0,0,0,1,0), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UVS * UVD, data = data)

#summary(fit)

# a
fit$coefficients[["(Intercept)"]]

# b1
fit$coefficients[["UVS"]]

# b2
fit$coefficients[["UVD"]]

# b3
fit$coefficients[["UVS:UVD"]]

# Konfidenzointervall für Parameter
confint(fit, level=0.95)

# standard error
summary(fit)$sigma
Hypothesentests

Beispiele:

Gibt es einen Zusammenhang zwischen UV und AV in der Referenzkategorie?

H0:β1=0H1:β10

Ist der Zusammenhang zwischen UV und AV unterschiedlich groß in den Kategorien?

H0:β3=0H1:β30

data <- data.frame(UVS = c(1,2,6,7,13,15,20,30), UVD = c(1,0,1,0,0,0,1,0), AV = c(0,23,80,90,140,182,220,300))
fit <- lm(AV ~ UVS * UVD, data = data)
summary(fit)
# Komlexere Fragestellungen
# Bsp: Gibt es für mindestens eine Kategorie der UVD einen positiven Zusammenhang zwischen UVS und AV?
library(multcomp)
data <- data.frame(UVS = c(1,2,6,7,13,15,20,30), UVD = c(1,0,1,0,0,0,1,0), AV = c(0,23,80,90,140,182,220,300))
fit_lm <- lm(AV ~ UVS * UVD, data = data)

hyps <- c('UVS <= 0',
          'UVS + UVS:UVD <= 0')
fit <- glht(fit_lm, hyps)

## unkorrigierte p-Werte
summary(fit, test = univariate())
## Tukey-korrigierte p-Werte
summary(fit, test = adjusted('single-step'))

Interaktion zwischen stetigen Prädiktoren

Yi=α+β1Xi1+β2Xi2+β3(Xi1Xi2)+εi mit εiiidN(0,σ2)

  • Moderator Xi2

Yi=α+β2Xi2+(β1+β3Xi2)Xi1+εi

  • Moderator Xi1

Yi=α+β1Xi1+(β2+β3Xi1)Xi2+εi

Logistische Regression

P(Yi=1xi)=s(α+βxi)=eα+βxi1+eα+βxi

Odds:

  • “Wie viel mal wahrscheinlicher ist 1 als 0”

P(Yi=1xi)P(Yi=0xi)=eα+βxi=eαeβxi

P(Yi=1xi+1)P(Yi=0xi+1)=eαeβ(xi+1)=eαeβxieβ=P(Yi=1xi)P(Yi=0xi)eβ

P(Yi=1xi=0)P(Yi=0xi=0)=eαeβ0=eα

Log-Odds:

ln(P(Yi=1xi)P(Yi=0xi))=ln(eα+βxi)=α+βxi

Die Log-Odds sind genau dann gleich 0, wenn P(Yi=1xi)=0.5 ist. Sie sind negativ, wenn P(Yi=1xi)<P(Yi=0xi) ist, und positiv, wenn P(Yi=1xi)>P(Yi=0xi) ist.

# probability(Y=1) -> odds, log odds

p = 0.7

odds <- p/(1-p)
odds

log_odds <- log(odds)
log_odds
# odds -> log odds, probability(Y=1)

odds <- 3

log_odds <- log(odds)
log_odds

p <- odds/(odds+1)
p
# log odds -> odds, probability(Y=1)

log_odds <- 0.8

odds <- exp(log_odds)
odds

p <- odds/(odds+1)
p

Für Multiple Regression:

P(Yi=1xi1,,xik)=eα+β1xi1++βkxik1+eα+β1xi1++βkxik

Interpretation Basics:

  • Aus der Odds-Schreibweise ergibt sich:
    • eα entspricht den Odds von Personen, die auf allen UVs den Wert 0 haben.
    • eβj entspricht dem Faktor, um den sich die Odds erhöhen, falls sich die UV j um eine Einheit erhöht und alle anderen UVs konstant bleiben.
  • Aus der Log-Odds-Schreibweise ergibt sich:
    • α entspricht den Log-Odds von Personen, die auf allen UVs den Wert 0 haben.
    • Falls sich die UV j um eine Einheit erhöht und alle anderen UVs konstant bleiben, erhöhen sich die Log-Odds um βj.
data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(1,0,1,0,0,0,1,0))
fit <- glm(AV ~ UV, family="binomial", data = data)
#summary(fit)


# Log Odds
fit$coefficients[["(Intercept)"]]
fit$coefficients[["UV"]]
confint(fit, level=0.95)


# Odds
exp(fit$coefficients[["(Intercept)"]])
exp(fit$coefficients[["UV"]])
exp(confint(fit, level=0.95))

Modelle mit diskreten Prädiktoren:

P(Yi=11)P(Yi=01)=eαeβ1=P(Yi=10)P(Yi=00)eβ Odds Ratio:

  • Wieviel mal sind die Odds in der Nicht-Referenzkategorie größer als in der Referenzkategorie?

P(Yi=11)P(Yi=01)P(Yi=10)P(Yi=00)=eβ

# Odds Ratio aus Modell errechnen  
data <- data.frame(UV = c(0,1,1,1,0,0,0,0,1,1), AV = c(1,0,1,0,1,1,1,0,0,0))
fit <- glm(AV ~ UV, family="binomial", data = data)

exp(fit$coefficients[["UV"]])
# Odds Ratio aus Wahrscheinlichkeiten (Y=1)
p_ref = 0.7
p_nicht_ref = 0.5

(p_nicht_ref/(1-p_nicht_ref))/(p_ref/(1-p_ref))

Risk Ratio:

  • Um welchen Faktor ist das Auftreten von Yi=1 in der Nicht-Referenzkategorie wahrscheinlicher ist als in der Referenzkategorie?

P(Yi=11)P(Yi=10)=1+eα1+eαβ

# Risk Ratio aus Modell errechnen  
data <- data.frame(UV = c(0,1,1,1,0,0,0,0,1,1), AV = c(1,0,1,0,1,1,1,0,0,0))
fit <- glm(AV ~ UV, family="binomial", data = data)

(1+exp(-fit$coefficients[["(Intercept)"]]))/(1+exp(-fit$coefficients[["(Intercept)"]]-fit$coefficients[["UV"]]))
# Risk Ratio aus alpha und beta
alpha = 0.7
beta = 0.5

(1+exp(-alpha))/(1+exp(-alpha-beta))

Vorhersage

ˆyi={1, falls ea+b1xi1++bkxik1+ea+b1xi1++bkxik0.50, sonst 

ˆyi={1, falls a+b1xi1++bkxik00, sonst 

data <- data.frame(UV = c(1,2,6,7,13,15,20,30), AV = c(1,0,1,0,0,0,1,0))
fit <- glm(AV ~ UV, family="binomial", data = data)

# Vorhersage mit R
data_new <- data.frame(UV = 8)
predict(fit, newdata = data_new, type="response")
alpha = 3
beta = 0.2

uv_val = 10

# Vorhersage per Hand
exp(alpha+beta*uv_val)/(1+exp(alpha+beta*uv_val))

Interpretationen bei Standardisierung

Beispiel mit 2 stetigen UVs ohne Interaktion, anwendbar auf beliebige Fälle (Achtung: bei logistischer regression erhöhen sich logodds, nicht AV Werte!)

UV

Normal
  • Intercept: Durchschnittlicher AV-Wert für Personen mit UV1=0 und UV2=0
  • Slope_1: Falls sich UV1 um eine Einheit erhöht und UV2 konstant bleibt, erhöht sich die AV um Slope_1
Zentriert

Parameter können eventuell sinnvoller interpretiert werden

  • Intercept: Durchschnittlicher AV-Wert für Personen mit durchschnittlichen UV1 und UV2
  • Slope_1: Falls sich UV1 um eine Einheit erhöht und UV2 konstant bleibt, erhöht sich die AV um Slope_1
z-Standardisiert

Parameter können eventuell sinnvoller interpretiert werden, VIF ist geringer

  • Intercept: Durchschnittlicher AV-Wert für Personen mit durchschnittlichen UV1 und UV2
  • Slope_1: Falls sich UV1 um eine Standardabweichung erhöht und UV2 konstant bleibt, erhöht sich die AV um Slope_1

AV

Normal
  • … erhöht sich die (Erwarteter) AV um Slope
z-standardisiert
  • … erhöht sich die (Erwarteter) AV um Slope Stanbdardabweichungen
