지금, 나는 

Art is anything you can get away with.

반응형

Math 54

범주형 자료의 분석

Categorial data: 관측치들이 몇 개의 범주로 분류되고 각 범주의 빈도가 주어지는 것대표적으로 아래 세 유형의 검정은 모두 카이제곱분포를 이용한다.적합성 검정모집단의 분포를 모르는 경우 특정한 확률분포가 자료에 적합한지를 검정각 범주의 비율이 실제 자료에 적합한지를 검정$H_0:p_1=P_{10},~p_2=p_{20},\cdots,p_k=p_{k0}$ vs $H_1:$ 적어도 하나의 $p_i\neq p_{i0}$모집단으로부터 n개 표본을 추출, k개 범주로 분류$O_i$: 범주 i에 속한 관측치의 개수$E_i$: $H_0$이 사실이면 범주 i에 속하리라 기대되는 관측치의 개수검정통계량: $X_0^2=\displaystyle\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}..

Math/Statistics 2026.02.24

다중선형회귀 추론

가정사항$\varepsilon=\begin{bmatrix}\varepsilon_1\\ \varepsilon_2 \\ \vdots \\ \varepsilon_n\end{bmatrix}\sim$ iid $N(\mathbf{0, \sigma^2I})$이고, x는 자료 수집 전 고정된 것으로가정하면 $\mathbf{Y}=\begin{bmatrix}Y_1\\Y_2\\ \vdots\\ Y_n\end{bmatrix}\sim$ iid $N(\mathbf{X\beta,\sigma^2 I})$이다.즉 $Y_i\sim N(\beta_0+\beta_1x_{i1}+\cdots+\beta_kx_{ik},\sigma^2)$$\sigma^2$의 추론잔차(오차)제곱합: $SS_E=\displaystyle\sum_{i=1}^ne_i^2..

Math/Statistics 2026.02.23

다중선형회귀

k개 설명변수와 반응변수 사이에 $Y=\beta_0+\beta_1x_1+\beta_2x_2+\cdots+\beta_kx_k+\varepsilon$을 가정.$Y$와 $\varepsilon$은 확률변수, $x$들은 고정된 상수.n개의 관측치를 아래와 같이 나타낼 수 있다.$y_i=\beta_0+\beta_1x_{i1}+\beta_2x_{i2}+\cdots+\beta_kx_{ik}+\varepsilon_i$$\beta_j$는 $x_j$ 외 x들을 고정하고 $x_j$을 한 단위 변화시켰을 때 $E(Y)$의 변화를 측정한다.$\beta_j$는 부분회귀계수라고도 한다.선형회귀모형에서 선형은 모수가 서로 선형임을 뜻하며교호작용 존재(방향성 존재), 고차항의 존재 또한 다중선형회귀모형이라 한다.최소제곱추정량오차제곱합을..

Math/Statistics 2026.02.23

상관분석

x와 y 모두 확률변수로, 두 변수의 선형관계의 방향과 강도 측정X와 Y의 공분산(covariance)$Cov(X, Y)=E[(X-E(X))(Y-E(Y))]=E(XY)-\mu_X\mu_Y$X와 Y의 피어슨 상관계수(Pearson correlation coefficient)$\displaystyle\rho=Corr(X,Y)=\frac{Cov(X,Y)}{\sqrt{\sigma_Y^2\sigma_X^2}}=\frac{\sigma_{XY}}{\sigma_X\sigma_Y}$$-1 \leq \rho \leq 1$두 변수가 독립이면 공분산은 0이 되고, 상관계수도 0이다.비선형 관계도 상관계수는 0에 근접한다.$\rho$의 점 추정치: 표본상관계수$\hat{\rho}=\frac{S_{xy}}{\sqrt{S_{xx}..

Math/Statistics 2026.02.23

단순선형회귀분석 예측

잔차분석 후 최종 선택한 모형을 예측모형으로 사용할 수 있다.$x_0$가 주어져 있을 때 미래 관측값: $Y_0=\beta_0+\beta_1x_0+\varepsilon$$Y_0$의 점추정량: $\hat{Y}_0=\hat{\beta}_0+\hat{beta}_1x_0$예측오차$Y_0-\hat{Y}_0=\varepsilon+(\beta_0-\hat{\beta}_0)+(\beta_1-\hat{\beta}_1)x_0\sim N\Big(0,\sigma^2\Big[1+\frac{1}{n}+\frac{(x_0-\bar{x})^2}{\sum_{i=1}^n(x_i-\bar{x})^2}\Big]\Big)$$Y_0$의 $100(1-\alpha )$% 예측구간(prediction interval)$\hat{y}_0\pm t_{..

Math/Statistics 2026.02.23

단순선형회귀모형 추론

가정$\varepsilon_i\sim N(0,\sigma^2)$이고, $x_i$는 자료 수집 전 고정된 것이면,$Y_i\sim N(\beta_0+\beta_1x_i,\sigma^2)$이다.$\sigma^2$의 추론$SS_E=\displaystyle\sum_{i=1}^n(y_i-\bar{y})^2+(\hat{\beta}_1)^2\sum_{i=1}^n(\bar{x}-x_i)^2-2\hat{\beta}_i\sum_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})=S_{yy}-\hat{\beta}_1S_{xy}$$\frac{SS_E}{\sigma^2}\sim\chi_{n-2}^2$ 이므로 $E(SS_E)=(n-2)\sigma^2$잔차평균제곱$\hat{\sigma}^2=MS_E=\frac{SS_E}{n..

Math/Statistics 2026.02.23

단순선형회귀

역학모형(Mechanistic model): 변수 간 물리적 메커니즘에 대한 기본지식으로부터 얻는 모형 확률적 요소를 갖지 않는 모형경험모형(Empirical model): 데이터를 기반해 변수 간의 관계에 대한 모형을 설정, 오차가 수반됨모형식별: 직선을 적합할 것인지, 더 고차의 모형을 적합할지 선정모형추정: 선정된 모형의 모수(계수)를 추정모형진단: 모수의 유의성을 검정하고, 모형의 타당성을 판정한다.회귀분석의 목적1) 기술: 독립변수가 종속변수에 미치는 영향력의 크기를 파악해 변수 간 관계를 설명2) 통제: 변수 간 관계에 기초해 종속변수가 목표값을 가지도록 효율적 통제3) 예측: 독립변수의 일정한 값에 대응..

Math/Statistics 2026.02.23
728x90
반응형