의학통계 2

What is Simple Linear Regression?

몇가지 통계량의 정의 Simple linear regression의 설명에 앞서, 데이터 (x_1, x_2, ..., x_n), (y_1, y_2, ..., y_n)이 주어졌을 때, 몇가지 통계량(statistics, 주어진 데이터로 부터 계산되어지는 값)을 아래와 같이 "정의"하여 보자. Model Simple linear regression의 모델은 다음과 같다. 초심자가 단순선형회귀분석을 이해하는 데에 있어 가장 중요한 것은 어쩌면 알 수 없는 것이 무엇인지 아는 것일지도 모르겠다. 새로운 x_*가 주어졌을 때, 아직 일어나지 않은 y_*가 무엇인지 알고 싶은 사람은 베타0, 베타1, 그리고 e_*값이 필요하다. 베타0, 베타1을 모르는 것은 그렇다 쳐도 e_*는 확률분포를 따르는 random한 양..

Statistics, R 2019.08.22

What is Scatterplots?

산점도란 무엇일까? 우리는 산점도를 말할 때 보통 2차원 산점도를 말하게 되는데, 산점도는 회귀분석 문제에서 predictor를 X라고 하고, response를 Y라고 할 때, 관측된 데이터 (xi, yi) 를 X, Y 좌표평면에 점으로 표시한 그림을 말한다. 산점도는 다른말로 summary graph라고 부르기도 한다. 산점도를 왜 그릴까? 산점도를 그려보는 것은 과학적 방법에 있어 일종의 관찰의 단계라 할 수 있다. 우리는 관찰을 통해 의문을 가지고, 그러한 의문을 통해 가설을 세우게 된다. 이러한 과정은 좋은가설을 세우는 데에 아마도 중요한 단계로 보인다 (관찰을 통한 의문을 가지지 않고 기계적으로 가정 또는 가설을 세우고 테스트한다면 아마도 좋은 발견의 기회를 놓칠 수 있을 것이다.). 산점도를 ..

Statistics, R 2019.07.08