분류 전체보기 15

R로 시계열 데이터에서 월별 또는 주별 마지막값으로 요약하기

R로 시계열 데이터(long form의 시계열 데이터)를 다루다 보면 연도별, 월별 또는 주별 마지막 값으로 데이터를 요약하고 싶을 때가 있다. 그룹별 평균 등으로 요약한다던가 할 때는 자연스럽게 하는데, 마지막 값으로 요약하려면은 익숙치 않은 사람들을 위해 여기에 소개하려고 한다. 먼저 아래와 같이 패키지를 설치하고 예시로 시계열 데이터를 받아보자 (여기서는 나스닥 데이터를 예시로 이용하겠다). rm(list=ls()) packages

Statistics, R 2023.11.14

R에서 variance ratio test (variance test)를 하는 방법

종종 두 그룹에서 데이터의 분산이 다른지 검정하고 싶을 수 있다 (궁금증이 많으면 그럴수도 있다. 이해하시라). 몇몇사람들은 t-test에서 등분산을 가정할지 말지 결정하기 위해서 t-test를 수행하기 이전에 variance ratio test를 먼저 수행해 보기도 한다. R로 variance ratio test를 수행해 보기 위해, t-test에서와 마찬가지로 datasets 패키지에 내장되어있는 airquality 데이터를 이용해보자. data(airquality) str(airquality) ## 'data.frame': 153 obs. of 6 variables: ## $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... ## $ Solar.R: int 190 11..

Statistics, R 2023.11.11

R에서 t-test 하는 방법

R로 t-test를 연습해보기 위해서 아래와 같이 datasets 패키지에 내장되어있는 airquality 데이터를 이용해보자. data(airquality) str(airquality) ## 'data.frame': 153 obs. of 6 variables: ## $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... ## $ Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ... ## $ Wind : num 7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ... ## $ Temp : int 67 72 74 62 56 66 65 59 61 69 ... ## $ Month : int 5 5 ..

Statistics, R 2023.11.11

상대 위험도(RR, Relative Risk)의 의미와 해석에 대한 오해

목적 역학이나 공중보건학 그리고 예방의학에서는 RR이라는 개념을 사용한다. RR은 상대위험도, 상대위험비, 위험비, Relative Risk, Risk Ratio 등으로 불리곤 한다. RR의 개념 자체는 사실 어렵지는 않은데, 어렵지 않은 이유 때문인지 가끔 충분히 생각하지 않아서, RR의 의미 또는 해석에 대한 오해가 일어나기도 한다. 이러한 오해가 일어나는 지점을 여기에 드러내고자 한다. 개념 여기서 위험(Risk)라는 용어가 사용되는데, Risk는 확률을 나타낸다고 보면 되겠다. 어떤 사건 A에 대한 Risk는 그 사건 A에 대한 확률을 의미한다. $$ 사건\; A에\; 대한\; Risk\; =\;P(A) $$ 보통은 질병으로 인한 사망이나 질병의 발생에 대한 Risk를 이야기하고, RR은 결국 두..

R에서 여러 개의 패키지를 한 큐에 설치하기

데이터 분석을 위해서 R 코드를 작성할 때, 보통 필요한 패키지들에 대한 설치 코드를 먼저 작성한다. 때때로 데이터 분석 코드 중간중간에 패키지나 함수에 대한 코드를 작성하는 사람들도 있는데, 나 같은 경우는 개인적으로 이러한 작성은 선호하지 않고, 코드를 시작할 때 보통 #packages 작성부분 #functions 작성부분을 코드 작성 처음에 두는 편이다. 이후 데이터 분석 코드를 작성하다가 추가로 필요한 패키지나 함수가 있을 경우에, 위에서 작성해둔 해당섹션에 추가하면 된다. 이렇듯 R 코드를 깔끔하면서도 전체코드가 replication 가능하도록 작성하는 습관을 들이는 것을 추천한다. 보통 패키지가 설치되어있지 않은 경우 install.packages("")를 통해 패키지를 설치하고, librar..

Statistics, R 2023.10.28

R에서 numeric class 변수들만 한 번에 뽑기

R에서 데이터 작업을 하다보면 가끔 numeric class 변수들만 뽑고 싶을 때가 있다 (예를들어 numeric 변수들만으로 구성된 데이터로 만들어서 correlation matrix를 빠르게 보고싶다던지..) 먼저 다음과 같이 예시 데이터를 가져와보자. data(iris) str(iris) ## 'data.frame': 150 obs. of 5 variables: ## $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... ## $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... ## $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5..

Statistics, R 2023.10.27

영어 문장 연습 20231025

저번에 #get 관련해서 연습문장들을 정리하다가 멈췄었다. 이번에 리뷰하고자 하는 문장들은 아래와 같다. # get - Go get some water - I got an e-mail from my boss this morning. - My friend gets/earns/makes about $50,000 a year. - I need to figure out how to get around in this city. - It takes some time to learn how to get around in this city. - My bedroom gets very little sunshine. - The new TV show gets little attention. - I got the impress..

English 2023.10.25

영어 문장 연습 20231017

오늘 연습할 문장들을 정리하고자 한다. 책이나 유튜브에서 가져온 문장들일껀데 정확한 출처는 잊어버려서 양해부탁드립니다. # want - I want to hear her voice - I want to talk to martin. - I want it to end. - I want my phone back. - I want to leave this place. - I want to say something. - I want to go home. - I want to show you something. - I want to have kids. We want to have kids. - I want to thank you for saving my life. - I want you to have this. -..

English 2023.10.17