R 7

R로 시계열 데이터에서 월별 또는 주별 마지막값으로 요약하기

R로 시계열 데이터(long form의 시계열 데이터)를 다루다 보면 연도별, 월별 또는 주별 마지막 값으로 데이터를 요약하고 싶을 때가 있다. 그룹별 평균 등으로 요약한다던가 할 때는 자연스럽게 하는데, 마지막 값으로 요약하려면은 익숙치 않은 사람들을 위해 여기에 소개하려고 한다. 먼저 아래와 같이 패키지를 설치하고 예시로 시계열 데이터를 받아보자 (여기서는 나스닥 데이터를 예시로 이용하겠다). rm(list=ls()) packages

Statistics, R 2023.11.14

R에서 variance ratio test (variance test)를 하는 방법

종종 두 그룹에서 데이터의 분산이 다른지 검정하고 싶을 수 있다 (궁금증이 많으면 그럴수도 있다. 이해하시라). 몇몇사람들은 t-test에서 등분산을 가정할지 말지 결정하기 위해서 t-test를 수행하기 이전에 variance ratio test를 먼저 수행해 보기도 한다. R로 variance ratio test를 수행해 보기 위해, t-test에서와 마찬가지로 datasets 패키지에 내장되어있는 airquality 데이터를 이용해보자. data(airquality) str(airquality) ## 'data.frame': 153 obs. of 6 variables: ## $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... ## $ Solar.R: int 190 11..

Statistics, R 2023.11.11

R에서 t-test 하는 방법

R로 t-test를 연습해보기 위해서 아래와 같이 datasets 패키지에 내장되어있는 airquality 데이터를 이용해보자. data(airquality) str(airquality) ## 'data.frame': 153 obs. of 6 variables: ## $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... ## $ Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ... ## $ Wind : num 7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ... ## $ Temp : int 67 72 74 62 56 66 65 59 61 69 ... ## $ Month : int 5 5 ..

Statistics, R 2023.11.11

R에서 여러 개의 패키지를 한 큐에 설치하기

데이터 분석을 위해서 R 코드를 작성할 때, 보통 필요한 패키지들에 대한 설치 코드를 먼저 작성한다. 때때로 데이터 분석 코드 중간중간에 패키지나 함수에 대한 코드를 작성하는 사람들도 있는데, 나 같은 경우는 개인적으로 이러한 작성은 선호하지 않고, 코드를 시작할 때 보통 #packages 작성부분 #functions 작성부분을 코드 작성 처음에 두는 편이다. 이후 데이터 분석 코드를 작성하다가 추가로 필요한 패키지나 함수가 있을 경우에, 위에서 작성해둔 해당섹션에 추가하면 된다. 이렇듯 R 코드를 깔끔하면서도 전체코드가 replication 가능하도록 작성하는 습관을 들이는 것을 추천한다. 보통 패키지가 설치되어있지 않은 경우 install.packages("")를 통해 패키지를 설치하고, librar..

Statistics, R 2023.10.28

R에서 numeric class 변수들만 한 번에 뽑기

R에서 데이터 작업을 하다보면 가끔 numeric class 변수들만 뽑고 싶을 때가 있다 (예를들어 numeric 변수들만으로 구성된 데이터로 만들어서 correlation matrix를 빠르게 보고싶다던지..) 먼저 다음과 같이 예시 데이터를 가져와보자. data(iris) str(iris) ## 'data.frame': 150 obs. of 5 variables: ## $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... ## $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... ## $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5..

Statistics, R 2023.10.27