R 데이터프레임 column 생성, column 연산, 빈도수 계산, 조건문 추가하기

728x90

예시 데이터를 불러오기 위해 라이브러리 ggplot2을 불러오고 그 안의 mpg데이터를 불러오자

library(ggplot2)
mpg

 

데이터 column에 접근하기 위해서 $표시를 사용하고 그 column값이 iterable이면 아래와 같이 연산이 가능하다.

mpg$total <- (mpg$cty + mpg$hwy)/2

 

total데이터를 만들었다면 이 total 데이터로 조건문을 사용하여 pass or fail을 각각의 열에 추가한다. 

mpg$test <- ifelse(mpg$total >= 20, "pass", "fail")

 

ifelse 중첩문은 엑셀과 동일하게 중첩 사용이 가능하다.

mpg$grade <- ifelse(mpg$total >= 30, "A",
                    ifelse(mpg$total >= 20, "B", "C"))

 

만들어진 pass or fail데이터 개수를 세보려면 아래의 코드 table을 사용한다.

table(mpg$test)

#fail pass 
#106  128

 

 

728x90