728x90
반응형
R 데이터프레임 만들기, 엑셀파일 불러오기, 패키지안의 특정 데이터 data.frame화
데이터 분석에 가장 기본이 되는 데이터프레임 생성하는 법 a
- R - 통계 언어
- · 2022. 5. 30.
728x90
반응형
데이터 전처리 필수 library인 dplyr의 내장 함수들 filter() #행 추출 select() #열(변수) 추출 arrange() #정렬 - sort mutate() #변수 추가 summarise() #통계치 산출 group_by() #집단별로 나누기 left_join() #데이터 합치기 - left니까 열 bind_rows() #데이터 합치기 - 행 위의 함수들 사용법 1. filter csv 파일을 하나 가져왔다고 가정을 하고 #class 가 1인 열만 불러오기 d %>% filter(class == 1) #class가 1이 아닌 열만 불러오기 d %>% filter(class != 1) # & = and 연산자 d %>% filter(math > 100 | english > 60) # | ..
예시 데이터를 불러오기 위해 라이브러리 ggplot2을 불러오고 그 안의 mpg데이터를 불러오자 library(ggplot2) mpg 데이터 column에 접근하기 위해서 $표시를 사용하고 그 column값이 iterable이면 아래와 같이 연산이 가능하다. mpg$total = 20, "B", "C")) 만들어진 pass or fail데이터 개수를 세보려면 아래의 코드 table을 사용한다. table(mpg$test) #fail pass #106 128
데이터 분석에 가장 기본이 되는 데이터프레임 생성하는 법 a
기초문법 기초 문법을 아래 코드 주석과 함께 복기하기 데이터프레임의 Columns, 즉 변수에 접근할 때 $를 사용한다. #평균 mean(mpg$hwy) #최대값 max(mpg$hwy) #최소값 min(mpg$hwy) #히스토그램 만들기 hist(mpg$hwy) #변수 배정 a
1. 개발환경 구축 R을 사용하기 위해서는 파이썬이나 자바와 동일하게 R언어와 인터프리터를 설치해야 한다. 아래 두개의 파일을 설치하는데 모든 설정은 default로 전부 놔두고 확인만 클릭해서 설치 윈도우, mac인지 본인 컴퓨터 잘 맞춰서 다운받자 R언어의 버전은 제일 최신으로 받아서 설치 The Comprehensive R Archive Network cran.yu.ac.kr RStudio Take control of your R code www.rstudio.com 2. 패키지 다운로드 및 실행 다 다운받고 Rstudio를 켜서 빈 코드 입력창에 아래의 패키지를 다운. R코드의 실행은 Ctrl + Enter를 치면 순차적으로 실행된다. install.packages("dplyr") install...