R 데이터프레임 만들기, 엑셀파일 불러오기, 패키지안의 특정 데이터 data.frame화

728x90
반응형

데이터 분석에 가장 기본이 되는 데이터프레임 생성하는 법

a <- c(90, 80, 60, 70)
b <- c(50, 60, 100, 20)
c <- c(1, 1, 2, 2)
#데이터프레임 만들기
df <- data.frame(a, b, c)

#각각의 행에 접근하기 $를 사용
df$a
df$b
df$c

#행의 평균 구하기
mean(df$a)

 

엑셀파일을 불러오기 위한 필요한 라이브러리 설치 후 excel, csv파일 불러오기

#엑셀파일 불러오기
install.packages('readxl')
library(readxl)

#sheet = 1 첫번째 시트 가져오고
#col_names = T의 의미는 Columns이름까지 가져올 것을 결정
#T = True, F = False
df_finalexam <- read_excel('finalexam.xlsx', sheet = 1, col_names = T)
df_finalexam

#read.csv 는 내장함수. 설치 불필요
#col_names대신 header를 사용
df_csvexam <- read.csv('csv_exam.csv', header = T)
df_csvexam

#변수로 할당했던 파일 csv파일로 저장
write.csv(df_csvexam, file = 'output_test.csv')



exam <- read.csv('csv_exam.csv', header = T)

#변수로 할당했던 파일 csv파일로 저장
write.csv(df_csvexam, file = 'output_test.csv')

head(exam)
#앞 부분에서 6까지 출력
head(exam, 6)
#뒤부터 6까지 출력
tail(exam)
#뒤부터 지정행까지 출력
tail(exam, 10)

 

패키지에서 특정 데이터만 data.frame화 시키기

#::의 의미는 특정 패키지 안의 특정 데이터를 지칭
#즉 ggplot2의안의 mpg데이터를
#as.data.frame, as가 붙으면 특정 지칭 데이터(mpg)를 특정 포맷으로 변경해달라는 의미
#즉, mpg데이터를 data.frame형태로 변환시켜달라는 의미
mpg <- as.data.frame(ggplot2::mpg)
mpg
728x90
반응형