ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • R 입출력 실습
    자격증/ADsP 03 데이터 분석 2020. 2. 9. 21:52
    • 주석: #006DD7
    • 코드입력: #333333
    • 결과값: #9D9D9D

     

    기능 R 코드 비고
    키보드로 데이터를 입력 1)데이터 양이 적어 직접 입력
       c(): combine 함수
    2) 데이터 편집기를 활용하기
        빈데이터 프레임 생성
        -> 편집기를 불러와서 데이터 편집하고 데이터 프레임에 덮어씌우기
     
    출력할 내용의 자리수 정의 R의 부동소수점 표현: 7자리로 표시
    print(pi, digits=num)
    cat(format(pi,digits=num), "\n")
    options(digits=num)


    파일에 출력하기 cat("출력할 내용", 변수, "\n", file="파일이름", append=T)
    sink("파일이름")
    ···출력할 내용···
    sink()
     
    파일 목록보기 list.files()
    list.files(recursive=T,all.files=T)
     
    Cannot Open File(파일을 열 수 없음)   역슬래쉬를 슬래쉬로 바꿈
    역슬래쉬를 쌍으로 표
    고정자리수 데이터 파일(fixed-width file) read.fwf("파일이름", widths=c(w1,w2,···,wn)  
    테이블로 된 데이터 파일 일기(변수 구분자 포함) read.table("파일이름", sep="구분자")

    주의1) 주소, 이름, 성 등의 텍스트를 요인으로 인식
    해결1) read.table("파일이름", sep="구분자", stringsASFactor=F)

    주의2) 결측치를 NA가 아닌 다른 문자열로 표현할 때
    해결2) read.table("파일이름", sep="구분자", na.strings=".")

     

    주의3) 파일의 첫행을 변수명으로 인식하고자 할 때
    해결3) read.table("파일이름", sep="구분자", header=T)

    CSV 데이터 파일 읽기( 변수 구분자는 쉼표) read.csv("파일이름", header=T) 주의1) 주소, 이름, 성 등의 텍스트를 요인으로 인식
    해결1) read.csv("파일이름", header=T, as.is=T)
    CSV 데이터 파일로 출력(변수 구분자는 쉼표) write.csv(행렬 또는 데이터프레임, "파일이름", row.names=F)

    주의1) 1행이 변수명으로 자동 인식하지만 변수명이 아닐 경우
    해결1) write.csv(dfm, "파일이름", col.names=F)

     주의2) 1열에 레코드 번호를 자동 생성하지만 레코드 번호를 생성하지 않을 경우
    해결2) write.csv(dfm, "파일이름", row,names=F)

    웹에서 데이터 파일을 읽어올 때(변수 구분자는 쉼표) read.csv("주소")
    read.table("주소")

    what=numeric(0)
    토큰을 숫자로 해석
    what=integer(0)
    토큰을 정수로 해석
    what=(complex(0)
    토큰을 복소수로 해석
    what=character(0)
    토큰을 문자로 해석
    what=logical(0)
    토큰을 논리값으로 해석

    html에서 테이블 읽어 올 때  library(XML)
    url<-'주소'
    t<-readHTMLTable(url)

     

    복잡한 구조의 파일(웹 테이블) 읽기 lines<-readLines("a.txt", n=num)
    token<-scan("a.txt", what=numeric(0)
    token<-scan("a.txt",what=list(v1=character(0), v2=numeric(0))
    token<-scan("a.txt", what=list(v1=character(0), v2=numeric(0), n=num, nlines=num, skip=num, na.strings=list)

     

     

    '자격증 > ADsP 03 데이터 분석' 카테고리의 다른 글

    3장 데이터마트 - 2  (0) 2020.06.04
    3장 데이터마트 - 1  (0) 2020.06.04
    1장 데이터 분석 개요  (0) 2020.06.03
    R 데이터 마트 - reshape 실습  (0) 2020.02.09
    R 기초 실습  (0) 2020.02.09
Designed by Tistory.