본문 바로가기

R27

R 연속변수 시각화 - 상자그림 boxplot 변수 개수 변수 형태 그래프 일변량 연속형 데이터 히스토그램 (hist) 상자그림 (boxplot) 범주형 데이터 (명목형, 수치형) 막대 그래프 (barplot) 파이 차트 (pie) 점 차트 (dotchart) 다변량 연속형 데이터 산점도(행렬) (plot, pairs) 범주형 데이터 모자이크 플롯 (mosaicplot) ◎ 상자그림 boxplot(x, ..., range = 1.5, width = NULL, notch = FALSE, outline = TRUE, names, plot = TRUE, border = par("fg"), col = "lightgray", pars = list(boxwex = 0.8, staplewex = 0.5, outwex = 0.5), horizontal = FALS.. 2021. 3. 30.
R 연속변수 시각화 - 히스토그램 hist 변수 개수 변수 형태 그래프 일변량 연속형 데이터 히스토그램 (hist) 상자 그래프 (boxplot) 범주형 데이터 (명목형, 수치형) 막대 그래프 (barplot) 파이 차트 (pie) 점 차트 (dotchart) 다변량 연속형 데이터 산점도(행렬) (plot, pairs) 범주형 데이터 모자이크 플롯 (mosaicplot) ◎ 히스토그램 hist(x, freq = NULL, probability = !freq, density = NULL, angle = 45, col = "lightgray", border = NULL, main = paste("Histogram of" , xname), xlim = range(breaks), ylim = NULL, xlab = xname, ylab, axes = T.. 2021. 3. 24.
R 이산변수 시각화 - 모자이크 플롯 mosaicplot 변수 개수 변수 형태 그래프 일변량 연속형 데이터 히스토그램 (hist) 상자 그래프 (boxplot) 범주형 데이터 (명목형, 수치형) 막대 그래프 (barplot) 파이 차트 (pie) 점 차트 (dotchart) 다변량 연속형 데이터 산점도(행렬) (plot, pairs) 범주형 데이터 모자이크 플롯 (mosaicplot) ◎ 모자이크 플롯 mosaicplot(x, main = deparse1(substitute(x)), sub = NULL, xlab = NULL, ylab = NULL, sort = NULL, off = NULL, dir = NULL, color = NULL, shade = FALSE, cex.axis = 0.66, las = par("las"), border = NULL, ..... 2021. 3. 21.
R 이산변수 시각화 - 파이차트 pie 변수 개수 변수 형태 그래프 일변량 연속형 데이터 히스토그램 (hist) 상자 그래프 (boxplot) 범주형 데이터 (명목형, 수치형) 막대 그래프 (barplot) 파이 차트 (pie) 점 차트 (dotchart) 다변량 연속형 데이터 산점도(행렬) (plot, pairs) 범주형 데이터 모자이크 그래프 (mosaicplot) ◎ 파이차트 pie(x, labels = names(x), edges = 200, radius = 0.8, clockwise = FALSE, init.angle = if(clockwise) 90 else 0, density = NULL, angle = 45, col = NULL, border = NULL, lty = NULL, main = NULL, ...) x 양수값을 갖는 .. 2021. 3. 20.
R 이산변수 시각화 - 점차트 dotchart 변수 개수 변수 형태 그래프 일변량 연속형 데이터 히스토그램 (hist) 상자 그래프 (boxplot) 범주형 데이터 (명목형, 수치형) 막대 그래프 (barplot) 파이 차트 (pie) 점 차트 (dotchart) 다변량 연속형 데이터 산점도(행렬) (plot, pairs) 범주형 데이터 모자이크 그래프 (mosaicplot) ◎ 점차트 dotchart(x, labels = NULL, groups = NULL, gdata = NULL, cex = par("cex"), pt.cex = cex, pch = 21, gpch = 21, bg = par("bg"), color = par("fg"), gcolor = par("fg"), lcolor = "gray", xlim = range(x[is.finite(.. 2021. 3. 18.
R 이산변수 시각화 - 막대그래프 barplot 변수 개수 변수 형태 그래프 일변량 연속형 데이터 히스토그램 (hist) 상자 그래프 (boxplot) 범주형 데이터 (명목형, 수치형) 막대 그래프 (barplot) 파이 차트 (pie) 점 차트 (dotchart) 다변량 연속형 데이터 산점도(행렬) (plot, pairs) 범주형 데이터 모자이크 그래프 (mosaicplot) ◎ 막대 그래프 barplot(height, width = 1, space = NULL, names.arg = NULL, legend.text = NULL, beside = FALSE, horiz = FALSE, density = NULL, angle = 45, col = NULL, border = par("fg"), main = NULL, sub = NULL, xlab = N.. 2021. 3. 17.
R 산점도 Scatter - 산점도행렬/3차원산점도 > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa iris 데이터를 사용해 산점도 행렬과 3차원 산점도 그래프를 설명하려 한다. ◎ 산점도 행렬 pairs( x, ... ) pairs( formula, data = NULL, ... ) 산점도 행렬은 다변량 데이터에서 변수 간의 산점도들을 그린 그래프이다. 변수들 간의 상관관계 등의 특징을 알아보는데 유용하다. pa.. 2021. 3. 15.
R 산점도 Scatter - plot/그래프 옵션 산점도(Scatter Plot)는 주어진 데이터를 점으로 표시해 시각화한 그래프이다. 데이터의 분포를 한눈에 살펴볼 수 있어 유용하다. ◎ plot() 함수 plot(x, y, ...) R에서 산점도는 plot() 함수로 그린다. plot( X좌표, Y좌표 )의 형식을 사용하기도 하지만 plot( Y좌표 ~ X1좌표 + X2좌표 + ... )의 포뮬라 형식을 사용하면 여러개의 그래프를 차례대로 출력해준다.(콘솔창에서 엔터키를 누르면 그래프를 볼 수 있다.) > x = runif(15, 1, 100); x [1] 24.15888 86.42449 80.39122 46.64328 22.62998 70.58812 [7] 29.39419 86.16871 79.72915 19.48776 32.10229 70.690.. 2021. 3. 12.
R 문자열 처리 - stringr 패키지/정규표현식 ※ R 문자열 처리 - base 패키지 small22.tistory.com/28 R 문자열 처리 - base 패키지 ※ R 문자열 처리 - stringr 패키지/정규표현식 small22.tistory.com/29 ◎ Base Package 문자열 크기 nchar(x, type = "chars", allowNA = FALSE, keepNA = NA) type "bytes", "chars", "width" 3.. small22.tistory.com ◎ Stringr Package str_extract 문자열의 위치(index) 출력 str_extract_all 문자열의 위치(index) 전체 출력 str_length 문자열 길이 출력 str_locate 문자열에서 특정 문자열 패턴의 첫번째 위치 찾기 str.. 2020. 12. 18.
R 문자열 처리 - base 패키지 ※ R 문자열 처리 - stringr 패키지/정규표현식 small22.tistory.com/29 R 문자열 처리 - stringr 패키지/정규표현식 ※ R 문자열 처리 - base 패키지 small22.tistory.com/28 type "bytes", "chars", "width" 3.." data-og-host="small22.tistory.com" data-og-source-url="https://small22.tistory.com/28" data-og-url="https://.. small22.tistory.com ◎ Base Package 문자열 길이 nchar(x, type = "chars", allowNA = FALSE, keepNA = NA) type "bytes", "chars", "wi.. 2020. 12. 15.
R 내장데이터셋 Built-in Dataset - attach/detach ◎ 내장 데이터셋 R에서 기본으로 제공하는 데이터셋이 있다. 이 내장 데이터셋은 보통 교육이나 연습 목적으로 많이 활용된다. 그중 가장 많이 활용되는 데이터는 역시 iris일 것이다. Dataset 목록 > data() 콘솔창에 data()를 입력하면 새창이 열리고, R에서 제공하는 내장데이터셋의 목록과 간단한 소개정도가 나열되어 있는 목록을 볼 수 있다. 참고로 Rstudio를 IDE(통합개발환경)로 사용하고 있다. Dataset 불러오기 > iris Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1.. 2020. 12. 12.
R 데이터 분리, 병합, 정렬 - split/subset/merge/sort/order ◎ split > result = split(iris, iris$Species) > result $setosa Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa ... $versicolor Sepal.Length Sepal.Width Petal.Length Petal.Width Species 51 7.0 3.2 4.7 1.4 versicolor 52 6.4 3.2 4.5 1.5 versi.. 2020. 12. 5.
R table 계열 함수 - 집계함수 > a = c('Kim', 'Lee', 'Park', 'Lee', 'Park', 'Kim', 'Kim') > b = c('M', 'F', 'M', 'F', 'M', 'F', 'M') > c = c('A', 'B', 'A', 'B', 'O', 'O', 'B') > df = data.frame(name=a, gender=b, blood=c) > df name gender blood 1 Kim M A 2 Lee F B 3 Park M A 4 Lee F B 5 Park M O 6 Kim F O 7 Kim M B 이름, 성별, 혈액형으로 구성되는 정보를 데이터프레임으로 만들어 이를 이용해 집계함수를 설명하려 한다. ◎ table() table( ... , exclude = if (useNA == "no") c(N.. 2020. 11. 26.
R apply 계열 함수/replicate/sweep/aggregate ◎ apply 계열 함수 함수 적용 반환 apply() 행렬, 배열, 데이터프레임 벡터, 리스트, 행렬, 배열 lapply() 벡터, 리스트, 데이터프레임 리스트 sapply() 벡터, 리스트, 데이터프레임 벡터, 행렬, 배열 tapply() 리스트, 행렬 mapply() 벡터, 리스트, 행렬 apply() apply(X, MARGIN, FUN, ...) MARGIN 함수를 적용하는 방향 1은 행, 2는 열, c(1,2)는 행과 열 모두를 의미 FUN 적용할 함수 apply() 함수는 배열 or 행렬의 행/열 방향으로 동일한 특정 함수가 적용되도록 한다. 실행결과가 어떤 형태로 반환될 것인지는 데이터의 타입과 적용함수의 반환 값에 따라 바뀌며, 예상이 가능하다. > mat = matrix(1:12, 3,.. 2020. 11. 16.
R 벡터 Vector 관련 내장함수 최대최소 함수 min(x, na.rm=FALSE) 원소(벡터)의 최소값 max(x, na.rm=FALSE) 원소(벡터)의 최대값 which.min(x) 원소(벡터) 내의 최소값 인덱스 which.max(x) 원소(벡터) 내의 최대값 인덱스 pmin(x, na.rm=FALSE) 여러 벡터에서 병렬 별로 최소값 pmax(x, na.rm=FALSE) 여러 벡터에서 병렬 별로 최대값 > vec = sample(1:100, 10) > vec [1] 41 85 38 6 5 95 42 8 43 51 > min(vec) [1] 5 > max(vec) [1] 95 > which.min(vec) [1] 5 > which.max(vec) [1] 6 > v1 = sample(1:100, 5) > v2 = sample(1:10.. 2020. 11. 10.
반응형