전체 글 (228) 썸네일형 리스트형 R 교차표, 카이제곱 검정 car R 팩터 (Factor) # R의 자료구조 1. vector : 같은 데이터 타입을 갖는 1차원 배열구조a R 박스 플롯 그래프 # 사분위수 그래프 ( 박스 플롯 그래프) 박스플롯 : 많은 데이터를 그림을 이용하여 집합의 범위와 중앙값을 빠르게확인 할 수 있으며 또한 통계적으로 이상치값이 있는지 빠르게 확인이 가능한 시각화 기법 평균값과 중앙값과 최빈값만으로는 데이터 분석을 하기 부족한 경우가 있다.평균 데이터는 데이터의 중심이 어디쯤인지 알려주지만 특정 데이터가 평균을중심으로 어떻게 분포가 되어있는지는 알려주지 않는다. 예제: 어느 농구단의 감독이 아래의 3명의 농구선수중에 한 명을 선택하려고 한다. 아래의 3명의 선수의 게임별 점수를 가지고 한명을 고른다면 어떤 선수를 골라야 하나? 농구 선수 3명이 각각의 게임당 득점한 점수 x1 R 히스토그램 그래프 # R에서 히스토그램 그래프 그리기 하나의 속성에 대한 데이터의 분포를 시각적으로 표현하는 그래프 중고차 가격 데이터 : usedcars.csv usedcars R 라인 그래프 # R에서 라인 그래프 그리기 시간 순서에 따른 데이터의 변화를 볼때 유용한 그래프 예제 : 아래의 데이터로 plot(점) 그래프 그리기 cars R 막대 그래프 # R로 막대 그래프 그리기 예제 : emp 테이블의 월급으로 기본적인 막대 그래프를 그리기 barplot(emp$sal) 예제 : 위의 그래프의 제목을 Salary Bar Chart 라고 이름을 붙이기 barplot(emp$sal, main="Salary Bar Chart") 예제 : 막대 그래프 x 축에 사원이름을 붙이기 barplot(emp$sal, main="Salary Bar Chart", names.arg= emp$ename) 예제 : 막대 그래프의 x축과 y축의 이름을 각각 이름, 월급이라 붙이기 barplot(emp$sal, main="Salary Bar Chart", names.arg= emp$ename, xlab="이름", ylab="월급" ) 예제 : 막대 그래프의 색깔을 파란색으로 .. R 순위 부여하기 # R에서 순위를 출력하기 문법: rank 함수 예제: 이름, 월급, 월급에 대한 순위를 출력하시오 ! data.table( 이름=emp$ename, 월급=emp$sal, 순위= rank(-emp$sal, ties.method="min") ) 설명 : rank에 마이너스(-)를 사용하면 월급이 높은 것부터 매겨진다. ties.method 옵션:1. min : 오라클의 rank 와 같다 ( 동일한 점수 = 동일한 순위 )2위가 두 명일 경우 다음 출력되는 순위는 4위2. first : 오라클의 rank 와 같은데 순위가 같은 데이터가 있으면 인덱스 순서가 먼저 나온 데이터를 높은 순위로 부여3. max : 2등이 두명이면 둘다 3등으로 출력 예제 : 순위별로 출력 library(doBy)orderBy( ~.. R로 SQL 조인하기 ■ SQL 과 R 비교 (조인) Oracle vs R equi joinnon equi join merge outer joinself join 예제 : 이름(emp.csv)과 부서 위치(dept.csv)를 출력하시오 ! SQL> select e.ename, d.loc from emp e, dept d where e.deptno = d.deptno; R> x x[ , c("ename","loc") ] 예제 : 부서 위치가 DALLAS인 사원들의 이름과 월급과 부서 위치를 출력 x x select 사원.ename, 관리자.ename from emp 사원, emp 관리자 where 사원.mgr = 관리자.empno; R> x x[ , c("ename.x", "ename.y") ] 예제 : 위의 결과를 다시 출력.. 이전 1 ··· 8 9 10 11 12 13 14 ··· 29 다음