본문 바로가기

나 취준생/R

(22)
R 순위 부여하기 # R에서 순위를 출력하기 문법: rank 함수 예제: 이름, 월급, 월급에 대한 순위를 출력하시오 ! data.table( 이름=emp$ename, 월급=emp$sal, 순위= rank(-emp$sal, ties.method="min") ) 설명 : rank에 마이너스(-)를 사용하면 월급이 높은 것부터 매겨진다. ties.method 옵션:1. min : 오라클의 rank 와 같다 ( 동일한 점수 = 동일한 순위 )2위가 두 명일 경우 다음 출력되는 순위는 4위2. first : 오라클의 rank 와 같은데 순위가 같은 데이터가 있으면 인덱스 순서가 먼저 나온 데이터를 높은 순위로 부여3. max : 2등이 두명이면 둘다 3등으로 출력 예제 : 순위별로 출력 library(doBy)orderBy( ~..
R로 SQL 조인하기 ■ SQL 과 R 비교 (조인) Oracle vs R equi joinnon equi join merge outer joinself join 예제 : 이름(emp.csv)과 부서 위치(dept.csv)를 출력하시오 ! SQL> select e.ename, d.loc from emp e, dept d where e.deptno = d.deptno; R> x x[ , c("ename","loc") ] 예제 : 부서 위치가 DALLAS인 사원들의 이름과 월급과 부서 위치를 출력 x x select 사원.ename, 관리자.ename from emp 사원, emp 관리자 where 사원.mgr = 관리자.empno; R> x x[ , c("ename.x", "ename.y") ] 예제 : 위의 결과를 다시 출력..
R 원형 그래프 예제 : 직업과 직업별 토탈 월급을 가지고 원형(pie) 그래프를 그리시오 ! x
R 그룹 함수 + 막대 그래프 # 그룹 함수 Oracle vs R 1. max max2. min min3. sum sum4. avg mean5. count length (세로) table (가로) 예제 : 최대 월급을 출력 max(emp$sal) 예제 : 직업이 SALESMAN인 사원들의 최대 월급을 출력! result select job, max(sal) from emp group by job; R> aggregate( sal~job, emp, max ) 문법 : aggregate(계산될 컬럼~그룹 기준을 가진 컬럼, 테이블명, 함수명) 예제 : 부서번호, 부서번호별 토탈 월급을 출력하시오 ! SQL> select deptno, sum(sal) from emp group by deptno; R> aggregate( sal~deptn..
R 함수 [문자 함수, 숫자 함수, 날짜 함수, 변환 함수, 일반 함수] # 함수 종류 1. 문자 함수2. 숫자 함수3. 날짜 함수4. 변환 함수5. 일반 함수 # 문자 함수 오라클 vs R upper toupperlower tolowersubstr substrreplace gsub 예제 : 이름과 직업을 출력하는데 소문자로 출력 library(data.table)data.table(이름=tolower(emp$ename), 직업=tolower(emp$job) ) 예제 : 이름을 출력하고 그 옆에 이름의 첫번째 철자부터 세번째 철자까지 출력 문법 : substr( 변수, 시작, 끝 ) SQL> select ename, substr(ename, 1, 3) from emp; R> data.table( 이름=emp$ename, 철자=substr(emp$ename,1,3) ) 예제 :..
R 데이터 조회, [논리 연산자, 비교 연산자] # R이란? 데이터 분석을 위한 통계 및 시각화를 지원하는 무료 소프트웨어파이썬과 비교해서 장점 : 데이터 시각화가 R이 더 예쁘다. # R을 왜 사용하는지 1. R은 공짜2. 데이터 분석을 위해 가장 많이 사용하는 통계 플랫폼3. 복잡한 데이터를 다양한 그래프로 표현 가능4. 분석을 위한 데이터를 쉽게 저장하고 조작할 수 있다.5. 누구든지 유용한 패키지를 생성해서 공유할 수 있고, 새로운 기능에 대한 전파가 빠름6. 어떠한 os에도 설치 및 이용 가능 ( 아이폰에도! ) # R의 자료구조 1. vector : 같은 데이터 타입을 갖는 1차원 배열 구조 2. matrix : 같은 데이터 타입을 갖는 2차원 배열 구조 3. array : 같은 데이터 타입을 갖는 다차원 배열 구조4. data.frame ..