본문 바로가기

나 취준생/프로젝트

(3)
토이 프로젝트 - 사람인 '데이터 분석'을 분석 3 두번째 주제- 경력이 오를수록 지원할 수 있는 기업 형태 수 차이- 경력이 오를수록 지원할 수 있는 기업의 연봉 차이 데이터 분석가 채용 공고를 보면서 느낀 점은 경력직을 정말 선호한다.사실 내가 수집한 데이터도 '채용 기준'일 뿐이라서, 우대 사항에 써있는 경력직 선호까지는 담지 못했다.도대체 경력직은 시간이 지날수록 얼마나 많은 데이터 분석가 업무를 지원할 수 있을까?한 번 시각화해보자. 1. 경력 - 기업 형태 # 사용할 데이터 이런 느낌의 테이블이다.예를 들면 신입(경력없음)이 지원할 수 있는 대기업의 수는 40곳이며,6개월의 경력이 생기면 62곳을 지원할 수 있게 된다.데이터는 총 10년차까지 이루어져있다. 그럼 시각화를 시작해보자. # 코드 일부만 작성 sql = """ select compa..
토이 프로젝트 - 사람인 '데이터 분석'을 분석 2 첫번째 주제 - 기업 형태별 제공하는 복리후생의 특징은 무엇인가? - 공통적인 복리후생은? 테이블에는 보기와 같이 약 20개 종류의 기업 형태가 있다. 그리고 다음과 같은 형태로 테이블이 구성되어 있다. A1~H11까지 welfare가 있는데, 코드마다 복리후생의 종류를 의미한다. 예를 들어 A1은 건강검진, A2는 의료비 지원을 뜻한다. 그러므로 첫번째 행은 신입(무경력)이 지원할 수 있는 대기업 중 건강 검진을 지원하는 곳은 14곳이라는 것을 의미한다. 그럼 기업 형태 별로, 복지별로 구분했을 때 어느 형태의 기업이 어떤 복지를 가장 많이 지원하고 있는지 알아보았다. 테이블에서 가장 높은 경력은 5년차이다. 5년차로 따로 한정한 이유는, 신입이 지원할 수 있는 기업과 경력직이 지원할 수 있는 기업이 ..
토이 프로젝트 - 사람인 '데이터 분석'을 분석 지금까지 파이썬, SQL, 리눅스와 각종 툴을 조금 배워봤으니 배운 것들을 활용해서 데이터 분석의 전반적인 흐름을 정말 미흡하게나마 해보고자 정말 작은 프로젝트를 시작하게 되었다. # 내가 생각하는 데이터 사이언스 업무 과정 문제 설정 - 스킬 활용 - 문제 해결 과정 ( 데이터 수집 - 데이터 분석 - 분석 결과 도출 - 결과 시각화 ) # 내가 선택한 스킬 1. 데이터 수집 - 파이썬 크롤링 2. 데이터 분석 - SQL 3. 분석 결과 시각화 - 파이썬, R 추가적으로 리눅스 서버를 활용하기 위해 Centos7을 통하여 MariaDB를 연동 # 프로젝트 주제 캐글에 다양한 자료들이 있었지만, 내가 알아보고 싶은 흥미로운 주제를 찾지 못했고, 또 뭔가 내 주변의 일상적인 문제를 주제로 삼고 싶었다. 지..