두번째 주제
- 경력이 오를수록 지원할 수 있는 기업 형태 수 차이
- 경력이 오를수록 지원할 수 있는 기업의 연봉 차이
데이터 분석가 채용 공고를 보면서 느낀 점은 경력직을 정말 선호한다.
사실 내가 수집한 데이터도 '채용 기준'일 뿐이라서, 우대 사항에 써있는 경력직 선호까지는 담지 못했다.
도대체 경력직은 시간이 지날수록 얼마나 많은 데이터 분석가 업무를 지원할 수 있을까?
한 번 시각화해보자.
1. 경력 - 기업 형태
# 사용할 데이터
이런 느낌의 테이블이다.
예를 들면 신입(경력없음)이 지원할 수 있는 대기업의 수는 40곳이며,
6개월의 경력이 생기면 62곳을 지원할 수 있게 된다.
데이터는 총 10년차까지 이루어져있다.
그럼 시각화를 시작해보자.
# 코드 일부만 작성
sql = """ select company,cnt from car_com
where career='신입';
"""
# cursor 객체를 이용해서 수행
cursor.execute(sql)
# select 된 결과셋 얻어오기
resultList = cursor.fetchall() # tuple 이 들어있는 list
df = pd.DataFrame(resultList)
df.columns = ['기업 형태(신입)', '기업 수']
print(df[['기업 형태(신입)','기업 수']])
# 시각화
result = df['기업 수']
result.index = df['기업 형태(신입)']
result.plot(kind='bar', color='skyblue')
중소가 역시나 압도적이다.
신입으로 대기업, 매출1000대 기업, 금융기관, 공기업, 교육기관, 코스피, 코넥스는 신입으로는 거의 불가능하다고 봐도 될 것 같다..!
그럼 내가 궁금한
2년차, 5년차, 10년차 별로 그래프를 그려보자.
가장 수가 높은 것으로 기대되는 10년차의 그래프를 참고하여
모든 그래프의 y축을 10년차 기준으로 두었다.
신입에는 약 1200개의 중소 기업을 지원할 수 있었는데, 2년차가 되면 지원할 수 있는 중소 기업이 2500을 넘어
약 2배 가량의 차이를 나타내었다.
5년차부터는 3000개 이상으로 넘어가며 의외로 5년차와 10년차 사이의 유의미한 차이는 아직 보이지 않는다.
너무 중소 기업의 수가 많다 보니 다른 기업 형태가 변해도 잘 눈에 띄지 않는다.
그러니 내가 궁금한 대기업만 모아 시각화해보자.
# 코드 일부만 작성
conn = mysql.connector.connect(**config)
# db select, insert, update, delete 작업 객체
cursor = conn.cursor()
# 실행할 select 문 구성
sql = """ select career,cnt from car_com
where company='대기업';
"""
# cursor 객체를 이용해서 수행한다.
cursor.execute(sql)
# select 된 결과 셋 얻어오기
resultList = cursor.fetchall() # tuple 이 들어있는 list
df = pd.DataFrame(resultList)
y_upper=[]
y_lower=[]
for i in df[1]:
y_upper.append(i+10)
y_lower.append(i-10)
plt.fill_between(df[0],y_lower,y_upper,alpha=0.2,color='pink')
plt.plot(df[0],df[1],color='red')
plt.show()
거의 모든 기업이
신입 ~ 2년차까지는 굴곡도 거의 없을 정도로 경력에 따른 선호도가 가파르게 오르고,
2년~4년차까지 역시 선호도가 차이가 심하지만 대기업이 특히 심하고,
스타트업 같은 경우는 2년차 이후 조금 비슷한 선호도를 나타낸다.
또한 대체적으로 4년차 이후 10년차 사이의 선호도의 차이는 크게 나타나지 않는 것으로 나타났다.
2. 경력 - 연봉
# 사용 데이터
saramin_5_career_pay_csv_final.py
# 코드 일부만 작성
conn = mysql.connector.connect(**config)
# db select, insert, update, delete 작업 객체
cursor = conn.cursor()
# 실행할 select 문 구성
sql = """ select pay,cnt from car_pay
where career='신입';
"""
# cursor 객체를 이용해서 수행한다.
cursor.execute(sql)
# select 된 결과 셋 얻어오기
resultList = cursor.fetchall() # tuple 이 들어있는 list
df = pd.DataFrame(resultList)
df.columns = ['연봉(신입)', '기업 수']
print(df[['연봉(신입)','기업 수']])
# 시각화
result = df['기업 수']
result.index = df['연봉(신입)']
result.plot(kind='bar', color='skyblue',ylim=[0,350])
# 코드 일부만 작성
conn = mysql.connector.connect(**config)
# db select, insert, update, delete 작업 객체
cursor = conn.cursor()
# 실행할 select 문 구성
sql = """ select career,cnt from car_pay
where pay='3800만 이상';
"""
# cursor 객체를 이용해서 수행한다.
cursor.execute(sql)
# select 된 결과 셋 얻어오기
resultList = cursor.fetchall() # tuple 이 들어있는 list
df = pd.DataFrame(resultList)
y_upper=[]
y_lower=[]
for i in df[1]:
y_upper.append(i+10)
y_lower.append(i-10)
plt.fill_between(df[0],y_lower,y_upper,alpha=0.2,color='pink')
plt.plot(df[0],df[1],color='red')
plt.xlabel('3800만원 기준')
plt.show()
사실 사람인의 연봉이 이렇게 제시된 경우는 많지 않기 때문에 일반화할 수는 없지만 ( 대부분 연봉 정보가 없다 )
구직 공고 기준으로는 4년차 기준으로 큰 변화가 없는 것으로 나타나는 것으로 보아, 5년차 이후부터는 4000만 이상의 제안이 대다수일 것이다.
'나 취준생 > 프로젝트' 카테고리의 다른 글
토이 프로젝트 - 사람인 '데이터 분석'을 분석 2 (0) | 2021.01.20 |
---|---|
토이 프로젝트 - 사람인 '데이터 분석'을 분석 (0) | 2021.01.20 |