본문 바로가기

나 취준생/파이썬

(43)
파이썬 단일 회귀분석 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # 1. 데이터 로드, 확인 df = pd.read_csv('c:\\data\\auto-mpg.csv', header=None) df.columns = ['mpg','cylinders','displacement','horsepower','weight','acceleration','model year','origin','name'] print(df.head()) pd.set_option('display.max_columns', 10) # 행 10개까지 출력 print(df.head()) # 2. 데이터 탐색 print(df.info()) ho..
파이썬 의사결정트리 독버섯 데이터 import pandas as pd # 데이터 전처리를 위해서 import seaborn as sns # 시각화를 위해서 df = pd.read_csv('d:\\data\\mushrooms.csv') df = pd.get_dummies(df, drop_first=True) #print(df.shape) # (8124, 23) print(df) print(df.shape) # (8124, 119) # get_dummies 함수를 이용해서 값의 종류에 따라 # 전부 0 아니면 1로 변환함 # DataFrame 확인 print(df.shape) # (8124, 23) print(df.info()) # 전부 object (문자)형으로 되어있음 print(df.describe()) # 독립, 종속 ..
파이썬 나이브 베이즈 import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn import metrics import numpy as np import pandas as pd # 1. 데이터 준비 col_names = ['sepal-length', 'sepal-width','petal-length', 'petal-width','Class'] # csv 파일에서 DataFrame을 생성 dataset = pd.read_csv('c:\\data\\iris2.csv', encoding='UTF-8', header=None, names=col_names) #print(dataset) # DataFrame 확인 pri..
파이썬 knn import pandas as pd import seaborn as sns df = pd.read_csv("c:\\data\\wisc_bc_data.csv") # R과는 다르게 stringsAsFactors=T 안해줘도 된다 # DataFrame 확인 print(df.shape) # (569, 32) 행,열 확인 print(df.info()) # 데이터구조 확인 print(df.describe()) # 요약통계량 확인 # Dataframe 선택 연습 # dataframe[행][열] == dataframe[조건][컬럼명] print(df.iloc[0:5, ]) # 0~4번째행 print(df.iloc[-5: ,]) # 끝에서 5번째 행 끝까지 # df.iloc을 이용하면 컬럼명이 없더라도 원하는 행을 선택..
카카오 비밀지도 def secretmap(n,arr1,arr2): map_A=[] map_B=[] for i in arr1: code='' for j in range(n): if i%2==1: code+='#' else: code+=' ' i=i//2 code=code[::-1] map_A.append(code) #print(map_A) for i in arr2: code='' for j in range(n): if i%2==1: code+='#' else: code+=' ' i=i//2 code=code[::-1] map_B.append(code) #print(map_B) final_map=[] for i in range(n): code='' for j in range(n): if map_A[i][j]=='#' or ..
자카드 유사도 + 카카오 문제 자카드 유사도는 두 문장을 각각의 집합으로 만든 뒤두 집합을 통해 유사도를 측정하는 알고리즘이다. 그림 출처 : https://lsjsj92.tistory.com/443 두 문장의 교집합 개수는 6개, 합집합 개수는 24개로 자카드 유사도는 0.25가 된다. 예제 : 두 집합의 유사도 구하기1 A={1,2,3} B= {2,3,4} J(AnB)={2,3}J(AUB)={1,2,3,4} J(A,B)= 2 / 4 = 0.5 예제 : 두 집합의 유사도 구하기2 A={FR,RA,AN,NC,CE} B= {FR,RE,EN,NC,CH} J(AnB)={FR,RC}J(AUB)={FR,RA,AN,NC,CE,RE,EN,CH} J(A,B)= 2 / 8 = 0.25 # 파이썬으로 집합 자료구조 만들기 a={1,2,3,4}b={2,..
LRU 알고리즘 + 카카오 문제 LRU 알고리즘이란 Oracle DATABASE의 메모리 관리를효율적으로 하기 위해 고안된 대표적인 알고리즘으로최신 데이터를 메모리에 유지시키고오래된 데이터는 메모리에서 내보내게 하는 알고리즘 예를 들어, SQL > select sal from emp where ename='scott'; 위 SQL 문장은 메모리에 정보가 올라와있다면 1초, -> cashe hit메모리에 정보가 없어 디스크에서 조회하면 5초가 걸린다. -> cashe miss (걸리는 시간은 예시일 뿐) 하지만 메모리 공간이 한정되어 있어, 무한히 데이터를 올릴 수 없다.따라서 오래된 데이터는 버리고 최신 데이터로 올린다. '최근에 내가 검색한 데이터는 다시 검색할 확률이 높을거야' 라고 가정한다. 예제 : 2017 카카오 블라인드 1차..
재귀함수 재귀 함수 : 반복문 + 스택 구조의 결합(나중에 들어간게 먼저 나오는 구조) 재귀 함수의 특징 : 재귀 함수는 함수 내에서 다시 자기 자신을 호출한 후그 함수가 끝날 때까지 함수 호출 이후의 명령문을 수행하지 않는다. 재귀 함수의 장점 :1. loop문을 별도로 작성하지 않아도 된다.2. 코드가 간결해진다. 123456789def hap(a,b): return (a+b)def gob(a,b): return (a*b)def hap_gob(a,b): k=hap(a,b) #5 m=gob(a,b) #6 return k+mprint(hap_gob(2,3)) #11 위처럼 파이썬은 함수 내에서 다른 함수를 불러오는 것이 가능하다.재귀 함수는 다른 함수가 아닌 자기 자신을 불러오는 것 # 재귀 함수를 통해 1까지의..