파이썬 단일 회귀분석
import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # 1. 데이터 로드, 확인 df = pd.read_csv('c:\\data\\auto-mpg.csv', header=None) df.columns = ['mpg','cylinders','displacement','horsepower','weight','acceleration','model year','origin','name'] print(df.head()) pd.set_option('display.max_columns', 10) # 행 10개까지 출력 print(df.head()) # 2. 데이터 탐색 print(df.info()) ho..
자카드 유사도 + 카카오 문제
자카드 유사도는 두 문장을 각각의 집합으로 만든 뒤두 집합을 통해 유사도를 측정하는 알고리즘이다. 그림 출처 : https://lsjsj92.tistory.com/443 두 문장의 교집합 개수는 6개, 합집합 개수는 24개로 자카드 유사도는 0.25가 된다. 예제 : 두 집합의 유사도 구하기1 A={1,2,3} B= {2,3,4} J(AnB)={2,3}J(AUB)={1,2,3,4} J(A,B)= 2 / 4 = 0.5 예제 : 두 집합의 유사도 구하기2 A={FR,RA,AN,NC,CE} B= {FR,RE,EN,NC,CH} J(AnB)={FR,RC}J(AUB)={FR,RA,AN,NC,CE,RE,EN,CH} J(A,B)= 2 / 8 = 0.25 # 파이썬으로 집합 자료구조 만들기 a={1,2,3,4}b={2,..