목록Computer language/Python (2)
nayonngme
📚 데이터 구조 변수로 만들어 분석할 수 있는 정보의 종류 2가지 : 숫자형, 범주형 데이터 📚 탐색적 데이터 분석 (1) = 최소값 (2) = 1사분위수(25%) (3) = 중앙값(50%, median) (4) = 3사분위수 (5) = max와 (3사분위수 + 1.5*IQR)를 비교했을 때 작은 값 ((4)-(2)) = 사분위수 범위(IQR) (5) 뒤에 있는 ○들) = 이상치 (1-2사이의 거리), (4-5사이의 거리) = 1.5*IQR sns.barplot(x="뫄뫄", y="롸롸", data=titanic) plt.show() seaborn.barplot은 범주별(x), 숫자(y)의 평균을 비교하는 그래프 => 승선 지역 별(Embarked) 운임(Fare)의 평균 가운데 직선은 신뢰구간 Matp..
문제1 .loc을 이용하여 10행까지, 열은 crim, lstat, medv를 조회하시오. boston 데이터셋의 데이터을 이용한다. .loc를 이용한 분석 방법은 다음과 같다. boston.loc [ :9 , ['crim,'lstat','medv']] 문제2 .iloc를 사용하여 문제1과 같은 결과가 나오도록 하시오. 먼저, boston 데이터셋의 열들을 확인한다. boston.columns -> 'crim', 'lstat', 'medv 열은 각각 0,11,12번째에 위치하였음을 알 수 있다. 위에서 얻은 결과를 토대로 iloc를 활용한다. boston.iloc[ :10 , [0,11,12] ] loc와 iloc의 차이 -> loc [ :9 , ]는 index 9를 포함한다. -> iloc [ :10 ..