nayonngme
[๋ฐ์ดํฐ๋ถ์ ๋ฐ ์๋ฏธ์ฐพ๊ธฐ] ํ์์ ๋ฐ์ดํฐ ๋ถ์ | ๊ฐ์ค๊ฒ์ | ๋ฐ์ดํฐ ๊ตฌ์กฐ ๋ณธ๋ฌธ
Computer language/Python
[๋ฐ์ดํฐ๋ถ์ ๋ฐ ์๋ฏธ์ฐพ๊ธฐ] ํ์์ ๋ฐ์ดํฐ ๋ถ์ | ๊ฐ์ค๊ฒ์ | ๋ฐ์ดํฐ ๊ตฌ์กฐ
nayonng 2022. 8. 17. 01:50๐ ๋ฐ์ดํฐ ๊ตฌ์กฐ
- ๋ณ์๋ก ๋ง๋ค์ด ๋ถ์ํ ์ ์๋ ์ ๋ณด์ ์ข ๋ฅ 2๊ฐ์ง : ์ซ์ํ, ๋ฒ์ฃผํ ๋ฐ์ดํฐ
๐ ํ์์ ๋ฐ์ดํฐ ๋ถ์
(1) = ์ต์๊ฐ
(2) = 1์ฌ๋ถ์์(25%)
(3) = ์ค์๊ฐ(50%, median)
(4) = 3์ฌ๋ถ์์
(5) = max์ (3์ฌ๋ถ์์ + 1.5*IQR)๋ฅผ ๋น๊ตํ์ ๋ ์์ ๊ฐ
((4)-(2)) = ์ฌ๋ถ์์ ๋ฒ์(IQR)
(5) ๋ค์ ์๋ โ๋ค) = ์ด์์น
(1-2์ฌ์ด์ ๊ฑฐ๋ฆฌ), (4-5์ฌ์ด์ ๊ฑฐ๋ฆฌ) = 1.5*IQR
sns.barplot(x="๋ซ๋ซ", y="๋กธ๋กธ", data=titanic)
plt.show()
- seaborn.barplot์ ๋ฒ์ฃผ๋ณ(x), ์ซ์(y)์ ํ๊ท ์ ๋น๊ตํ๋ ๊ทธ๋ํ
=> ์น์ ์ง์ญ ๋ณ(Embarked) ์ด์(Fare)์ ํ๊ท - ๊ฐ์ด๋ฐ ์ง์ ์ ์ ๋ขฐ๊ตฌ๊ฐ
- Matplotlib์์๋ barplot์ ๊ทธ๋ฆด ๋ ๋จผ์ ๋ฐ์ดํฐ ์ง๊ณ๋ฅผ ํด์ผ ํ๋ ๊ฒ๊ณผ ๋ฌ๋ฆฌ, seaborn.countplot์ ์ง๊ณ๋ฅผ ํฌํจํ์ฌ barplot์ ๊ทธ๋ฆฐ๋ค.
ex) ๋ํ ์กธ์
์ฌ๋ถ์ ์ด๋ํต์ ์ฌ ๊ฐ์
๊ณ ๊ฐ์ ์ดํ์ฌ๋ถ ๊ฐ์ ๊ด๊ณ ๋ถ์์ ์ํ ์ฐจํธ?
-> ๋ชจ์์ตํ๋กฏ
=> {๋ฒ์ฃผํ}: ๋ํ ์กธ์
์ฌ๋ถ/ {๋ฒ์ฃผํ}: ์ดํ์ฌ๋ถ
๐ ๊ฐ์ค๊ฒ์
- ๋ ์ฐ์ํ ๋ฐ์ดํฐ์ ๊ด๊ณ๊ฐ ๊ฐํ ์ ๋๋ฅผ ์์นํ ํ๋ ๋ฐฉ๋ฒ: ์๊ด๋ถ์
- ๋ชจ์ง๋จ์ ํ๊ท ๊ณผ ํ๋ณธ์ ํ๊ท ๊ฐ์ ์ฐจ์ด: ํ์ค์ค์ฐจ
- ์๊ด๊ด๊ณ์ ๊ฐํ ์ ๋๋ฅผ ๋ฐ์ง ๋, ์๊ด๊ณ์๊ฐ 1์ธ ์๊ธฐ ์์ ์ ์ ์ธํ๋ค.์๊ด๊ณ์ ํจ์
- data.corr()
'Computer language > Python' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ฐ์ดํฐ์ฒ๋ฆฌ/์ค์ต] .iloc์ .iloc์ ์ฐจ์ด (0) | 2022.08.14 |
---|
Comments