SiLaure's Data
[Seaborn] 07. Heatmap 본문
- Heatmap
- 정사각형 그림에 데이터에 대한 정도 차이를 색 차이로 보여주는 plot.
--feature 간 수치의 차이가 있어야 한다. - 말 그대로 heatmap이기 때문에, 열화상 카메라로 사물을 찍은 것처럼 정보의 차이를 보여준다.
- pairplot과 비슷하게 feature간 관계를 시각화할 때 많이 사용하며, pairplot과 함께 쓰는 경우가 많다.
- feature의 수가 많을 때 정보의 차이를 확연하게 확인할 수 있다.
- 상관계수로 계산한 행렬로 차이를 나타낸다.
- 상관계수 : -1과 1사이의 수로, 1에 가까울 수록 양의 상관관계, -1에 가까울 수록 음의 상관관계이다.
0이면 관계가 없는 서로 독립된 feature이다.
- 상관계수 : -1과 1사이의 수로, 1에 가까울 수록 양의 상관관계, -1에 가까울 수록 음의 상관관계이다.
heatmap을 찍기 전 각 feature간 상관관계를 파악하기 위해 Correlation matrix(상관계수)를 만든다.
corr() 을 사용하면 자동으로 원본에서 계산이 안되는 string을 제외해 준다. (전처리)
penguins.corr()
출력 :
corr = penguins.corr()
sns.heatmap(corr)
출력 :
color-bar : 정보의 차이 (양의 상관관계 - 0 - 음의 상관관계)
'Records of > Learning' 카테고리의 다른 글
[Web] HTTP method(GET, POST) / HTML element(태그, 속성, 값) (0) | 2021.07.29 |
---|---|
[Numpy] 04. Array Indexing (0) | 2021.07.28 |
[Seaborn] 06. scatterplot & pairplot (0) | 2021.07.26 |
[Seaborn] 05. lineplot & pointplot (0) | 2021.07.26 |
[Seaborn] 04. boxplot & violinplot --분포정보 plotting (0) | 2021.07.26 |
Comments