SiLaure's Data

[Seaborn] 07. Heatmap 본문

Records of/Learning

[Seaborn] 07. Heatmap

data_soin 2021. 7. 26. 21:34

 

- Heatmap

  • 정사각형 그림에 데이터에 대한 정도 차이를 색 차이로 보여주는 plot.
    --feature 간 수치의 차이가 있어야 한다.
  • 말 그대로 heatmap이기 때문에, 열화상 카메라로 사물을 찍은 것처럼 정보의 차이를 보여준다.
  • pairplot과 비슷하게 feature간 관계를 시각화할 때 많이 사용하며, pairplot과 함께 쓰는 경우가 많다.
  • feature의 수가 많을 때 정보의 차이를 확연하게 확인할 수 있다.
  • 상관계수로 계산한 행렬로 차이를 나타낸다.
    • 상관계수 : -1과 1사이의 수로, 1에 가까울 수록 양의 상관관계, -1에 가까울 수록 음의 상관관계이다.
                    0이면 관계가 없는 서로 독립된 feature이다.

 

heatmap을 찍기 전 각 feature간 상관관계를 파악하기 위해 Correlation matrix(상관계수)를 만든다.
corr() 을 사용하면 자동으로 원본에서 계산이 안되는 string을 제외해 준다. (전처리)
penguins.corr()

출력 : 

대각선은 항상 1

 

 

corr = penguins.corr()
sns.heatmap(corr)

출력 : 

color-bar : 정보의 차이 (양의 상관관계 - 0 - 음의 상관관계)
Comments