1 공분산 공분산은 두 변수가 선형적인 관계를 가지는가에 대한 지표이다. $$COV(X, Y) = E[(X-E[X])(Y-E[Y])]$$ E는 평균을 뜻하고 COV는 공분산을 뜻한다. 식을 보면 알겠지만 분산이랑 비슷한 식인 것을 알 수 있다. 공분산은 COV의 절댓값이 크면 클수록 선형적인 관계를 가지고, 0에 가까울수록 어떤 선형적인 관계도 가지지 않는다. 또한 공분산이 0보다 크다면 우상향하는 그래프이고 0보다 작다면 우하향하는 그래프가 나온다. 2 상관계수 상관계수는 공분산을 정규화한 것이다. 그래서 공분산과 똑같은 특징을 가지는데 상관계수의 절댓값이 1보다 커지지 않으므로 1에 가까울수록 선형적인 관계를 가지고, 0에 가까울수록 선형적인 관계를 가지지 않는다라고 말할 수 있겠다. 그리고 보통 0..