교재링크(광고 아님): freelec.co.kr/book/인공지능을-위한-수학/

 

※ 이번 절은 교재에 사용된 용어가 실제로는 일반화된 용어인데, 다소 협소하게 정의한 경향이 있어 이를 바로 잡고자 교재의 내용을 다소 부정하는 기술을 하였다.

 

무차원수(dimensionless quantity)

교재에는 dimensionless number라고 표기되어 있는데, 위 표기가 좀 더 맞는 것 같다. 무차원이라고 하지만, 위키 등에서 좀 더 자세한 설명을 읽어보면 1차원 값 역시 무차원수로 보는 것 같다. 즉, 3차원이라도 각 차원의 값 역시 무차원수라고 보면 된다. 또한 몇차원이 되었든 그에 대한 스칼라 값(예를 들어 벡터의 크기) 같은 것도 무차원수이다.

 

 

상관계수(correlation coefficient)

상관계수는 어떤 변수 간의 상관도를 -1 ~ 1 범위로 가정(assume)한 값 자체를 뜻한다. 즉, 상관계수라는 용어는 이 일반화된 정의 밖에 없고, 교재에서 상관계수라고 표현한 아래의 공식은 공분산에 대한 것으로 한정해야 한다.

$$ \rho = \frac{cov(X, Y)}{\sigma_X \sigma_Y} $$

위 공식은 공분산을 X,Y 각 표준편차의 곱으로 나눈 값을 나타낸다. 그리고, 애초에 공분산 값이 무차원이다. 교재에 표현된 상관계수 공식 때문에 무차원수가 되는 것은 아니다. 

어쨌든, 위 공식이 상관계수 전체를 커버하는 것은 아니고, 공분산에 대한 상관도만 도출하는 것이다. 다른 문서를 참고해보았을 때, 상관계수는 케이스마다 다르게 추출해야 하는 것으로 보인다.

다시 상관계수로 돌아가서 상관계수가 가정하는 범위에 대해 설명하면 -1에 가까울 수록 음의 관계(역관계)가 강하다고 할 수 있고, 1에 가까울 수록 양의 관계(순관계)가 강해지며, 0에 가까울 수록 두 변수 간의 관계는 희미해진다고 보면 된다.

 

 

Posted by JMAN