교재링크(광고 아님): freelec.co.kr/book/인공지능을-위한-수학/
※ 이번 절은 교재에 사용된 용어가 실제로는 일반화된 용어인데, 다소 협소하게 정의한 경향이 있어 이를 바로 잡고자 교재의 내용을 다소 부정하는 기술을 하였다.
무차원수(dimensionless quantity)
교재에는 dimensionless number라고 표기되어 있는데, 위 표기가 좀 더 맞는 것 같다. 무차원이라고 하지만, 위키 등에서 좀 더 자세한 설명을 읽어보면 1차원 값 역시 무차원수로 보는 것 같다. 즉, 3차원이라도 각 차원의 값 역시 무차원수라고 보면 된다. 또한 몇차원이 되었든 그에 대한 스칼라 값(예를 들어 벡터의 크기) 같은 것도 무차원수이다.
상관계수(correlation coefficient)
상관계수는 어떤 변수 간의 상관도를 -1 ~ 1 범위로 가정(assume)한 값 자체를 뜻한다. 즉, 상관계수라는 용어는 이 일반화된 정의 밖에 없고, 교재에서 상관계수라고 표현한 아래의 공식은 공분산에 대한 것으로 한정해야 한다.
$$ \rho = \frac{cov(X, Y)}{\sigma_X \sigma_Y} $$
위 공식은 공분산을 X,Y 각 표준편차의 곱으로 나눈 값을 나타낸다. 그리고, 애초에 공분산 값이 무차원이다. 교재에 표현된 상관계수 공식 때문에 무차원수가 되는 것은 아니다.
어쨌든, 위 공식이 상관계수 전체를 커버하는 것은 아니고, 공분산에 대한 상관도만 도출하는 것이다. 다른 문서를 참고해보았을 때, 상관계수는 케이스마다 다르게 추출해야 하는 것으로 보인다.
다시 상관계수로 돌아가서 상관계수가 가정하는 범위에 대해 설명하면 -1에 가까울 수록 음의 관계(역관계)가 강하다고 할 수 있고, 1에 가까울 수록 양의 관계(순관계)가 강해지며, 0에 가까울 수록 두 변수 간의 관계는 희미해진다고 보면 된다.
'Book Study > 인공지능을 위한 수학' 카테고리의 다른 글
5장 선형회귀(1절:회귀 모델로 주택 가격 추정하기) - 응용편 - 인공지능을 위한 수학 (0) | 2020.11.15 |
---|---|
4장 확률과 통계(7절:최대가능도추정) - 기본편 - 인공지능을 위한 수학 (0) | 2020.09.17 |
4장 확률과 통계(5절:평균과 분산, 그리고 공분산) - 기본편 - 인공지능을 위한 수학 (0) | 2020.09.13 |
4장 확률과 통계(4절:기댓값) - 기본편 - 인공지능을 위한 수학 (2) | 2020.08.04 |
4장 확률과 통계(3절:결합확률과 조건부확률) - 기본편 - 인공지능을 위한 수학 (0) | 2020.08.03 |