교재링크(광고 아님): freelec.co.kr/book/인공지능을-위한-수학/

 

 

※ 회귀분석(regression analysis)의 설명이 필요하여 교재에 없는 내용을 추가하였다.

 

 

회귀분석(regression analysis)

어떤 연속된 변수들 사이의 관계에 대해 모델을 만든 후 적합도를 구하는 분석 방법인데, 회귀(regress...)가 붙은 이유는 모호한 변수들의 관계가 점점 어떤 하나의 상태로 돌아가게(회귀)끔 만드는 방식이기 때문이다. 회귀 분석의 대표적인 예가 선형 회귀(linear regression)이며, 변수들을 종속변수(dependent variable)독립변수(independent variable)로 나누는 것도 이 회귀 분석의 방식에서 기인한 것이다.

 

목적변수(objective variable), 종속변수(dependent variable)

회귀분석을 통해 도출된 관계식에서 독립변수(independent variable)와 그 상관계수(coefficient)를 통해서 얻어지는 변수값을 뜻한다. 즉, y = ax + b 같은 식에서 y를 뜻한다고 보면 된다. 이 변수를 지칭하는 이름은 정말 많은데, 위키에 적혀 있는 단어를 나열해 본다.

  • regressand (피회귀자)
  • endogenous variable
  • response variable
  • measured variable
  • criterion variable
  • dependent variable
  • predicted variable

 

설명변수(explanatory variable), 독립변수(independent variable)

종속변수를 얻기 위해 모아둔 변수(들). 한개 이상일 수 있다. 예를 들어, y = ax + b 에서 x라고 보면 된다. 이 변수 역시 명칭이 정말 많다. (복수임에 집중)

  • regressors (회귀자)
  • exogenous variables
  • explanatory variables
  • covariates
  • input variables
  • predictor variables
  • independent variables

 

선형회귀(linear regression)

회귀분석의 한 갈레. 가장 쉽고 비교적 정확한 결과를 얻을 수 있어 가장 많이 쓰인다고 보면 된다. 문자 그대로 변수들의 관계를 선형이라고 보고, 적합한 선(line)을 찾기 위해 회귀시켜 분석하는 방법이다.

 

선형회귀 모델(linear regression model)

선형적으로 변수들의 관계를 설정한 수식. 대략 아래의 형태를 띈다.

$$ y = \beta_1 x_1 + \beta_2 x_2 + \varepsilon $$

 

선형성(linearity)

선형회귀의 성질 중 하나. 어찌보면 당연한 성질인데, 수식(모델) 자체가 1차식이니 더 이상 자세한 설명이 필요없다. 주의할 것은 x에 대한 1차식이 아니라 beta에 대한 1차식이라는 사실이다.

 

치우침(편향, bias)

수집한 데이터의 편향성을 말하는데, 데이터의 치우침으로 인해 정확한 정보의 판단 근거가 부족해지는 현상을 말한다. 교재의 예시를 보면 수집한 데이터가 신축 건물 위주라면 구축 건물들의 시세를 정확히 예측해내기 어렵다.. 라고 한다.

 

Posted by JMAN