본문 바로가기
통계로 보는 세상

SPSS 선형 회귀분석 할때, 잔차의 정규성과 등분산성을 평가하는 방법

by 큐비(Quby) 2023. 4. 7.

 선형 회귀분석을 하기 위해서는 기본적으로 다음 4가지 가정을 충족해야 합니다.

  1. 선형성: 종속변수와 독립변수 사이의 관계는 선형이어야 합니다.
  2. 독립성: 관찰은 서로 독립적이어야 합니다.
  3. 잔차의 등분산성: 잔차의 분산은 독립 변수의 모든 수준에서 일정해야 합니다.
  4. 잔차의 정규성: 잔차의 분포는 거의 정규이어야 합니다.

 

도대체 잔차의 등분산성과 정규성을 어떻게 알 수 있을까요?

저는 그동안 많이 알아봤지만, 잘 설명된 곳이 없었어요. 

그래서 이렇게 정리해둡니다.

 

 


SPSS를 사용하여 선형 회귀에서 잔차의 정규성을 평가하려면 다음 단계를 따르십시오.

 

SPSS에서 선형회귀분석 실행

  1. SPSS에서 데이터 세트를 엽니다.
  2. 메뉴 표시줄에서 "분석"을 클릭한 다음 "회귀" 위로 마우스를 이동하고 "선형..."을 클릭합니다.
  3. 선형 회귀 대화 상자에서 종속(결과) 변수를 선택하고 "종속" 상자로 이동합니다. 그런 다음 독립(예측자) 변수를 선택하고 "독립(들)" 상자로 이동합니다.
  4. 선형 회귀 대화 상자에서 "플롯" 버튼을 클릭합니다. 그러면 "회귀: 플롯" 대화 상자가 열립니다.
  5. "Regression: Plots" 대화 상자의
    "Y" 드롭다운 메뉴에서 "ZRESID" 옵션을 선택하고
     "X" 드롭다운 메뉴에서 "ZPRED" 옵션을 선택합니다.
    이렇게 하면 표준화된 잔차(ZRESID)와 표준화된 예측값(ZPRED)의 산점도가 생성됩니다.
  6. "Standardized Residual Plots" 섹션에서 "Histogram" 및 "Normal probability plot" 옵션을 확인합니다. 히스토그램은 잔차 분포를 시각적으로 표현하는 반면, 정규 확률도(Q-Q 플롯이라고도 함)는 잔차 분포를 정규 분포와 비교하여 잔차의 정규성을 평가하는 데 도움이 됩니다.
  7. "계속" 버튼을 클릭하여 선형 회귀 대화 상자로 돌아간 다음 "확인" 버튼을 클릭하여 분석을 실행합니다.

 

결과 해석 지침

SPSS 출력에서 ​​산점도, 히스토그램 및 정규 확률도를 조사합니다.
잔차가 정규성을 평가하려면 
- 산점도는 명확한 패턴이나 추세를 나타내지 않아야 하고
- 히스토그램은 대략 종 모양의 곡선을 가져야 하며
- 정규 확률도는 직선 대각선을 따라 데이터 포인트를 표시해야 합니다.

잔차의 등분산성을 평가하려면
산점도에서 명확한 패턴이 없는 임의의 점 분포를 찾으십시오.
플롯이 눈에 띄는 추세나 깔때기 모양 없이 무작위 패턴을 표시하는 경우 등분산성 가정이 충족될 수 있습니다.
반대로 깔대기 모양이나 부채꼴 모양과 같은 뚜렷한 패턴을 관찰하면 가정을 위반하는 이분산성을 나타낼 수 있습니다.

 

 

분석 예시

SPSS로 계층적 위계분석을 실시하였다.
Step1. 인구통계변인 (통제변인) 
Step2. 내 연구의 변인 (정규성)
Step3. 내 연구의 변인( 비정규성)

 

1. 산점도: 명확한 패턴이나 추세를 나타내지 않고 있다. 따라서 정규성과 등분산성
플롯이 눈에 띄는 추세나 깔때기 모양 없이 무작위 패턴을 표시하는 경우 등분산성과 정규성 가정이 충족될 수 있습니다.
반대로 깔대기 모양이나 부채꼴 모양과 같은 뚜렷한 패턴을 관찰하면 가정을 위반하는 이분산성을 나타낼 수 있습니다.

 

2. 히스토그램: 대략 종 모양의 곡선을 가지고 있다. => 잔차의 정규성 가정 충족

 

3. 정규 확률도: 직선 대각선을 따라 데이터 포인트를 표시하고 있다. => 잔차의 정규성 가정 충족

 

결론적으로 본 회귀분석은 '잔차의 정규성의 등분산성' 가정이 충족되고 있습니다. 

 


 

잔차의 등분산성과 정규성 평가는 선형 회귀 분석을 수행할 때 확인해야 할 몇 가지 가정 중 하나일 뿐이라는 점에 유의해야 합니다.

또한 선형성, 잔차의 독립성에 대한 가정을 반드시 확인해야 합니다. !

댓글