잔차 플롯은 회귀 분석에서 필수적인 역할을 합니다. 회귀선이 두 변수 간의 관계를 얼마나 정확하게 나타내는지 알려줍니다. 다음 가이드에서는 두 가지 방법을 사용하여 Excel 잔차를 계산하고 플롯하는 방법을 설명합니다.

하지만 중요한 내용을 다루기 전에 회귀 분석에서 잔차와 그 중요성에 대해 간단히 이해해 보겠습니다.

잔차란 무엇이며 왜 중요한가요?

잔차는 관찰된(실제) 값과 예측된 값 사이의 차이입니다. 간단히 말해서 잔차는 오류입니다. 예를 들어 관측값이 10이고 모델이 8의 값을 예측한 경우 잔차는 2가 됩니다.

반면에 잔차 그래프는 독립 변수(연령)를 가로축에, 잔차(오차)를 세로축에 표시하는 분산형 그래프입니다.

자, 잔차가 무엇인지 알겠지만 왜 중요한가요? 이를 이해하기 위해 다음 사례를 살펴보겠습니다:

나이와 저축률 간의 관계를 이해하고 싶습니다. 이를 위해 회귀선을 그릴 것입니다. 하지만 회귀선이 두 변수 간의 관계를 정확하게 나타내는지 확신할 수 없습니다. 이때 잔차가 필요합니다. 잔차를 사용하여 회귀선의 정확성을 확인합니다.

잔차가 무엇인지 알았으니 이제 Excel에서 잔차 그림을 만드는 방법을 배워 보겠습니다:

추세선 방정식을 사용하여 잔차 플롯을 만드는 방법

Excel에서 잔차를 그리는 첫 번째 방법은 추세선 방정식을 사용하여 데이터에 대한 예측 값을 계산하는 것입니다. 예측값이 나오면 관찰된 값에서 예측값을 빼서 잔차를 계산할 수 있습니다. 마지막으로 예측값을 가로축에, 잔차를 세로축에 배치하여 분산형 차트를 만듭니다.

이 방법은 두 번째 방법보다 더 많은 단계가 필요하지만, 개념을 이해하는 데 좋은 방법입니다. 개념을 어느 정도 이해했다면 시간과 노력이 덜 드는 두 번째 방법을 사용할 수 있습니다.

한 번에 한 단계씩 프로세스를 안내해 드리겠습니다.

1단계: 데이터 입력

예측자 값(X 열 아래)과 관찰 값(Y 열 아래)을 입력하는 것으로 시작하겠습니다:

2단계: 데이터의 분산형 차트 만들기

이제 아래 단계에 따라 데이터의 분산형 차트를 만듭니다:

분산형 차트에 익숙하지 않은 경우 Excel에서 분산형 차트를 만들고 데이터를 표시하는 방법에 대한 포괄적인 문서를 참조하세요. 또한 Excel에서 분산형 차트를 사용하여 데이터 동작을 예측하는 방법을 배울 수도 있습니다.

이 글도 확인해 보세요:  Google 스프레드시트에서 레시피를 쉽게 정리, 분류하는 방법

⭐ 데이터를 선택합니다(X 및 Y 열 아래).

⭐ Excel 리본으로 이동하여 삽입을 클릭합니다.

⭐ 차트 섹션에서 분산형 차트 옵션 아래의 화살표를 클릭합니다.

⭐ 첫 번째 스캐터플롯(마커만 있는 스캐터)을 선택합니다.

⭐ 다음 차트와 유사한 분산형 차트가 표시됩니다:

3단계: 분산형 차트에 추세선 추가 및 추세선 방정식 표시

아래 단계에 따라 분산형 차트에 추세선을 추가합니다:

⭐ 산점도를 클릭합니다.

⭐ Excel 리본으로 이동하여 레이아웃을 클릭합니다.

⭐ 배경 섹션에서 추세선 아이콘 아래의 화살표를 클릭합니다.

⭐ 선형 추세선 옵션을 선택합니다.

이제 분산형 차트에서 점과 교차하는 선(추세선)을 볼 수 있습니다. 분산형 차트에 추세선 방정식을 표시하려면 아래 단계를 따르세요:

⭐ 다시 추세선 아이콘으로 이동하여 그 아래의 화살표를 클릭합니다.

⭐ 추가 추세선 옵션을 클릭합니다.

⭐ 추세선 서식 대화 상자가 나타납니다.

⭐ 추세선 서식 대화 상자 하단의 차트에 방정식 표시 옵션을 선택합니다. 추세선 방정식이 그래프에 표시됩니다.

4단계: 예상 값 계산

예상 값을 계산하려면 데이터 옆에 다른 열(Z)을 만들고 아래 단계를 따르세요:

⭐ 그래프에 표시된 추세선 공식을 입력하여 Z 열(셀 C2) 아래에 붙여넣습니다. 수식의 X 열 아래 값을 사용하여 수식의 X를 변경합니다.

⭐ 따라서 첫 번째 예측 값의 경우 공식은 다음과 같이 주어집니다:

=1.5115*A2+23.133

⭐ 두 번째 예측 값에 대한 추세선 공식에서 A2를 A3로 바꿉니다.

⭐ 세 번째 예측 값의 경우 A3를 A4로 바꾸는 식으로 해당 예측자에 대한 모든 예측 값을 얻을 때까지 반복합니다.

5단계: 잔차 값 찾기

이제 예측 값을 얻었으므로 Y 열 아래의 관찰된(실제) 값에서 예측 값을 빼면 잔차 값을 찾을 수 있습니다. 첫 번째 잔차 값의 공식은 =B2-C2입니다. 두 번째 잔차 값의 공식은 =B3-C3입니다.

6단계: 잔차 플롯 만들기

잔차 플롯을 만들려면 예측자와 잔차 값이 필요합니다. 이제 둘 다 준비되었으므로 아래 단계를 따르세요:

이 글도 확인해 보세요:  Google Keep으로 할 일 목록을 깔끔하게 정리하는 방법

⭐ 열 Y 및 Z를 선택합니다.

⭐ 마우스 오른쪽 버튼을 클릭하고 숨기기를 선택합니다.

⭐ 이제 X 및 잔차 열을 선택합니다.

⭐ Excel 리본의 삽입 탭으로 이동합니다.

⭐ 스캐터 아이콘 아래의 화살표를 클릭합니다.

⭐ 마커만 사용하여 분산 옵션을 선택합니다.

⭐ 아래와 같이 잔여 플롯이 표시됩니다.

Excel에서 분석 도구팩으로 잔차 플롯을 만드는 방법

두 번째 방법의 경우 Excel에 데이터를 제공하기만 하면 모든 작업이 자동으로 수행됩니다. 몇 번의 클릭만으로 잔여 플롯을 만들 수 있습니다. 하지만 이를 위해서는 Excel의 분석 도구팩을 로드해야 합니다. 이제 시작하겠습니다:

1단계: 분석 도구팩 로드

⭐ 파일 탭으로 이동하여 옵션을 클릭합니다.

⭐ Excel 옵션 대화 상자가 나타납니다.

⭐ 관리 상자(하단)로 이동하여 Excel 추가 기능을 선택한 다음 이동을 클릭합니다.

⭐ 추가 기능 대화 상자가 나타납니다.

⭐ 분석 도구팩 상자에 체크하고 확인을 클릭합니다.

⭐ 이제 Excel 리본으로 이동하여 데이터를 클릭합니다.

⭐ 분석 섹션에서 데이터 분석 아이콘을 찾을 수 있습니다.

2단계: 데이터 입력

⭐ 열 A와 D를 선택하고 마우스 오른쪽 버튼을 클릭합니다. 숨기기 해제를 클릭합니다.

⭐ 이제 X 및 Y 열을 복사합니다.

열의 숨기기를 해제하면 그래프가 변경된 것을 확인할 수 있습니다. 원래의 잔여 그래프로 다시 변경하려면 Y 및 Z 열을 숨겨야 합니다(Y 및 Z 열을 선택하고 마우스 오른쪽 버튼을 클릭한 다음 숨기기를 선택하면 됩니다).

⭐ 새 Excel 시트를 열고 X 및 Y 열을 붙여넣습니다.

⭐ 데이터 탭의 분석 섹션에서 새로 표시된 데이터 분석 옵션을 클릭합니다.

⭐ 데이터 분석 대화 상자가 나타납니다.

⭐ 분석 도구에서 회귀를 찾아 선택합니다.

⭐ 확인을 클릭합니다. 회귀 대화 상자가 나타납니다.

⭐ 입력 Y 범위 필드에 Y 열(예측자, B2:B11)의 값을 입력합니다.

⭐ 입력 X 범위 필드의 X 열(독립 변수, A2:A11)에 셀 범위를 입력합니다.

3단계: 잔차 플롯 만들기

회귀 대화 상자의 출력 옵션에서 새 워크시트 플라이에 체크하고 확인을 클릭합니다.

이 글도 확인해 보세요:  시험 기간 동안 집중력을 유지하는 데 도움이 되는 6가지 앱

Excel에서 회귀 모델의 신뢰성을 확인하는 데 사용할 수 있는 다음 출력과 함께 잔차 플롯이 자동으로 만들어집니다:

⭐ 회귀 통계

⭐ ANOVA 표

⭐ 계수 표

⭐ 잔차 출력

Excel의 분석 도구 팩 살펴보기

Excel의 분석 도구 팩은 데이터 집합 분석에 사용할 수 있는 다양한 유용한 통계 기능을 제공합니다. Excel의 분석 도구팩을 통해 잔차 그래프를 만든 후에는 복잡한 표를 보면서 머리를 긁적일 수도 있습니다. 하지만 Excel에서 기본적인 데이터 분석을 수행하는 방법을 배우면 숫자가 그렇게 무섭게 느껴지지 않습니다.

By 최은지

윈도우(Windows)와 웹 서비스에 대한 전문 지식을 갖춘 노련한 UX 디자이너인 최은지님은 효율적이고 매력적인 디지털 경험을 개발하는 데 탁월한 능력을 발휘합니다. 사용자의 입장에서 생각하며 누구나 쉽게 접근하고 즐길 수 있는 콘텐츠를 개발하는 데 주력하고 있습니다. 사용자 경험을 향상시키기 위해 연구를 거듭하는 은지님은 All Things N 팀의 핵심 구성원으로 활약하고 있습니다.