잡동사니

[SPSS] 다중회귀분석을 활용한 중고차 가격 예측 본문

IT/Big Data

[SPSS] 다중회귀분석을 활용한 중고차 가격 예측

yeTi 2018. 11. 23. 18:28

안녕하세요. yeTi입니다.

오늘은 SPSS(Statistical Package for the Social Sciences) 를 활용하여 다중회귀분서을 활용한 중고차 가격 예측을 해보겠습니다.


본 블로깅은 K-MOOC에서 제공하는 이화여자대학교 경영대학 경영학과에 재직중이신 신경식 교수님의 

'빅데이터의 세계, 원리의 응용' 이라는 교과목의 5주차 과제에 해당합니다.



설치 환경

- OS : Windows 10

- SPSS : 17.0




모델링의 목적은 위에서 언급했다시피 다중회귀분서을 활용한 중고차 가격 예측입니다.

과제는 강의에서 제공하는 중고자 판매 데이터를 활용하였고, 모델링 다이어그램을 먼저 보여드리면 다음과 같습니다.




그림에서 보시다시피 데이터 유형을 두가지로 설정해봤습니다.

첫번째 데이터 유형은 입력변수를 제가 유효하다고 판단하는 것들만 사용하였고,

두번째 데이터 유형은 출력변수를 제외한 모든 변수를 입력변수로 활용하고 모델링시 단계 선택(Stepwise)법을 활용하여 모델러가 유효 입력변수를 찾도록 했습니다.


그리고 파티션을 설정하여 훈련용 샘플 70%, 테스트용 샘플 30% 비중으로 모델링하여

데이터로 훈련하고 검증하는 프로세스를 사용했습니다



두 유형에 대한 모델링의 분석결과를 비교하면 다음과 같습니다.


1. 입력변수를 유효하다고 판단하는 것들만 사용



2. 단계 선택(Stepwise)법을 활용



위의 두 결과를 보시면 아시겠지만 평균 절대오차가 두번째의 경우가 더 작기 때문에 보다 좋은 모델링이라고 할 수 있겠네요.

입력 변수를 설정하는 단계를 건너뛰었으니 모델링을 했다고 할 수 없지만요..

모델러가 해준거라고 하는게 더 정확할거 같습니다.ㅎㅎ;;



여기까지 SPSS(Statistical Package for the Social Sciences) 를 활용하여 다중회귀분서을 활용한 중고차 가격 예측 모델링 구현이었습니다.




관련 글


Comments