잡동사니

[SPSS] 의사결정나무기법을 활용한 경매 경쟁 예측 본문

IT/Big Data

[SPSS] 의사결정나무기법을 활용한 경매 경쟁 예측

yeTi 2018. 11. 29. 23:58

안녕하세요. yeTi입니다.

오늘은 SPSS(Statistical Package for the Social Sciences) 를 활용하여 의사결정나무기법을 활용한 경매 경쟁 예측을 해보겠습니다.


본 블로깅은 K-MOOC에서 제공하는 이화여자대학교 경영대학 경영학과에 재직중이신 신경식 교수님의 

'빅데이터의 세계, 원리의 응용' 이라는 교과목의 7주차 과제에 해당합니다.


설치 환경

    • OS : Windows 10
    • SPSS : 17.0




모델링의 목적은 

경매사이트에 축척된 경매관련 데이터를 활용하여

제품 성격과 판매자 특성, 판매자가 정한 경매조건들에 의해

경쟁경매(입찰자 2인 이상)가 될 것인지, 아닌지를 예측하는 모형 만들기고


강의에서 제공하는 eBay.com에서 거래된 1,972개의 경매관련 데이터를 활용했습니다.




모델링 다이어그램을 먼저 보여드리면 다음과 같습니다.


모델링 흐름을 보면 다음과 같습니다.


1. 파일에서 데이터 불러오기

- TXT 형식의 데이터를 활용하기 위해 소스의 변수 파일 노드를 추가합니다.


2. 데이터 확인하기

- 1번에서 불러온 데이터를 확인하기위해 출력의 테이블을 활용하여 데이터를 확인합니다.


3. 변수 유형 설정하기

- 필드 작업의 유형 노드를 추가하여 1번의 데이터에 변수를 맵핑하는 작업을 합니다.


4. 데이터 파티션 설정하기

- 모델링시 훈련 후 테스트 결과를 확인하기 위해 필드 작업의 파티션 노드를 추가하여 데이터를 분할합니다.

- 데이터는 훈련용 70%, 테스트용 30%로 구성했습니다.


5. 모델링 설정하기

- 모델링의 Cart 노드를 추가하여 파티션된 데이터를 의사결정나무 모델링에 연결합니다.

- 옵션은 최대트리 깊이를 4로 정했습니다.


6. 결과 분석하기

- 모델링 결과를 분석하기 위해 출력의 분석 노드를 추가합니다.



현재는 모델링을 해본다는것에 의의를 두고 SPSS 모델러를 활용해보는 중이여서

옵션을 대부분 기본으로 설정하고 있습니다.


각각의 모델링 개념을 공부하면서

상세 설정을 사용해보도록 하겠습니다.




관련 글


Comments