잡동사니

[SPSS] 군집분석을 활용한 카드 고객 분류 본문

IT/Big Data

[SPSS] 군집분석을 활용한 카드 고객 분류

yeTi 2018. 11. 30. 18:06

안녕하세요. yeTi입니다.

오늘은 SPSS(Statistical Package for the Social Sciences) 를 활용하여 군집분석을 활용한 카드 고객 분류를 해보겠습니다.


본 블로깅은 K-MOOC에서 제공하는 이화여자대학교 경영대학 경영학과에 재직중이신 신경식 교수님의 

'빅데이터의 세계, 원리의 응용' 이라는 교과목의 9주차 과제에 해당합니다.


설치 환경

    • OS : Windows 10
    • SPSS : 17.0




모델링의 목적은 

카드 고객 정보를 활용하여 고객들을 유사한 그룹으로 묶어 보고,

분류된 군집에 따라 어떤 마케팅 전략을 수행하는 것이고


강의에서 제공하는 

신용카드 고객 5,000명에 대한 인구통계학적 정보, 

고객과 은행과의 관계 정보, 

과거 개인 대출 캠페인에 대한 고객들의 반응 정보 데이터를 활용했습니다.




모델링 다이어그램을 먼저 보여드리면 다음과 같습니다.

모델링 흐름을 보면 다음과 같습니다.


1. 파일에서 데이터 불러오기

- TXT 형식의 데이터를 활용하기 위해 소스의 변수 파일 노드를 추가합니다.


2. 데이터 확인하기

- 1번에서 불러온 데이터를 확인하기위해 출력의 테이블을 활용하여 데이터를 확인합니다.


3. 변수 유형 설정하기

- 필드 작업의 유형 노드를 추가하여 1번의 데이터에 변수를 맵핑하는 작업을 합니다.

- 성별, 연간 수입, 평균 신용카드 사용금액(월), 주택담보대출 정도 4개의 변수를 선택했습니다.

- 이로써 연간 수입에 따른 평균 신용카드 사용금액과 주택담보대출의 분포를 확인해보고 성별로 차이가 존재하는지를 확인하는것을 목표로 정했습니다.



4. 모델링 설정하기

- 모델링의 K-평균 노드를 추가하여 군집분석 모델링을 연결합니다.

- 옵션은 군집 수를 5로 설정했습니다.


6. 결과 분석하기

- 모델링 결과를 분석하기 위해 출력의 분석 노드를 추가합니다.

- 차트를 보니 연간 소득 수준에 따라 신용카드 사용 금액에 대한 수준이 다르다는 것을 확인해 볼 수 있습니다.

특이한 점은 연간 소득 수준이 높은 그룹이 주택담보대출 정도가 높을 것으로 예상했는데 중간 그룹의 주택담보대출 정도가 앞도적으로 높은것으로 나타나 의아한 점이 보입니다.




현재는 모델링을 해본다는것에 의의를 두고 SPSS 모델러를 활용해보는 중이여서

옵션을 대부분 기본으로 설정하고 있습니다.


각각의 모델링 개념을 공부하면서

상세 설정을 사용해보도록 하겠습니다.




관련 글


Comments