Credit-card-customer-segmentation-AI

데이콘 해커톤- 신용카드 고객 세그먼트 분류 AI

Feature Importance분석.ipynb

키워드 기반 Feature Importance 분석 : '이용', '금액', '연체' 특정 키워드와 "R3M", "R6M" 등 특정 시간이 포함된 피처들의 분류 성능 및 중요도 분석

keywords = ["이용", "금액", "연체"] #여기서 kewords 설정
time_filters = ["R3M", "R6M"] # 여기서 기간 설정, []로 두면 기간 조건 X

전체 피처 중 상위 30개씩 Feature Importance 분석 : 전체 피처를 기준으로 LightGBM의 feature importance 상위 30개를 추출하여 분석

show_next_30_features(model_all, all_columns) # 실행 시 다음 상위 30개 추출

신용카드_세그먼트_분류_1차제출.ipynb

데이터 구성

입력 데이터: card_train.csv, card_test.csv
추천 피처: 총 50여 개 변수로 구성된 recommended_columns 기준 사용

전처리

Object 타입 컬럼에 대해 Label Encoding 및 Frequency Encoding 적용
결측치 및 inf 값은 적절히 처리 (평균 또는 0 대체)
파생 변수 생성: 카드 이용률, 포인트 사용률, 연체 비율 등 총 8개 파생 변수 추가

데이터 불균형 처리

SMOTE 및 RandomOverSampler를 결합하여 불균형 보정
클래스별 타깃 수량을 수작업 지정 (e.g., 클래스 2 → 40000, 클래스 0 → 35000 등)

모델 학습

앙상블 구조로 XGBoost, LightGBM, CatBoost 모델을 사용하여 soft voting 수행
모델 하이퍼파라미터는 수동으로 튜닝 (e.g., n_estimators=300, max_depth=5 등)

평가 결과 (Validation)

Soft Voting 기준 F1 Score (macro): 0.9372 F1 Score (weighted): 0.9311
Cross Validation 평균 (3-Fold 기준) XGB: 0.9349 LGB: 0.9449 CAT: 0.9187

최종 제출 결과

제출 파일: card_test_submission.csv
리더보드 점수: 0.869840733634568

신용카드_세그먼트_분류_2차제출.ipynb

데이터 구성

입력 데이터: card_train.csv, card_test.csv
추천 피처: 총 50여 개 변수로 구성된 recommended_columns 기준 사용

전처리

범주형 처리: Object 타입 컬럼에 대해 Label Encoding 및 Frequency Encoding 적용
결측 및 이상값 처리: NaN, inf, -inf → 평균 대체 또는 0으로 변환
파생 변수 생성: 카드 이용률, 체크카드 비율, 포인트 사용률, 연체 비율, 결제 규모, 불만 경과율 등 총 8개 파생 변수 추가

데이터 불균형 처리

SMOTE + RandomOverSampler 조합 사용
클래스별 샘플 수 수동 지정 (예: 클래스 2 → 40000, 클래스 3 → 45000 등)
최종 클래스 균등 분포 달성

모델 학습 및 앙상블 XGBoost, LightGBM, CatBoost를 기반으로 Soft Voting 앙상블

가중치 적용: LGB 0.5, XGB 0.3, CAT 0.2
하이퍼파라미터 튜닝: n_estimators=300, max_depth=5, learning_rate=0.1 등

평가 결과 (Validation)

Soft Voting 기준 F1 Score (macro): 0.9414 F1 Score (weighted): 0.9355
Stratified K-Fold Cross-validation 평균 (3-Fold 기준) XGB: 0.9349 LGB: 0.9449 CAT: 0.9188

검증 데이터 클래스 분포 비교

예측: [7000, 6000, 7995, 8816, 11490]
정답: [7000, 6000, 8000, 9000, 11301] → 매우 유사

최종 제출 결과

제출 파일: card_test_submission.csv
리더보드 점수:

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
.gitignore		.gitignore
0.93분석.ipynb		0.93분석.ipynb
12조_신용카드 세그먼트 분류.ipynb		12조_신용카드 세그먼트 분류.ipynb
Feature_Importance분석.ipynb		Feature_Importance분석.ipynb
LICENSE		LICENSE
README.md		README.md
card_test.csv		card_test.csv
card_test_submission.csv		card_test_submission.csv
card_test_submission_result2.csv		card_test_submission_result2.csv
model_.ipynb		model_.ipynb
신용카드 고객 세그먼트 분류 AI 경진대회 데이터 명세.xlsx		신용카드 고객 세그먼트 분류 AI 경진대회 데이터 명세.xlsx
시행 결과f1score.txt		시행 결과f1score.txt
신용카드 세그먼트 분류(모델링).ipynb		신용카드 세그먼트 분류(모델링).ipynb
신용카드_세그먼트_분류_1차제출(파생변수_추가).ipynb		신용카드_세그먼트_분류_1차제출(파생변수_추가).ipynb
신용카드_세그먼트_분류_1차제출.ipynb		신용카드_세그먼트_분류_1차제출.ipynb
신용카드_세그먼트_분류_1차제출_'연령'(프리퀀시).ipynb		신용카드_세그먼트_분류_1차제출_'연령'(프리퀀시).ipynb
신용카드_세그먼트_분류_1차제출_frequency_indcoing.ipynb		신용카드_세그먼트_분류_1차제출_frequency_indcoing.ipynb
신용카드_세그먼트_분류_2차 제출.ipynb		신용카드_세그먼트_분류_2차 제출.ipynb
신용카드_세그먼트_분류_최종.ipynb		신용카드_세그먼트_분류_최종.ipynb
신용카드_세그먼트_분류_클래스_0,1_제거.ipynb		신용카드_세그먼트_분류_클래스_0,1_제거.ipynb
신용카드_세그먼트_추가.ipynb		신용카드_세그먼트_추가.ipynb
프로젝트 도메인 분석.md		프로젝트 도메인 분석.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Credit-card-customer-segmentation-AI

Feature Importance분석.ipynb

신용카드_세그먼트_분류_1차제출.ipynb

평가 결과 (Validation)

최종 제출 결과

신용카드_세그먼트_분류_2차제출.ipynb

평가 결과 (Validation)

검증 데이터 클래스 분포 비교

최종 제출 결과

About

Uh oh!

Releases

Packages

Contributors 5

Uh oh!

Languages

License

edenlogic/CreditCard-customer_segmentation-AI

Folders and files

Latest commit

History

Repository files navigation

Credit-card-customer-segmentation-AI

Feature Importance분석.ipynb

신용카드_세그먼트_분류_1차제출.ipynb

평가 결과 (Validation)

최종 제출 결과

신용카드_세그먼트_분류_2차제출.ipynb

평가 결과 (Validation)

검증 데이터 클래스 분포 비교

최종 제출 결과

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 5

Uh oh!

Languages

Packages