분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
베이스모델 코드
1. 모델 개요
모델명: LightGBM 기본 분류 모델 (Basic LightGBM Classifier)
목적: 제공된 수치 데이터를 바탕으로 천체의 유형을 분류하는 기초 예측 모델 구축
주요 라이브러리: lightgbm, pandas, numpy
2. 주요 처리 과정
데이터 로딩 및 인덱스 설정: index_col=0을 통해 데이터의 고유 ID를 인덱스로 지정하여 관리의 편의성을 높임
타겟 레이블 수치화: sample_submission의 컬럼 순서에 맞춰 천체 유형(Type) 문자열을 숫자(0~18)로 매핑하여 모델이 학습 가능한 형태로 변환
특성 선택: 학습 데이터에서 타겟 변수인 type과 변환된 type_num을 제외한 나머지 모든 수치 데이터를 학습 특성(Feature)으로 사용
3. 모델 구성 및 하이퍼파라미터
학습의 안정성을 위해 낮은 학습률과 충분한 반복 횟수를 설정했습니다.
n_estimators (1250): 모델이 학습을 반복할 횟수
num_leaves (128): 하나의 트리가 가질 수 있는 최대 리프 노드 수로, 모델의 복잡도를 결정
learning_rate (0.009): 각 반복 단계에서의 학습 강도를 낮게 설정하여 최적점에 세밀하게 접근하도록 함
4. 예측 및 결과 생성
확률 예측 (predict_proba): 단순 분류가 아닌, 각 천체 유형별 발생 확률을 계산하여 예측값의 정밀도를 높임
결과 저장: 예측된 확률값을 제출 양식(sample_submission)의 형식에 맞춰 Baseline.csv 파일로 저장
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved