월간 데이콘 천체 유형 분류 대회

알고리즘 | 정형 | 분류 | 과학 | LogLoss

  • moneyIcon 상금 154만 원
  • 1,272명 마감

 

베이스모델 코드

2026.04.02 22:32 31 조회 language

1. 모델 개요
모델명: LightGBM 기본 분류 모델 (Basic LightGBM Classifier)

목적: 제공된 수치 데이터를 바탕으로 천체의 유형을 분류하는 기초 예측 모델 구축

주요 라이브러리: lightgbm, pandas, numpy

2. 주요 처리 과정
데이터 로딩 및 인덱스 설정: index_col=0을 통해 데이터의 고유 ID를 인덱스로 지정하여 관리의 편의성을 높임

타겟 레이블 수치화: sample_submission의 컬럼 순서에 맞춰 천체 유형(Type) 문자열을 숫자(0~18)로 매핑하여 모델이 학습 가능한 형태로 변환

특성 선택: 학습 데이터에서 타겟 변수인 type과 변환된 type_num을 제외한 나머지 모든 수치 데이터를 학습 특성(Feature)으로 사용

3. 모델 구성 및 하이퍼파라미터
학습의 안정성을 위해 낮은 학습률과 충분한 반복 횟수를 설정했습니다.

n_estimators (1250): 모델이 학습을 반복할 횟수

num_leaves (128): 하나의 트리가 가질 수 있는 최대 리프 노드 수로, 모델의 복잡도를 결정

learning_rate (0.009): 각 반복 단계에서의 학습 강도를 낮게 설정하여 최적점에 세밀하게 접근하도록 함

4. 예측 및 결과 생성
확률 예측 (predict_proba): 단순 분류가 아닌, 각 천체 유형별 발생 확률을 계산하여 예측값의 정밀도를 높임

결과 저장: 예측된 확률값을 제출 양식(sample_submission)의 형식에 맞춰 Baseline.csv 파일로 저장

코드
이전 글
이전 글이 존재하지 않습니다.
현재 글
베이스모델 코드
대회 - 월간 데이콘 천체 유형 분류 대회
좋아요 0
조회 31
댓글 0
3일 전
다음 글
boklok
대회 - 월간 데이콘 천체 유형 분류 대회
좋아요 0
조회 75
댓글 0
5일 전