스마트 공장 제품 품질 상태 분류 AI 온라인 해커톤

채용 | 알고리즘 | 정형 | 스마트 공장 | LG Aimers | 분류 | Macro F1 Score

  • moneyIcon 상금 : 본선 진출
  • 1,300명 마감

 

[Private 1위] CatboostRegressor

공동작성자

stroke
2023.04.03 02:27 3,323 조회 language

저희는 LINE 변수로 grouping 하여 데이터를 분석했습니다. 
특히 T050304과 T050307에 집중하여 해당 두 라인을 합친 후 feature selection을 진행하고 모델을 따로 학습시키는 방법으로 좋은 성능을 낼 수 있었습니다. 
시간이 부족하여 다른 라인에 대해서는 더 하진 못했으나 의미있는 접근 방식이었다고 생각합니다!

코드
로그인이 필요합니다
0 / 1000
paul77ms
2023.04.04 00:40

수고하셨습니다.  👍
혹시 라인을 합치신 이유가 따로 있으신가요?

동글리도르
2023.05.14 15:21

늦게 확인해서 이제야 답변드립니다..
기억을 더듬어 보자면,
결측 feature 발생 양상이 비슷하게 나타나는 것을 관측했습니다.(1-2번, 3-4번,5-6번)
따로도 학습을 진행을 시켜보았으나 합친것보다는 성능이 안 좋은 경우가 대부분이었으며 묶이는 라인별로 결측열이 거의 비슷하게 관측이 되어(그렇게 차이가 없었습니다) 그렇게 진행하였습니다.

paul77ms
2023.05.15 04:04

답변 감사합니다. 그리고 수상 축하합니다.