스마트 공장 제품 품질 상태 분류 AI 온라인 해커톤

채용 | 알고리즘 | 정형 | 스마트 공장 | LG Aimers | 분류 | Macro F1 Score

상금 : 본선 진출
1,387명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

[Private 1위] CatboostRegressor

댕댕2

공동작성자

2023.04.03 02:27 4,030 조회 language

저희는 LINE 변수로 grouping 하여 데이터를 분석했습니다.
특히 T050304과 T050307에 집중하여 해당 두 라인을 합친 후 feature selection을 진행하고 모델을 따로 학습시키는 방법으로 좋은 성능을 낼 수 있었습니다.
시간이 부족하여 다른 라인에 대해서는 더 하진 못했으나 의미있는 접근 방식이었다고 생각합니다!

코드

댓글 3개

로그인이 필요합니다

comment

0 / 1000

paul77ms

2023.04.04 00:40

수고하셨습니다. 👍
혹시 라인을 합치신 이유가 따로 있으신가요?

동글리도르

2023.05.14 15:21

늦게 확인해서 이제야 답변드립니다..
기억을 더듬어 보자면,
결측 feature 발생 양상이 비슷하게 나타나는 것을 관측했습니다.(1-2번, 3-4번,5-6번)
따로도 학습을 진행을 시켜보았으나 합친것보다는 성능이 안 좋은 경우가 대부분이었으며 묶이는 라인별로 결측열이 거의 비슷하게 관측이 되어(그렇게 차이가 없었습니다) 그렇게 진행하였습니다.

paul77ms

2023.05.15 04:04

답변 감사합니다. 그리고 수상 축하합니다.

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동하였습니다!