커뮤니티 대회 교육

자율주행 센서의 안테나 성능 예측 AI 경진대회

[public 30등, private 42등] MultiOutput Bayesian Optimization1

공동작성자

stroke
2022.09.13 13:47 482 조회 language

1. 해당 프로젝트는 2가지 문제에 직면하게 되었습니다.
     a.50여 개의 feature들로부터 각각의 성능지표에 대한 모델을 따로 만들어 14개의 서로 다른 성능 지표를 뽑아내야 했습니다.
     b.정상품과 불량품의 데이터 분포를 비교해보았을 때 공정별 특징에 차이가 존재하지 않아서 딥러닝을 이용해 모델을 구축해 Seq2Seq로 데이터를 뽑아낼 경우, 정상과 불 
         량 간의 안테나의 성능이 동일하게 예측되었습니다.
2. 딥러닝을 이용하여 예측을 많이 진행해보았지만, 2번 문제가 해결되지 않아 딥러닝으로 분석하기 어려웠습니다.
3. 결국 머신러닝으로 문제를 해결해야 했지만, 1번 문제에 직면하게 되었습니다.
4. 1번 문제를 해결하기 위해서 MultiOutput Regressor를 사용하였습니다.
5. 베이지안 옵티마이제이션을 다중출력모델에 적용한 사례가 거의 없었으므로, 이에 대한 함수를 구축하여 다중출력모델에서도 베이지안 옵티마이제이션을 사용가능하도록 만들었습니다.
6. MultiOutput catboost와 MultiOutput LGBM에 다중출력 베이지안 옵티마이저를 각각 적용한 후, 각각에서 성능이 제일 좋은 2가지 모델을 선정한 후, 가장 잘 나온 모델에 2/3의 가중치를, 그 다음으로 잘 나온 모델에 1/3의 가중치를 부여하여 예측한 결과가 성능이 가장 좋았다. 이에 대한 기록은 Submission글에 따로 남기겠습니다.

해당 글은 MultiOutput catboost에 대해서 bayesian optimization을 적용시킨 코드입니다. LGBM의 경우 MultiOutput Bayesian Optimization2를 참고해주시면 감사하겠습니다.

코드
이대권
2022.10.10 14:46

공유감사합니다. 수고하셨습니다.

로그인이 필요합니다
0 / 1000