로그 분석을 통한 보안 위험도 예측 AI 경진대회

알고리즘 | NLP | 분류 | 제어 | Macro f1 score

  • moneyIcon 상금 : 총 300만원
  • 740명 마감

 

정개 | Private 31위(0.85362)| 1D CNN with Focal loss

2021.05.18 01:21 4,824 조회 language

훈련 데이터에 대해 나름 세심한 전처리를 진행한 뒤, 간단한 1D CNN 모델에 적합했을 때에도 꽤 괜찮은 성능의 모델이 나왔습니다. 
Class imbalance 문제를 해결하기 위해 categorical crossentropy 대신 RetinaNet에서 제안한 Focal Loss를 사용해보았습니다. 
첫 NLP 관련 대회였는데, 짧은 기간이지만 재밌게 몰입해서 대회 진행할 수 있었습니다.  순위권 분들에 비해 매우 저조한 기록이지만 public 순위 54등에서 private 31등까지 상승하여 기분 좋게 대회 마무리했습니다. 

seed를 따로 지정하지 않고 진행해서 같은 성능이 구현될 수 있을지는 미지수입니다만 종료 후 코드를 다시 돌려서 제출했을 땐 비슷하게 나오는 것 같습니다.

구체적인 코드 설명은 ipynb를 통해 확인해주셔도 좋고, 더 구체적인 분석 과정은 아래의 링크에서 확인해주시면 감사하겠습니다!
https://blog.naver.com/chunsa0127/222354931349

코드
로그인이 필요합니다
0 / 1000
도비콘
2021.05.18 07:08

수고하셨습니다. 

정개
2021.05.18 09:48

감사합니다!!

hahaha
2021.05.18 12:27

이번 대회에 참가하진 못했지만 관심 있는 분야라 다른 분들의 코드가 궁금했었는데,
코드를 공유해 주셔서 감사해요!ㅎㅎ
특히 이번 대회는 4번에 적힌 inference for level7이 중요하다고 생각하는데 참신한 방법으로 접근하신 것 같아
많이 고민하신 흔적이 보이네요.
고생하셨습니다!

정개
2021.05.18 14:00

엇 운동 동작 대회 1등하셨던 것 같은데 맞죠..??? 
사실 Novelty detection 관련 One class SVM이나 isolation forest, auto encoder 같은 기법도 고려했는데 성능이 좋지 않아서 결국 threshold를 설정하는 것에 신경을 많이 썼습니다!

피드백 감사드립니다 ㅎㅎ