월간 데이콘 운동 동작 분류 AI 경진대회

Private 11위, Public 점수 :0.54396(20위), CNN model

2021.02.22 19:35 5,851 조회 language

1. 거의 처음으로 진행해본 competition인데, 생각보다 어려웠습니다. 쉬운 데이터만 만져보다가, 이번 데이터를 경험해보니 눈 앞이 막막했습니다... 그럼에도 제 생각보다는 훨씬 좋은 결과로 마무리 지은 것 같아 정말 뿌듯하네요.

2. 처음에는 데이터를 받고 나서, 평소에 다루던 x1 x2 x3...있고 종속변수 y 있는 데이터 형식이 아니라서 많이 당황했습니다. 처음에는 이게 시계열 데이터니까 arima를 돌려서 계수를 독립변수로 삼아 모델을 돌려야하나? 이런 생각도 했었는데,, 비슷한 데이터를 다룬 논문을 참고해보니 cnn을 쓰더라구요. 저는 이미지나 영상에만 쓰는 줄 알고 있었는데, 생각해보니 못쓸 건 없겠더라구요. 특히 도움이 된 논문은 Terry, Vahid, & Dana (2017) 입니다.

3. 그럼에도 불구하고 평소에 R을 주로 쓰다 보니 python이 익숙치 않아 코드를 비효율적이고 무식하게 짠 것 같다는 생각이 들었습니다. 하면서 고칠까도 생각 했었는데, 일단 해보고 다음부터 공부해서 잘 짜보자 라는 생각을 했습니다.

4. colab을 사용해서, gpu 사용량이 초과되어 중간에 다운되는 것을 막기 위해서 중간중간에 저장해가면서 돌릴 수 밖에 없었습니다. 그러다보니 생각해 낸 방식이 어차피 결과를 저장하면서 할거면 soft voting에 때려넣고 그냥 다 활용해보자 였는데, 이것이 의외로 좋은 결과의 원인이 되었던 것 같습니다.

5. 데이터가 너무 적고 불균형하길래, 데이터를 새로 만드는 코드도 스스로 짜봤었는데, 코드 공유에 Dacon.dobby님이 올려주신 데이터 생성에 비하면 뭔가 제것은 많이 무식해 보이네요... 공부를 정말정말 많이 해봐야 겠습니다.

코드
로그인이 필요합니다
0 / 1000
Mather
2021.02.23 20:41

수고하셨어요~ 코드 잘 봤습니다.

당쇠
2021.03.25 11:09

이제야 봤네요 축하 드립니다.