분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
월간 데이콘 운동 동작 분류 AI 경진대회
Private 11위, Public 점수 :0.54396(20위), CNN model
1. 거의 처음으로 진행해본 competition인데, 생각보다 어려웠습니다. 쉬운 데이터만 만져보다가, 이번 데이터를 경험해보니 눈 앞이 막막했습니다... 그럼에도 제 생각보다는 훨씬 좋은 결과로 마무리 지은 것 같아 정말 뿌듯하네요.
2. 처음에는 데이터를 받고 나서, 평소에 다루던 x1 x2 x3...있고 종속변수 y 있는 데이터 형식이 아니라서 많이 당황했습니다. 처음에는 이게 시계열 데이터니까 arima를 돌려서 계수를 독립변수로 삼아 모델을 돌려야하나? 이런 생각도 했었는데,, 비슷한 데이터를 다룬 논문을 참고해보니 cnn을 쓰더라구요. 저는 이미지나 영상에만 쓰는 줄 알고 있었는데, 생각해보니 못쓸 건 없겠더라구요. 특히 도움이 된 논문은 Terry, Vahid, & Dana (2017) 입니다.
3. 그럼에도 불구하고 평소에 R을 주로 쓰다 보니 python이 익숙치 않아 코드를 비효율적이고 무식하게 짠 것 같다는 생각이 들었습니다. 하면서 고칠까도 생각 했었는데, 일단 해보고 다음부터 공부해서 잘 짜보자 라는 생각을 했습니다.
4. colab을 사용해서, gpu 사용량이 초과되어 중간에 다운되는 것을 막기 위해서 중간중간에 저장해가면서 돌릴 수 밖에 없었습니다. 그러다보니 생각해 낸 방식이 어차피 결과를 저장하면서 할거면 soft voting에 때려넣고 그냥 다 활용해보자 였는데, 이것이 의외로 좋은 결과의 원인이 되었던 것 같습니다.
5. 데이터가 너무 적고 불균형하길래, 데이터를 새로 만드는 코드도 스스로 짜봤었는데, 코드 공유에 Dacon.dobby님이 올려주신 데이터 생성에 비하면 뭔가 제것은 많이 무식해 보이네요... 공부를 정말정말 많이 해봐야 겠습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
수고하셨어요~ 코드 잘 봤습니다.