문장 유형 분류 AI 경진대회

문장 유형 분류 AI 경진대회_600마력

2023.02.17 14:33 470 조회

문장 유형 분류 AI 경진대회

🎉 600마력 팀원분들, 수상을 진심으로 축하합니다. 🎉

🏆 김민석, 용준영, 김경민 님

 

🎙수상을 진심으로 축하드립니다. 수상소감을 말해주세요.

김민석

Public LB에서 private으로 바뀌었을때 순위가 2위까지 올라서 기뻤습니다. 모델을 꽤나 robust하게 만들었어서 private에서 순위가 올라갈걸 예상은 했지만 생각보다 많이 올라서 기뻤네요. 한편으로는 일과 다른 프로젝트들과 병행하느라 100%의 노력을 투입하지 못해서 우승을 놓친 것 같아서 아쉽습니다. 준비하고 있던 증강된 데이터셋을 제대로 사용하지 못해서 아쉬운점도 있습니다.

 

용준영

정말 감사합니다

 

김경민

우선 이렇게 좋은 경험을 할 수 있도록 대회를 개최해준 성균관대학교에 감사합니다.

무엇보다 데이콘을 통해 많은 사람들과 소스를 공유하고 같이 성장할 수 있는 기회가 된 것 같습니다.

아직 많이 부족하지만 앞으로도 데이콘의 다양한 대회에 참석하여 사람들과 많은 교류를 통해 함께 성장할 수 있도록 노력할 것입니다.

 

🎙팀을 소개해 주세요.

김민석

팀원 세명 다 인공지능 관련된 일을 하고 있고 이전에 같이 다양한 프로젝트 및 논문작업을 진행한 이력이 있습니다. 저희들이 제일 좋아하는 인공지능 분야가 NLP쪽이라서 이번 대회에 참가하게 되었습니다.

 

용준영

좋은 팀입니다

 

김경민

팀장님께서 잘 해주시리라 믿습니다

 

🎙다른 팀과 차별되는 우리 팀만의 특징이나 강점이 있나요?

김민석

팀 이름을 멋있게 잘 지은 것 같습니다 (600 마력)

 

용준영

대한민국 최고, 그뿐입니다

 

김경민

데이터 분석, 모델 설계 면에서 모두 강합니다. 시간이 좀 더 있었더라면하는 아쉬움이 조금 있었습니다

 

🎙대회 기간 동안 기억에 남는 사건이 있었다면 무엇인가요?

김민석

고민하다가 각 레이블에 대응되는 언어모델 4개를 한꺼번에 end-to-end로 학습하는 방법을 떠올렸는데 실제로 이 방법이 큰 성능 향상을 불러오는걸 알았습니다 (처음에는 언어모델 한개로 4개의 타겟을 한번에 예측하는 방식으로 진행했어요). 추가적인 성능 향상을 위해서 데이터 증강을 위해서 googletrans api를 사용하려 했는데 (backtranslation), 몇번 호출하니 계속 막혀서 결국 유료 결제를 해서 데이터 증강에 성공했지만, 증강된 데이터로 학습을 돌려보니 오히려 도움이 더 되지 않았었습니다. 다른 데이터 증강 방법을 활용해보려다가 대회가 끝나버렸군요 ㅠㅠ

 

용준영

큰 사건 없이 무난하게 진행했습니다

 

🎙평소 데이터 분석을 하거나, 공부하는 과정에서 본인만의 노하우가 있다면 무엇인가요?

김민석

논문을 읽고 모델을 구현하는 과정을 자주하고 다양한 실무에 투입돼서 업무 경험 (데이터 분석, 데이터 정제, 모델 설계, 모델 학습)을 많이 쌓는게 좋은 것 같습니다.

 

용준영

노하우라고 할만한 것은 딱히 없습니다

 

🎙수상 기념으로 데이콘에 소원 하나를 빌 수 있다면? (이루어지는 것과 별개입니다!)

김민석

계속 좋은 대회를 많이 주최해주세요! 특히 금융 시계열 관련 대회를 조금 더 주최해주시면 재밌게 참여할 수 있을 것 같습니다 (e.g. 주가, 코인 가격 예측)

 

용준영

데이콘이 캐글처럼 되기를 바랍니다

 

김경민

앞으로도 많은 기회를 열어주세요 :)

 

🎙앞으로의 목표는 무엇인가요?

김민석

저희 모두 40대전에 최소 천억대 자산가들이 되는게 꿈입니다.

 

용준영

부자가 되는 것입니다

 

김경민

연구에 정진할 예정입니다

 

🎙그밖에 데이콘에 기대하는 점이 있나요?

김민석

데이콘이 크게 성장해서 사람들이 이름만 들어도 알정도로 유명한 플랫폼이 되었으면 합니다.

 

용준영

딱히 없습니다

 

김경민

아니요 :)


600마력 팀 2등 코드 공유 보러가기