잡케어 추천 알고리즘 경진대회

알고리즘 | 정형 | 분류 | 추천 | Macro f1 score

  • moneyIcon 상금 : 총 1,000만원
  • 1,629명 마감

 

private score 15위 코드 공유 (private score : 0.70639)

2022.01.29 22:36 2,961 조회 language

안녕하세요! PCEO AI CLUB의 리더 ‘제풀이’입니다. 이번 대회를 처음으로 제대로 데이콘 대회에 참여해 보았는데, 생각보다 좋은 성적을 얻었네요. public LB는 0.70296, 65위로 대회를 마무리해서 기대하지 않았는데, private LB가 50계단이나 올라서 놀랐습니다. 아래 코드에는 상당히 간단한 아이디어만 담겨 있지만, 시도해본 내용들이 상당히 많아서 조금 코드 위에 markdown으로 조금 정리해보았습니다. 참고로 코드의 상당부분은 국경원요원님의 멋진 코드를 참고했습니다. 공유 감사합니다!(https://dacon.io/competitions/official/235863/codeshare/3887?page=1&dtype=recent)

p.s. PCEO AI CLUB은 특허청 산하 포스텍영재기업인교육원 수료생들과 지인들이 모여 AI에 관해 공부하고 캐글 및 데이콘 대회에 참여하는 동아리입니다.
p.s. cluster 데이터 등 관련 자료가 업로드 되어있는 github repo입니다. (https://github.com/PCEO-AI-CLUB/JobCare--DACON)

코드
로그인이 필요합니다
0 / 1000
씩씩한오리너구리
2022.01.30 09:32

굉장하시군요.. 잘봣습니다!
궁금한게 person이랑 content첫 자리수가 의미가 있는 것은 어떻게 아신건가요??? 특정컬럼의 자릿수 별로 영향도를 측정하는 eda방법이 있나요?

전문가_전문가_닌자거북이
2022.01.30 10:40

팀원들과 논의중에 person에 특정 자리수가 연도나 기타 의미가 있을수도 있다는 의견이 나와서, 각 자리수별 target값 평균을 내보았습니다! 모두 다 해보았는데 첫째자리만 유의미한 차이가 있더라고요.