웹 로그 기반 조회수 예측 해커톤

알고리즘 | 정형 | 회귀 | 웹 로그 | RMSE

  • moneyIcon Prize : 인증서
  • 664명 마감

1. 평가

  • 평가산식 : RMSE
  • Public Score: 전체 테스트 데이터 중 30%
  • Private Score: 전체 테스트 데이터 중 70%


2. 참여 규칙

  • 개인으로만 참여 가능
  • 개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능

 

3. 외부 데이터 및 사전 학습 모델

  • 외부 데이터 사용 불가
  • 사용에 법적 제한이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능


4. AutoML 패키지

  • 모든 AutoML 패키지 사용 불가능


5. 유저평가

  • 수상 인증서를 원하는 팀은 먼저 유저 평가를 받아야 합니다.
  • Private 순위 공개 후, 코드 제출 기간 내 코드 공유 페이지에 코드 업로드
  • 제목에 Private 순위와 사용한 모델, 코드에 대한 keyword 기재

예시) Private 1위, LGBM 모델, 00전처리 기법 활용

  • 대회 참가자는 공개된 코드 평가
  • 코드 오류, 외부 데이터 사용 등 코멘트를 댓글로 작성

 

6. 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python, R
  • 모델 학습에서 평가 데이터셋 활용(Data Leakage)시 수상 제외
  • label encoding, one-hot encoding 시 test 데이터 셋 활용
  • test 데이터 셋의 결측치 처리 시 test 데이터 셋의 통계 값 활용
  • data scaling 적용 시 test 데이터 셋 활용
  • test 데이터 셋에 pd.get_dummies() 함수 적용
  • 위 예시 외에도 test 데이터 셋이 모델 학습에 활용되는 경우에 Data leakage에 해당됨
  • 이런 Data Leakage (참고 : Data Leakage에 대한 개인적인 정리) 혹은 규칙 위반이 의심되는 경우 코드를 요청할 수 있음
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 2개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 금지하며 데이콘 대회 부정 제출 이력 있을 시 평가 제한 (참조: https://dacon.io/notice/notice/13)

 

7. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에 답변하지 않고 있음

* 데이콘 답변을 희망하는 경우 토론 제목에 [DACON 답변 요청] 문구를 넣어야 함

예) [DACON 답변 요청] 시상식은 언제 열리나요?

Main Event Schedule

  1. 01.15

    Start Date

  2. 02.05

    Team Merger Deadline

  3. 02.05

    Close

1. 평가

  • 평가산식 : RMSE
  • Public Score: 전체 테스트 데이터 중 30%
  • Private Score: 전체 테스트 데이터 중 70%


2. 참여 규칙

  • 개인으로만 참여 가능
  • 개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능

 

3. 외부 데이터 및 사전 학습 모델

  • 외부 데이터 사용 불가
  • 사용에 법적 제한이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능


4. AutoML 패키지

  • 모든 AutoML 패키지 사용 불가능


5. 유저평가

  • 수상 인증서를 원하는 팀은 먼저 유저 평가를 받아야 합니다.
  • Private 순위 공개 후, 코드 제출 기간 내 코드 공유 페이지에 코드 업로드
  • 제목에 Private 순위와 사용한 모델, 코드에 대한 keyword 기재

예시) Private 1위, LGBM 모델, 00전처리 기법 활용

  • 대회 참가자는 공개된 코드 평가
  • 코드 오류, 외부 데이터 사용 등 코멘트를 댓글로 작성

 

6. 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python, R
  • 모델 학습에서 평가 데이터셋 활용(Data Leakage)시 수상 제외
  • label encoding, one-hot encoding 시 test 데이터 셋 활용
  • test 데이터 셋의 결측치 처리 시 test 데이터 셋의 통계 값 활용
  • data scaling 적용 시 test 데이터 셋 활용
  • test 데이터 셋에 pd.get_dummies() 함수 적용
  • 위 예시 외에도 test 데이터 셋이 모델 학습에 활용되는 경우에 Data leakage에 해당됨
  • 이런 Data Leakage (참고 : Data Leakage에 대한 개인적인 정리) 혹은 규칙 위반이 의심되는 경우 코드를 요청할 수 있음
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 2개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 금지하며 데이콘 대회 부정 제출 이력 있을 시 평가 제한 (참조: https://dacon.io/notice/notice/13)

 

7. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에 답변하지 않고 있음

* 데이콘 답변을 희망하는 경우 토론 제목에 [DACON 답변 요청] 문구를 넣어야 함

예) [DACON 답변 요청] 시상식은 언제 열리나요?

Main Event Schedule

  1. 01.15

    Start Date
  2. 02.05

    Team Merger Deadline
  3. 02.05

    Close