웹 로그 기반 조회수 예측 해커톤

알고리즘 | 정형 | 회귀 | 웹 로그 | RMSE

  • moneyIcon 상금 : 인증서
  • 664명 마감

1. 평가

  • 평가산식 : RMSE
  • Public Score: 전체 테스트 데이터 중 30%
  • Private Score: 전체 테스트 데이터 중 70%


2. 참여 규칙

  • 개인으로만 참여 가능
  • 개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능

 

3. 외부 데이터 및 사전 학습 모델

  • 외부 데이터 사용 불가
  • 사용에 법적 제한이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능


4. AutoML 패키지

  • 모든 AutoML 패키지 사용 불가능


5. 유저평가

  • 수상 인증서를 원하는 팀은 먼저 유저 평가를 받아야 합니다.
  • Private 순위 공개 후, 코드 제출 기간 내 코드 공유 페이지에 코드 업로드
  • 제목에 Private 순위와 사용한 모델, 코드에 대한 keyword 기재

예시) Private 1위, LGBM 모델, 00전처리 기법 활용

  • 대회 참가자는 공개된 코드 평가
  • 코드 오류, 외부 데이터 사용 등 코멘트를 댓글로 작성

 

6. 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python, R
  • 모델 학습에서 평가 데이터셋 활용(Data Leakage)시 수상 제외
  • label encoding, one-hot encoding 시 test 데이터 셋 활용
  • test 데이터 셋의 결측치 처리 시 test 데이터 셋의 통계 값 활용
  • data scaling 적용 시 test 데이터 셋 활용
  • test 데이터 셋에 pd.get_dummies() 함수 적용
  • 위 예시 외에도 test 데이터 셋이 모델 학습에 활용되는 경우에 Data leakage에 해당됨
  • 이런 Data Leakage (참고 : Data Leakage에 대한 개인적인 정리) 혹은 규칙 위반이 의심되는 경우 코드를 요청할 수 있음
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 2개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 금지하며 데이콘 대회 부정 제출 이력 있을 시 평가 제한 (참조: https://dacon.io/notice/notice/13)

 

7. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에 답변하지 않고 있음

* 데이콘 답변을 희망하는 경우 토론 제목에 [DACON 답변 요청] 문구를 넣어야 함

예) [DACON 답변 요청] 시상식은 언제 열리나요?

대회 주요 일정

  1. 02.13

    대회 시작

  2. 03.04

    대회 종료

  3. 03.08

    코드 제출 마감

  4. 03.11

    코드 평가 종료

  5. 03.11

    최종 수상자 발표

1. 평가

  • 평가산식 : RMSE
  • Public Score: 전체 테스트 데이터 중 30%
  • Private Score: 전체 테스트 데이터 중 70%


2. 참여 규칙

  • 개인으로만 참여 가능
  • 개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능

 

3. 외부 데이터 및 사전 학습 모델

  • 외부 데이터 사용 불가
  • 사용에 법적 제한이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능


4. AutoML 패키지

  • 모든 AutoML 패키지 사용 불가능


5. 유저평가

  • 수상 인증서를 원하는 팀은 먼저 유저 평가를 받아야 합니다.
  • Private 순위 공개 후, 코드 제출 기간 내 코드 공유 페이지에 코드 업로드
  • 제목에 Private 순위와 사용한 모델, 코드에 대한 keyword 기재

예시) Private 1위, LGBM 모델, 00전처리 기법 활용

  • 대회 참가자는 공개된 코드 평가
  • 코드 오류, 외부 데이터 사용 등 코멘트를 댓글로 작성

 

6. 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python, R
  • 모델 학습에서 평가 데이터셋 활용(Data Leakage)시 수상 제외
  • label encoding, one-hot encoding 시 test 데이터 셋 활용
  • test 데이터 셋의 결측치 처리 시 test 데이터 셋의 통계 값 활용
  • data scaling 적용 시 test 데이터 셋 활용
  • test 데이터 셋에 pd.get_dummies() 함수 적용
  • 위 예시 외에도 test 데이터 셋이 모델 학습에 활용되는 경우에 Data leakage에 해당됨
  • 이런 Data Leakage (참고 : Data Leakage에 대한 개인적인 정리) 혹은 규칙 위반이 의심되는 경우 코드를 요청할 수 있음
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 2개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 금지하며 데이콘 대회 부정 제출 이력 있을 시 평가 제한 (참조: https://dacon.io/notice/notice/13)

 

7. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에 답변하지 않고 있음

* 데이콘 답변을 희망하는 경우 토론 제목에 [DACON 답변 요청] 문구를 넣어야 함

예) [DACON 답변 요청] 시상식은 언제 열리나요?

대회 주요 일정

  1. 02.13

    대회 시작
  2. 03.04

    대회 종료
  3. 03.08

    코드 제출 마감
  4. 03.11

    코드 평가 종료
  5. 03.11

    최종 수상자 발표