Customer Loan Grade Classification AI Hackathon

Algorithm | Tabular | Classification | Finance | Macro F1 Score

  • moneyIcon Prize : 인증서
  • 1,689 Users Completed

 

DAKER! 대회 관련 문의

2024.01.08 12:08 1,068 Views

안녕하세요. 참가자 여러분 대회 관련 자주 묻는 질문들을 모았습니다.

그 외 대회 관련 궁금하신 부분은 댓글로 남겨주세요. 즐거운 코딩 되세요.🧑‍💻🧑‍💻


[제출 파일]

Q) 최종 파일은 어떤 걸 제출하면 되나요?

  • private 채점 결과가 가장 좋을 것으로 예상되는 파일을 선택하여 제출하시면 됩니다.

Q) 최종 파일 제출 방식은 어떻게 되나요?

  • 해당 대회 페이지에서 제출 메뉴를 통해 진행할 수 있습니다. 제출할 파일을 선택 후 제출 버튼을 클릭하면 제출이 진행됩니다.

Q) Baseline 코드에서 쓴 라이브러리만 사용해야 하나요?

  • 베이스라인은 참고 용 자료이며 참가자분들만의 코드를 작성해 주시면 됩니다.

Q) 제출 결과물을 삭제하고 싶어요

  • 제출 결과물을 개별 삭제하는 것은 불가능합니다.

Q) 대회 종료 후에도 결과물 제출이 가능한가요?

  • 연습이 가능한 대회는 제출이 가능합니다.

Q) 제출 파일 점수 확인은 어떻게 하나요?

  • 최고 점수는 리더보드에 표시되며 각 파일의 점수는 제출 탭에서 확인하실 수 있습니다.

Q) 최종 파일 선택 개수는 몇개 인가요?

  • 최종 파일 선택 개수는 대회 규칙에서 확인해 주시기 바랍니다.

Q) csv파일 제출 시 에러가 발생합니다.

  • 제공된 sample_submission.csv 파일과 제출 파일의 행, 열 의 크기가 동일해야 하며, 만약 해당 부분이 일치하지 않을 경우 에러가 발생할 수 있습니다.



[리더보드 점수]

Q) 리더보드에서 점수가 삭제된 이유가 뭔가요?

  • 대회 규정 위반이 의심되는 경우 치팅 처리되어 점수가 삭제됩니다. 점수 복구를 위해서는 코드를 제출하여 검증을 받아야 합니다.

Q) 리더보드 업데이트 시간이 어떻게 되나요?

  • Public Score는 실시간으로 최고 점수로 업데이트되며, Private Score는 대회 종료 후 점수 계산에 오류가 없으면 공개됩니다.

Q) 동점인 경우 어떻게 하나요?

  • 동점의 경우 해당 점수를 먼저 기록한 팀이 높은 순위에 위치하게 됩니다.

Q) 리더보드 점수에 문제가 있는 것 같습니다.

  • 리더보드 점수에 이상이 있다고 여겨지는 경우 데이콘 계정의 메일로 해당 제출물을 설명과 함께 전달해 주시면 확인하여 답변드립니다.

Q) Private점수 확인 가능한가요?

  • 최종 선택한 파일 이외의 제출물에 대해서는 따로 Private Score를 계산하지 않습니다. 다만, 대회 종료 이후 연습 기간에는 정답 파일을 제출하면 제출 탭에서 Private Score를 확인하실 수 있습니다.

Q) Private, Public 차이가 뭔가요?

  • Test Data를 특정한 비율로 나누어 Private Score와 Public Score를 계산합니다. Public Score는 대회 기간 중에 리더보드에서 확인가능합니다. Private Score는 대회 종료 후 리더보드에서 확인 가능하며 Private Score를 통해 최종 순위가 결정됩니다.



[코드 제출]

Q) 코드 제출에 포함되어야 하는 내용은 어떤 것이 있나요?

  • 상세한 제출 항목은 규칙의 코드 및 발표자료 제출 규칙을 참고 부탁드립니다.



[규정]

Q) 코드 검증 과정에서 규정 위반이란 어떤 것 인가요?

  • 허가되지 않은 외부 데이터 및 사전 학습 모델 사용 시 규정 위반 처리될 수 있습니다.

Q) GPU로 인해 결과물 재현이 되지 않아도 괜찮나요?

  • 최종 제출 점수 재현이 100% 일치하지 않더라도, 순위가 변경되지 않을 수준의 차이는 감안하여 수상자를 결정하게 됩니다.

Q) 어떤 경우가 Data leakage에 해당되나요?

  • label encoding, one-hot encoding 시 test 데이터 셋 활용
  • pd.get_dummies() 함수에 test 데이터 셋 활용
  • data scaling 적용 시 test 데이터 셋 활용
  • test 데이터 셋의 결측치 처리 시 test 데이터 셋의 통계 값 활용
  • 위 예시 외에도 test 데이터 셋이 모델 학습에 활용되는 경우에 Data leakage에 해당됨.
Login Required
0 / 1000
의상이의면도날
2024.01.11 21:51

"1. 팀 구성은 본 대회 시작일부터 01월 08일까지 가능" 로 명시가 되어있는데,  대회 시작이 15일인데 오류인가요?

도비콘
2024.01.11 22:12

안녕하세요. 의상이의면도날님 
본 해커톤은 1인팀으로만 참가가 가능하기 때문에 시스템상 병합일정을 미리 설정해놨습니다.
감사합니다.
데이콘팀 드림.

zxcv99
2024.01.20 20:36

결과 파일이 계속 error 나고 제출이 안되는데 혹시 방법이 있을까요? 인코딩도 바꾸고 해봤는데 계속 에러가 뜹니다.

DACON.SeungYoon
2024.01.22 09:08

안녕하세요, zxcv99 님
우선 baseline의 형식에 맞춰서 제출 시도를 권장드리며, 
이후 계속 에러가 발생할 경우 제출 파일을 dacon@dacon.io로 첨부 부탁드립니다. 
감사합니다.

병또먹
2024.02.04 10:38

Data leakage 관련 질문입니다.
pd.get_dummies() 함수에 test 데이터 셋 활용시에 data leakage라고 명시 되어있는데

train = pd.get_dummies(train, columns = ["col_name"], dtype=int)
test = pd.get_dummies(test, columns = ["col_name"], dtype=int)

이런 형식으로 하면 규정에 어긋난다는 것인가요?

DACON.SeungYoon
2024.02.05 09:44

안녕하세요, 병또먹 님
train 데이터로부터 분석된 결과를 바탕으로 지정된 컬럼만을 이용하여 get_dummies를 사용하는 것은 data leakage가 아닙니다. 
다만 단순히 get_dummies를 test 데이터에 적용할 경우, test 데이터에만 존재하는 값이 컬럼으로 생성될 가능성이 존재합니다. 
해당 경우 test 데이터에만 존재하는 값으로 모델링을 적용한 것이 되기에 data leakge로 간주하고 있습니다. 
감사합니다. 

시호
2024.02.17 16:26

심사관련 이메일 보냈습니다. 심사종료 이전에 답변해주시면 감사하겠습니다.

DACON.SeungYoon
2024.02.19 09:28

안녕하세요, 시호 님
메일 답변 드리겠습니다. 
감사합니다.