SW중심대학 디지털 경진대회_SW와 생성AI의 만남 : AI 부문

SW중심대학 | AI부문 | 알고리즘 | 음성 | 도메인 적응 | AUC | Brier Score | ECE

  • moneyIcon 상금 : 1,220 만원
  • 897명 마감

 

DAKER! 대회 관련 문의

2024.04.12 13:08 4,043 조회

안녕하세요. 참가자 여러분 대회 관련 자주 묻는 질문들을 모았습니다.

그 외 대회 관련 궁금하신 부분은 댓글로 남겨주세요. 즐거운 코딩 되세요.🧑‍💻🧑‍💻


[팀 구성]

본 경진대회는 참가 신청과 함께 팀 결성을 사전에 진행하기 때문에, 별도의 팀 구성 과정은 진행하지 않습니다.


[제출 파일]

Q) 최종 파일은 어떤 걸 제출하면 되나요?

  • Private 채점 결과가 가장 좋을 것으로 예상되는 파일을 선택하여 제출하시면 됩니다.

Q) 최종 파일 제출 방식은 어떻게 되나요?

  • 해당 대회 페이지에서 '제출' 메뉴를 통해 진행할 수 있습니다. 대회 종료 전, 파일을 선택 후 '제출' 버튼을 클릭하면 제출이 진행됩니다.
  • (단, 최종 제출물을 선택하고 저장한 뒤 추가로 파일을 제출하면 앞선 선택은 초기화됩니다. 초기화될 경우, Public 기준으로 가장 높은 순위의 제출물이 자동으로 선택됩니다.)

Q) Baseline 코드에서 쓴 라이브러리만 사용해야 하나요?

  • 베이스라인은 참고용 자료이므로, 참가자분들만의 코드를 작성해 주시면 됩니다.

Q) 제출 결과물을 삭제하고 싶어요

  • 제출 결과물을 개별 삭제하는 것은 불가능합니다.

Q) 대회 종료 후에도 결과물 제출이 가능한가요?

  • 연습이 가능한 대회는 제출이 가능합니다.

Q) 제출 파일 점수 확인은 어떻게 하나요?

  • 최고 점수는 리더보드에 표시되며 각 파일의 점수는 '제출' 탭에서 확인하실 수 있습니다.

Q) 최종으로 선택할 수 있는 파일 개수는 몇 개인가요?

  • 최종 파일 선택 개수는 각 대회 규칙에서 확인해 주시기 바랍니다.

Q) csv파일 제출 시 에러가 발생합니다.

  • 제공된 sample_submission.csv 파일과 제출 파일의 행, 열 의 크기가 동일해야 합니다. 만약 해당 부분이 일치하지 않을 경우 에러가 발생할 수 있습니다.



[리더보드 점수]

Q) 리더보드에서 점수가 삭제되었습니다.

  • 대회 규정 위반이 의심되는 경우 치팅 처리되어 점수가 삭제됩니다. 점수 복구를 위해서는 코드를 제출하여 검증을 받아야 합니다.

Q) 리더보드 업데이트 시간이 어떻게 되나요?

  • Public Score는 실시간으로 최고 점수가 업데이트되며, Private Score는 대회 종료 후 점수 계산에 오류가 없는지 내부 확인을 거친 뒤 공개됩니다.

Q) 동점인 경우 어떻게 하나요?

  • 동점의 경우 해당 점수를 먼저 기록한 팀이 높은 순위에 위치하게 됩니다.

Q) 리더보드 점수에 문제가 있는 것 같습니다.

  • 리더보드 점수에 이상이 있다고 여겨지는 경우, 데이콘 계정의 메일로 해당 제출물을 설명과 함께 전달해 주시면 확인하여 답변드리겠습니다.

Q) 그간 제출한 모든 파일의 Private 점수가 궁금해요.

  • 최종 선택한 파일 이외의 제출물에 대해서는 따로 Private Score를 계산하지 않습니다. 다만, 대회 종료 이후 연습 기간에 정답 파일을 제출하면 '제출' 탭에서 Private Score를 확인하실 수 있습니다.

Q) Private, Public 차이가 뭔가요?

  • Test 데이터를 특정한 비율로 나누어 Private Score와 Public Score를 계산합니다. Public Score는 대회 기간 중에 리더보드에서 확인 가능합니다. Private Score는 대회 종료 후 리더보드에서 확인 가능하며 Private Score를 통해 최종 순위가 결정됩니다.


[규정]

Q) 코드 검증 과정에서 규정 위반이란 어떤 것 인가요?

  • Test 데이터를 모델 학습 시 활용하거나, 허가되지 않은 외부 데이터 및 사전 학습 모델 사용 시 규정 위반 처리될 수 있습니다.

Q) GPU로 인해 결과물 재현이 되지 않아도 괜찮나요?

  • 최종 제출 점수와 100% 일치하지 않더라도, 순위가 변경되지 않을 수준의 차이는 감안하여 수상자를 결정합니다.

Q) 어떤 경우가 Data leakage에 해당되나요?

: Test 데이터셋은 기본적으로 '아예 볼 수 없다' 라는 가정 하에 진행해야 합니다.

  • label encoding, one-hot encoding 시 test 데이터셋 활용하여 encoder를 fit하는 경우
  • data scaling 적용 시 test 데이터셋 활용하여 scaler를 fit하는 경우
  • pandas의 get_dummies() 함수를 test 데이터셋에 적용하는 경우
  • test 데이터셋의 결측치 처리 시 test 데이터셋의 통계 값 활용
  • test 데이터셋을 EDA하여 얻은 인사이트를 통해 학습에 활용하는 경우
  • test 데이터셋을 학습 과정에 사용하는 모든 행위 (test 데이터셋은 추론에만 활용되어야 합니다.)
  • test 데이터셋의 데이터 개수 정보를 활용하는 경우 (실제 test 데이터셋은 몇개가 입력으로 들어올 지 모르기 때문)
  • 위 예시 외에도 test 데이터셋이 모델 학습에 활용되는 경우엔 Data leakage에 해당됩니다.


로그인이 필요합니다
0 / 1000
순꽃수
2024.06.24 00:37

Score측정은 Accuracy인가요? F1 score인가요?

DACON.GM
2024.06.24 09:16

안녕하세요 순꽃수님,
본 대회의 평가 Metric은 대회 시작과 동시에 공개될 예정입니다.
감사합니다.

최범규
2024.06.28 15:32

외부 데이터의 사용 가능 기준이 궁금합니다.
외부 데이터를 사용하려면 모두에게 무료로 공개하면 되는지,
외부에 무료로 공개된 데이터는 사용해도 되는지,
외부 데이터는 반드시 허락을 받고 사용해야 하는지 궁금합니다.

DACON.GM
2024.06.28 15:33

안녕하세요 최범규님,
외부 데이터 사용에 대한 규칙은 대회 시작(7/1 10:00)과 같이 안내드릴 예정입니다. (대회 개요 -> 규칙)
감사합니다.

김영서
2024.07.01 16:37

삭제된 댓글입니다

DACON.GM
2024.07.01 16:21

진짜 혹은 가짜 사람의 음성이 아예 없으므로,  리얼도 아니고 페이크도 아닌 상태입니다.
Label : [0, 0]

0001
2024.07.04 11:05

test의 경우, 총 6가지 경우의 수가 있다고 안내 받았습니다.
1. fake : 0, real : 0
2. fake : 0, real : 1
3. fake : 0, real : 2
4. fake : 1, real : 0
5. fake : 2, real : 0
6. fake : 1, real : 1

어떠한 결과물 형식으로 제출해야 할까요?

DACON.GM
2024.07.04 11:09

제공드린 제출 양식 파일(sample_submission.csv)을 확인해주세요.
Test 오디오 샘플 내에 진짜 목소리, 가짜 목소리가 각각 존재할 확률을 Multi-Label Classification 예측하는 것입니다.

lucete28
2024.07.10 14:08

test 데이터의 정보중 규칙에 명시된 정보는 이용해도 되나요?(5초의 데이터가 제공됨 등)

DACON.GM
2024.07.10 14:55

네 명세에 기재드린 정보는 모두 활용 가능합니다.

지소현
2024.07.12 14:56

대회 규칙에 외부 데이터 사용이 불가능하다고 되어 있는데, 음성에 노이즈 데이터를 섞을 경우 이것도 외부 데이터라고 간주되는지 궁금합니다.

DACON.GM
2024.07.12 14:57

노이즈 데이터가 외부 데이터라면 사용이 불가능합니다.
노이즈 데이터가 외부 데이터를 사용하지 않고 코드로 생성되거나, 혹은 규칙에 부합하는 사전학습모델에서 생성되는 데이터라면 사용 가능합니다.