분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
test 데이터에 관하여 질문 드립니다.
"각 샘플 당 최대 2명의 목소리(진짜 혹은 가짜)가 존재"라는 표현에 대하여 질문드립니다.
2명의 목소리가 들어있는 샘플은 둘 중 어떤 상황인가요?
1. 한 샘플에는 가짜와 진짜 목소리 모두 들어가 있다.
2. 한 샘플에 가짜 목소리 2개 이거나 진짜 목소리 2개이다.
sample_submission 양식에서 fake, real 확률을 모두 제출하는 것으로 보아 1번인 것으로 보입니다(그렇지 않으면 fake일 확률만을 제출하게 하고 real일 확률은 1을 빼서 채점하면 되므로). 그리고 TEST_05166.ogg 파일을 들어보면 1번 같아요. 그러나 "혹은"의 의미는 2번을 의미하는 것으로 알고 있습니다.
빠른 답변 감사드립니다!!
그러면 제출 양식에 확률을 적는것이 아니라 사람 목소리가 존재하는 라벨로 [0,0][0,1],[1,0],[1,1]로 제출하는것이 맞을까요?
예시로 들어드린 것은 Ground-Truth 일 때를 예시로 들어드린 것이며, 제출 양식은 데이터 명세와 같이
1) id : 평가용 오디오 샘플 ID
2) fake : 해당 샘플에 가짜 목소리가 존재할 확률 (0~1)
3) real : 해당 샘플에 진짜 목소리가 존재할 확률 (0~1)
위의 컬럼으로 구성되어 있습니다.
평가 산식은 모두 확률 예측 결과값에 기반하여 계산되는 산식이기에 0~1의 확률로 제출하시는 것을 권장드립니다.
혹시 목소리 이외에 사람 소리(예: 웃음 소리, 울음 소리 등)는 어떻게 처리하는지 궁금합니다.
구체적으로 웃음 소리의 라벨은 [0, 0]으로 처리하면 될지 궁금합니다.
진짜와 가짜 모두 아닌 상태입니다. 즉 배경소음인 상태입니다. Label : [0, 0]
fake와 real 이 존재할 확률이고 fake와 real이 모두 존재할 수 있으니 두 합이 꼭 1이 되지 않아도 되는 걸로 이해해도 되나요?
네, 각각 독립적인 확률입니다.
삭제된 댓글입니다
삭제된 댓글입니다
삭제된 댓글입니다
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Test 샘플은 6가지 케이스로 구성될 수 있습니다.
1) 1명의 진짜 목소리만 존재
2) 1명의 가짜 목소리만 존재
3) 1명의 진짜 목소리와 1명의 가짜 목소리가 존재
4) 2명의 진짜 목소리가 존재
5) 2명의 가짜 목소리가 존재
6) 아예 목소리가 없는 경우
예를 들어, 특정 테스트 샘플에 가짜와 진짜 목소리의 2명의 사람 목소리가 존재하는 경우 Label은 [1, 1]이 됩니다.
반대로 사람 목소리가 샘플에 하나도 존재하지 않는 다면 Label은 [0, 0]이 됩니다.
즉, 샘플에 각각 진짜 / 가짜 목소리가 존재하는 지 탐지하는 Multi-Label Classification을 수행한다고 이해해주시면 됩니다.
감사합니다.