SW중심대학 디지털 경진대회_SW와 생성AI의 만남 : AI 부문

SW중심대학 | AI부문 | 알고리즘 | 음성 | 도메인 적응 | AUC | Brier Score | ECE

  • moneyIcon 상금 : 1,220 만원
  • 896명 마감

[주제선정 배경]

최근 생성 AI 기술의 발전으로 인해 가짜 음성 합성이 점점 더 정교해지고 있습니다. 이러한 가짜 음성은 기존의 텍스트 기반 가짜 정보 유포 문제에 더해 새로운 위협이 되고 있습니다. 가짜 음성을 통해 유명인의 음성을 모방하거나 중요 인사의 발언을 조작할 수 있기 때문입니다. 이는 개인 및 기업의 명예 실추, 금전적 피해, 사회적 혼란 등 다양한 문제를 야기할 수 있습니다.

따라서 가짜 음성을 신뢰할 수 있는 수준에서 검출하고 탐지할 수 있는 기술 개발이 시급한 상황입니다. 이를 통해 가짜 음성으로 인한 피해를 예방하고, 생성 AI 기술이 건전하게 활용될 수 있는 환경을 조성할 수 있을 것입니다.

또한 가짜 음성 탐지 기술은 음성인식, 스피커 인증, 대화 시스템 등 다양한 분야에서 활용될 수 있어 폭넓은 파급효과가 예상됩니다.

따라서 가짜 음성 검출 및 탐지 기술을 발전시킨다면 앞으로 대두될 수 있는 가짜 음성 문제에 선제적으로 대응할 수 있을 것입니다.


[주제]

생성 AI의 가짜(Fake) 음성 검출 및 탐지


[문제]

5초 분량의 입력 오디오 샘플에서 영어 음성의 진짜(Real) 사람의 목소리와 생성 AI의 가짜(Fake) 사람의 목소리를 동시에 검출해내는 AI 모델을 개발해야합니다.

  • 학습 데이터는 방음 환경에서 녹음된 진짜(Real) 사람의 목소리 샘플과 방음 환경을 가정한 가짜(Fake) 사람의 목소리로 구성되어 있으며, 각 샘플 당 사람의 목소리는 1개입니다.
  • 평가 데이터는 5초 분량의 다양한 환경에서의 오디오 샘플로 구성되며, 샘플 당 최대 2개의 진짜(Real) 혹은 가짜(Fake) 사람의 목소리가 동시에 존재합니다.
  • Unlabel 데이터는 학습에 활용할 수 있지만 Label이 제공되지 않으며, 평가 데이터의 환경과 동일합니다.


[참가 대상]

SW중심대학 학생(58개교) * 재학생 및 휴학생 참가 가능(전공무관), 졸업생 참가 불가

▼ 본 경진대회는 팀 단위로 참가접수를 진행하기에 팀 병합 절차가 별도로 없습니다.

대회 주요 일정

  1. 05.13

    참가 접수

  2. 06.10

    팀 병합 마감

  3. 06.10

    참가 접수 마감

  4. 07.01

    예선 시작

  5. 07.19

    예선 종료

  1. 07.24

    코드 및 발표자료 제출 마감

  2. 07.30

    코드 검증

  3. 07.31

    본선 진출팀 안내

  4. 08.06

    본선 발표평가 및 시상식

[주제선정 배경]

최근 생성 AI 기술의 발전으로 인해 가짜 음성 합성이 점점 더 정교해지고 있습니다. 이러한 가짜 음성은 기존의 텍스트 기반 가짜 정보 유포 문제에 더해 새로운 위협이 되고 있습니다. 가짜 음성을 통해 유명인의 음성을 모방하거나 중요 인사의 발언을 조작할 수 있기 때문입니다. 이는 개인 및 기업의 명예 실추, 금전적 피해, 사회적 혼란 등 다양한 문제를 야기할 수 있습니다.

따라서 가짜 음성을 신뢰할 수 있는 수준에서 검출하고 탐지할 수 있는 기술 개발이 시급한 상황입니다. 이를 통해 가짜 음성으로 인한 피해를 예방하고, 생성 AI 기술이 건전하게 활용될 수 있는 환경을 조성할 수 있을 것입니다.

또한 가짜 음성 탐지 기술은 음성인식, 스피커 인증, 대화 시스템 등 다양한 분야에서 활용될 수 있어 폭넓은 파급효과가 예상됩니다.

따라서 가짜 음성 검출 및 탐지 기술을 발전시킨다면 앞으로 대두될 수 있는 가짜 음성 문제에 선제적으로 대응할 수 있을 것입니다.


[주제]

생성 AI의 가짜(Fake) 음성 검출 및 탐지


[문제]

5초 분량의 입력 오디오 샘플에서 영어 음성의 진짜(Real) 사람의 목소리와 생성 AI의 가짜(Fake) 사람의 목소리를 동시에 검출해내는 AI 모델을 개발해야합니다.

  • 학습 데이터는 방음 환경에서 녹음된 진짜(Real) 사람의 목소리 샘플과 방음 환경을 가정한 가짜(Fake) 사람의 목소리로 구성되어 있으며, 각 샘플 당 사람의 목소리는 1개입니다.
  • 평가 데이터는 5초 분량의 다양한 환경에서의 오디오 샘플로 구성되며, 샘플 당 최대 2개의 진짜(Real) 혹은 가짜(Fake) 사람의 목소리가 동시에 존재합니다.
  • Unlabel 데이터는 학습에 활용할 수 있지만 Label이 제공되지 않으며, 평가 데이터의 환경과 동일합니다.


[참가 대상]

SW중심대학 학생(58개교) * 재학생 및 휴학생 참가 가능(전공무관), 졸업생 참가 불가

▼ 본 경진대회는 팀 단위로 참가접수를 진행하기에 팀 병합 절차가 별도로 없습니다.

대회 주요 일정

  1. 05.13

    참가 접수
  2. 06.10

    팀 병합 마감
  3. 06.10

    참가 접수 마감
  4. 07.01

    예선 시작
  5. 07.19

    예선 종료
  6. 07.24

    코드 및 발표자료 제출 마감
  7. 07.30

    코드 검증
  8. 07.31

    본선 진출팀 안내
  9. 08.06

    본선 발표평가 및 시상식