난독화된 한글 리뷰 복원 및 생성 AI 경진대회

데이터 증강 관련 규칙 질문

2025.02.09 22:20 827 조회
  • 학습 데이터 증강 가능: 제공된 훈련 데이터를 증강할 수 있지만, ChatGPT, Claude 등과 같은 모델의 코드와 가중치 파일이 공개되지 않은 LLM(또는 사전 학습 모델)은 사용할 수 없습니다. 이는 증강 뿐만 아니라 데이터 전처리에도 동일한 규칙이 적용됩니다.

안녕하세요 위 규칙에 대해서 질문이 있습니다  데이터 전처리 과정에서 사전 공개되지 않은 LLM이 사용불가능하다고 공지해주셨는데요

그렇다면 외부 라이브러리나 코드가 공개되지 않은 사이트를 통한 데이터 증강 (외부데이터가 아닌 기존 데이터를 활용한 데이터증강) 도 불가능한

것인지 궁금합니다

로그인이 필요합니다
0 / 1000
DACON.GM
2025.02.10 09:02

외부 라이브러리나 코드가 공개되지 않은 사이트를 통한 데이터 증강 역시, 그 내부에서 사전 공개되지 않은 LLM(또는 사전 학습 모델)을 사용하는 경우라면 규칙에 의해 사용이 제한됩니다.
단, 만약 해당 외부 도구가 오픈소스 기반의 모델이나 규칙 기반의 방법 등, 공개된 기술을 사용하여 데이터를 증강한다면 문제되지 않습니다.

hyican
2025.02.10 13:29

답변 감사합니다