난독화된 한글 리뷰 복원 및 생성 AI 경진대회

알고리즘 | 월간 데이콘 | NLP | 생성형 AI | LLM | F1 Score

  • moneyIcon 데이스쿨 프로 구독권
  • 792명 마감

 

데이터 증강 관련

2025.02.18 22:40 1,332 조회

데이터 증강 관련하여 궁금한 사항이 있습니다.

구글 숙소 리뷰를 수집하는 것은 외부 데이터에 해당하나요?

로그인이 필요합니다
0 / 1000
DACON.GM
2025.02.19 09:02

네, 직접 구글 숙소 리뷰를 수집하는 것은 외부 데이터 사용에 해당합니다.
본 대회의 규칙은 경진대회 제공 데이터만 사용할 수 있으며, 외부 데이터는 사용이 불가능합니다.

estrella_gyuuuuuu
2025.02.19 15:42

Hugging Face에 있는 공개된 모델로 데이터 증강하는 것은 괜찮을까요?

DACON.GM
2025.02.19 15:43

네 가능한 방법입니다. 다만, 데이터 생성에 활용하는 모델 또한 사전학습모델 사용 규칙을 따라야합니다.

estrella_gyuuuuuu
2025.02.19 15:52

네, 감사합니다. 혹시 마지막으로 리뷰를 제가 생성하는 것은 가능한가요? 저의 뇌에서 나온 데이터도 외부 데이터인가요? 그리고 제가 생각해낸 리뷰 데이터를 공개된 사전 학습 모델을 통해 가공하면 이것은 사전 학습 모델을 통해 증강된 것이 맞을까요?

DACON.GM
2025.02.19 15:56

불가능한 방법입니다.
데이터 생성에 활용하는 사전학습모델의 Output을 사용하는 것은 가능하나, 이 생성 모델에 활용하는 데이터나 프롬프트 또한 학습 데이터 기반으로 이루어져야합니다.

estrella_gyuuuuuu
2025.02.19 16:01

이해했습니다. 기존 데이터를 기반으로 프롬프트 엔지니어링을 통해 데이터 증강만 허용된다는 말씀이시군요.

sentormar131
2025.08.11 09:25

삭제된 댓글입니다

rusellfe
2025.08.11 09:25

삭제된 댓글입니다

frankasachi
2025.08.11 09:25

삭제된 댓글입니다

seraphina25
2025.09.22 17:03

삭제된 댓글입니다

nadiamoore22
2025.09.22 17:03

삭제된 댓글입니다

edformula
2025.09.22 17:03

삭제된 댓글입니다

이전 글
이전 글이 존재하지 않습니다.
현재 글
데이터 증강 관련
대회 - 난독화된 한글 리뷰 복원 및 생성 AI 경진대회
좋아요 7
조회 1,332
댓글 12
10달 전
다음 글
[1위] 난독화된 한글 리뷰 AI 경진대회 읶겄돆 핶돆핶볶싞짂
대회 - 난독화된 한글 리뷰 복원 및 생성 AI 경진대회
좋아요 8
조회 1,127
댓글 0
9달 전