분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
2025 Bias-A-Thon : Bias 대응 챌린지 <Track 2>
규칙 관련 질문입니다.
안녕하세요.
이전 글 답변 주신 내용 중 3번 항목에서, “동일한 모델과 알고리즘을 모든 샘플에 일관되게 적용한다면, generate()를 반복 호출하는 방식은 허용된다”고 명시해 주셨는데, 이 부분과 관련하여 추가적으로 확인하고 싶은 점이 있어 문의드립니다.
이번 대회는 RAG(Retrieval-Augmented Generation) 및 프롬프트 엔지니어링을 중심으로, 사전학습 없이 LLM을 효율적으로 활용하는 능력을 평가하는 것으로 이해하고 있습니다. 그런데 generate()를 반복 호출하는 방식은 단순 RAG를 넘어서, 다음과 같은 고급 LLM 활용 기법을 구현할 수 있다는 점에서 해석의 여지가 있습니다:
Self-Consistency / Multi-path Reasoning
동일한 질문에 대해 다양한 조건(예: temperature 변화)으로 여러 응답을 생성한 뒤, 다수결이나 일관성 판단을 통해 최종 응답을 선택하는 방식.
고도화된 ReAct 방식
단순 검색을 넘어서, LLM이 Thought → Action(Update RAG DB) → Observation 단계를 반복하면서 외부 도구와 상호작용하는 agent-style 추론 방식.
이러한 기법들은 단순히 검색된 정보를 기반으로 응답을 생성하는 RAG의 범위를 넘어, LLM이 능동적으로 추론을 반복하거나 응답을 조율하는 구조로 이해될 수 있습니다.
이에 따라, 대회의 공정성과 일관된 기준을 위해 다음 사항에 대해 명확한 가이드라인을 요청드립니다.
Q: 위에서 제시한 Self-Critique, Self-Consistency, 심화된 ReAct와 같은 방식이 대회에서 허용되는 ‘RAG 및 프롬프트 엔지니어링’의 범주에 포함되는지, 혹은 제한되는 방식인지 구체적인 판단 기준이나 예시를 안내해주실 수 있을까요?
또한,
※ Raw Input에 대해서 Raw Output이 Reproduce가 안되거나, Raw Input에 Retrived 된 Context에 Bias DB가 포함되는 경우 규칙 위반에 해당합니다.
Q:위의 규칙에서 RAG를 하는데, Input에 Retrieved된 Context가 입력되지 않아야 한다는 규칙이 이해가 되지 않아 풀어 설명해주시면 감사하겠습니다.
참가자들이 동일한 기준 아래 전략을 수립할 수 있도록, 반복 호출이 허용되는 기술적 범위에 대한 구체적인 명시가 있다면 감사하겠습니다.
핵심은 모든 샘플에 대해 동일한 알고리즘을 적용해야 합니다.
generate() 반복 호출은 정적이고 일관된 조건 하에 허용되며,
Retrieval된 Context 역시 모든 샘플에 대해 고정된 방식으로 입력되고, 그 내용과 흐름이 재현 가능한 구조로 유지되어야 합니다.
프롬프트 설계 + 검색된 정보 기반의 응답 생성을 넘어서는 동적 행동은 제한됩니다.
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요, mutoy님.
본 대회는 공정하고 중립적인 응답을 생성하는 것을 목표로 합니다.
이에 따라 다음과 같은 기준을 적용합니다.
- 허용되는 방식
1. generate() 반복 호출 기반 Self-Consistency
동일한 질문에 대해 temperature 등 sampling 조건을 달리하여 여러 응답을 생성하고, 다수결 등의 기준으로 최종 응답을 선택하는 방식은 허용
단, 모든 샘플에 동일한 알고리즘 및 조건 하에 일관되게 적용
2. 프롬프트 기반의 간단한 Self-Critique / ReAct 구조
Thought → Action(Search) → Observation → Answer 형식의 프롬프트 체인 형태로,
외부 API나 동적 환경 연동 없이 내부 RAG 검색 결과와 텍스트 기반 응답만으로 이루어진 구조는 허용
- 제한되는 방식
1. 샘플마다 조건이 달라지는 반복 호출
특정 샘플에만 temperature를 다르게 하는 등 샘플별 알고리즘 흐름에 차이가 발생하는 경우는 불가
2. 외부 툴/API/서버와 연동되는 Tool-Use Agent 구조
ReAct 방식에서 LLM이 외부 API를 호출하거나, 웹 검색 등과 상호작용하는 방식은 대회 규칙 위반
3. RAG 과정에서 DB를 구조적으로 변경하거나 동적으로 업데이트하는 행위
LLM이 새로운 문서를 생성하거나, DB를 자기 피드백에 따라 업데이트하는 방식 등은 불가
4. Retrieval된 Context에 편향된 문서(Bias DB)가 포함되는 경우
편향된 정보가 입력되어 결과에 영향을 미치게 되면, 의도치 않은 편향이 개입된 것으로 간주되어 규칙 위반
Retrieval은 고정된 기준과 재현 가능한 방식으로 수행되어야 하며, 편향된 문서의 삽입은 제한