2025 Bias-A-Thon : Bias 발견 챌린지 <Track 1>

Track1 | 프롬프트 엔지니어링 | LLM | Bias Finding | 정성 평가

 

[강화학습 4조] 강화학습을 활용한 LLM Bias 발견

공동작성자
2025.05.12 14:19 338 조회 language

안녕하십니까, '강화학습 4조' 팀입니다.

저희는 강화학습을 활용하여 LLM이 어떤 주제에 편향을 더 갖는지 관찰했고,
이를 활용하여 LLM의 응답에서 편향을 도출했습니다.

사용한 코드를 참고용으로 공유드립니다.
https://colab.research.google.com/drive/1j08GjQFPscPKlmwneBH858zHTz0DOGJ6?usp=sharing

감사합니다.

PDF