현 대회의 방향성과 국내 LLM의 한계성

도배 하자 질의 응답 처리 : 한솔데코 시즌2 생성 AI 경진대회

2024.02.20 00:39 3,798 Views

현재 리더보드의 상위권에 속하는 사람들은 다음의 모델을 기반으로 있을 것이다.

'yanolja/KoSOLAR-10.7B-v0.2', 'ONS-AI-RESEARCH/ONS-SOLAR-10.7B', 'kimwooglae/WebSquareAI-Instruct-KoSOLAR-10.7b-v0.5.34', 'LDCC/LDCC-SOLAR-10.7B'

또한 이들은, DPO를 사용하는 중이다.

`2. 허깅페이스 ko-llm 리더보드와 en-llm 리더보드를 LDCC/LDCC-SOLAR-10.7B 모델로 비교해보면, 같은 모델임에도 불구하고 전체적인 벤치마크에서 en-llm 능력이 우수한 것을 확인할 수 있는데 이는 LDCC의 모델이 upstage/SOLAR-10.7B-v1.0,를 기반으로 한 야놀자의 모델을 사용해서 그런 것 뿐만 아니라, 토크나이저의 차이로 인한 결과로 보인다.

현재 리더보드에 존재하는 모델들의 최초 베이스 모델들은 EN-LLM 기반 모델들이며, 이들은 각각 Sentecepiece를 기반으로 한 BPS 모델을 사용하는 데, 이는 영어권 문자에 더 적합하지, 아직 아시아권 나라에 존재하는 문자들을 효율적으로 관리하지 못한다.
새로운 토크나이저 기법이 등장하지 않는 이상, 국내 LLM의 한계는 명확히 존재한다고 볼 수 있다.
이는, 아무리 좋은 LLM 모델이 나오더라도, 국내에서 상용화되는 서비스를 기대하기는 어렵다고 예상할 수 있다.
국내기업들이 LLM을 기반으로 한 서비스를 유치하기 어려운 기술적 한계점.

`3. SOLAR 10-7B를 기반으로 한 모델들은 토크나이저 이슈로 GGUF 변환을 사용할 수 없고 이에 따라 llama-cpp를 이용할 수 없는 단점이 존재한다.