도배 하자 질의 응답 처리 : 한솔데코 시즌2 AI 경진대회

알고리즘 | 언어 | LLM | MLOps | QA | Cosine Similarity

상금 : 1000만 원
1,381명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

QLoRA + 4bit quantization + LDCC-SOLAR-10.7B(≈9GB vram used)

귀여미

2024.02.14 22:07 3,262 조회 language

inference 부분은 HyunsooLee님이 좋은 코드를 올려놓으셨기 때문에 그 코드 활용하시면 될 것 같습니다..
QLoRA랑 base model merge 하신 뒤에 베이스라인 코드 inference 부분 쓰셔도 됩니다
target_modules는 모델에 따라 다르니 바꾸시면 됩니다

코드

댓글 17개

로그인이 필요합니다

comment

0 / 1000

basslibrary

2024.02.15 22:31

저는 VRAM 8GB 짜리 GPU로 쓰는데, 6B 모델을 qLora 로 돌리려다가 오류가 나는 바람에
더 큰 모델은 생각도 못하고, 1.3B 모델만 쓰고 있는데, 한번 시도 해봐야 겠네요.
감사합니다.
추신, VRAM 8GB로는 1 batch도 못 돌립니다.

귀여미

2024.02.16 13:46

아무래도 8기가 내로 돌리시려면 7B 모델 쓰시거나 QLoRA말고 다른 방법을 택하셔야 할것 같습니다

꾸라짱

2024.02.18 19:25

이거하면 순위표에서 몇점 정도 나오나요?

귀여미

2024.02.19 13:03

데이터 그대로 쓰면 0.6후반이나 0.7초반으로 나오지 않을까 싶네요.. 아마 이 대회는 주어진 데이터를 어떻게 늘리냐 싸움 같습니다

베너

2024.02.20 21:05

안녕하세요! 참가에 의의를 두고 있는 초심자 입니다. 혹시 말씀하신 분의 Inference code 는 gguf 파일을 사용하는 것 같은데 SOLAR 모델 pretraining 한 것은 pth 파일로 저장되는 것으로 알고 있습니다. 이리저리 해보다가 토크 게시판을 보니 SOLAR 기반 모델들의 경우에는 llama-cpp 를 사용하지 못한다고 하는데 그렇다면 Inference code 의 대부분을 수정해서 사용하신걸까요..?

대회 결과에 필수적인 부분이긴 하지만 자료를 잘 찾아보지 못하겠어서 댓글 남깁니다..
다시한번 코드 공유에 감사드립니다!

귀여미

2024.02.20 21:09

저는 outputs 폴더에 로라 어댑터 파일을 솔라 베이스 모델에 합쳐서 베이스라인 코드 그대로 사용했습니다.. 아마 peft 라이브러리 쓰시면 코드 몇출로 합칠 수 있을거에요

베너

2024.02.20 21:16

감사합니다! 참고해서 해보겠습니다!!

text121

2024.02.21 01:30

LoraConfig 에서 target_modules은 정해져있는건가요 아니면 작성하는기준이 따로있는건가요?

귀여미

2024.02.22 12:54

https://stackoverflow.com/questions/76768226/target-modules-for-applying-peft-lora-on-different-models
해당 링크가 도움이 될것 같습니다!