분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Alpaca야. 넌 누가 이겼을 것 같아? (Alpaca-LoRA fine-tuning을 이용한 판결 예측)
이번에 논문 베이스 모델에서 오픈소스 모델까지 사용 가능한 모델의 폭이 넓어져서, 호기롭게 도전해본 Alpaca-LoRA fine-tuning입니다.
아주 약간의 EDA와 Augmentation 기법도 있으니 보고가시면 좋을 것 같습니다.
* 모델 Github : https://github.com/tloen/alpaca-lora
* Text Augmentation 코드 참고 : https://www.kaggle.com/code/swarajshinde/eda-data-augmentation-techniques-for-text-nlp/notebook
* 파인튜닝 코드 참고 : https://www.youtube.com/watch?v=aUXwVp4eUH4&t=421s (유튜브 : 빵형의 개발도상국)
* 에러 발생 시 참고 : https://github.com/tloen/alpaca-lora/issues/483
예측까지 하고 싶었으나, 512 tokens 기준 사건 case 하나 당 예측 시간이 약 40초 정도 걸리더라구요...
Test 데이터에 대해 다 예측하려면 A100 GPU를 꽤 많이 돌려놔야 하는데, 제가 그럴만한 예산이 없어서... ㅎㅎ
도움이 됐으면 해서 코드를 공유합니다.
2~3건 정도 Test 데이터 예측을 했는데, 올린 PDF 파일처럼 output으로 잘 나오는 것을 확인했습니다.
(판결결과가 정확한지는 모르겠지만…)
여유가 있으신 분들이라면 아마 selenium이나 beautifulsoup을 이용하거나, Ajax request / response 등을 이용하는 등,
더 기발한 방법을 통해서 예측한 output을 가져올 수 있을거라 생각합니다.
날도 더워지는데 다들 건강 챙기고 열심히 하셔서 좋은 결과 얻으시기 바랍니다!
감사합니다~
최고네요
ㅎㅎ 점점 더 빨리 기술이 발전하는거 같아요... 감사합니다!
방식이 독특해요
저도 처음 써봤는데 유튜브 영상도 그렇고 보니까 나온지 한 2~3달 정도밖에 안되서,
독특한 방식이라 좀 많이 헤맸습니다... ㅎㅎ
예산만 있으면 다양하게 시도해보고 싶네요! 좋은 글 감사합니다!
돈만 있으면 다 할수 있죠 ㅎㅎ 읽어주셔서 감사합니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
좋은글 감사합니다