분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[옥계동 Private 14th] 코드 및 PPT자료 공유
PDF 파일에서 일부 글자가 깨져 보이는 현상이 있습니다. DACON 플랫폼에서 해당 폰트를 인식하지 못해 발생한 것으로 판단됩니다. 동일한 발표 자료를 GitHub에도 업로드해 두었으니, 번거로우시겠지만 GitHub 버전을 확인해 주시면 감사하겠습니다.
주요 수행 내용
도메인 특화 모델 구축 : 파인 튜닝을 통해 건설 분야의 용어와 맥락을 이해하는 LLM을 구현하고, Custom Retriever를 설계·튜닝하여 도메인 맞춤형 검색 모델을 구성했습니다.
RAG 파이프라인 설계 : 대규모 텍스트 데이터에서 사고 관련 정보를 효율적으로 검색하고, LLM을 통해 재발 방지 대책 및 대응책을 자동 생성하는 파이프라인을 구축했습니다.
Post Processing : 최종 생성된 텍스트에 대한 후처리 로직을 적용하여, 가독성과 전문성을 모두 만족하는 고품질 결과물을 산출했습니다.
코드 실행
github에 용량으로 학습 모델의 가중치는 repository에 포함되어 있지 않습니다.
Model_Training.ipynb 파일을 통해 LLM모델을 학습학고, Final_Submission_Guide.ipynb 파일을 순서대로 실행하면 됩니다.
github : https://github.com/poi2507/HansolDeco_S3_AI_Construction_Safety
옥계동님 안녕하세요.
제보해 주셔서 감사합니다. ☺️
버그 패치 완료 했습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
삭제된 댓글입니다