건설공사 사고 예방 및 대응책 생성 : 한솔데코 시즌3 생성 AI 경진대회

알고리즘 | NLP | 생성형 AI | LLM | MLOps | 유사도

 

[옥계동 Private 14th] 코드 및 PPT자료 공유

2025.04.15 16:56 852 조회 language

PDF 파일에서 일부 글자가 깨져 보이는 현상이 있습니다. DACON 플랫폼에서 해당 폰트를 인식하지 못해 발생한 것으로 판단됩니다. 동일한 발표 자료를 GitHub에도 업로드해 두었으니, 번거로우시겠지만 GitHub 버전을 확인해 주시면 감사하겠습니다.

주요 수행 내용

도메인 특화 모델 구축 : 파인 튜닝을 통해 건설 분야의 용어와 맥락을 이해하는 LLM을 구현하고, Custom Retriever를 설계·튜닝하여 도메인 맞춤형 검색 모델을 구성했습니다.
RAG 파이프라인 설계 : 대규모 텍스트 데이터에서 사고 관련 정보를 효율적으로 검색하고, LLM을 통해 재발 방지 대책 및 대응책을 자동 생성하는 파이프라인을 구축했습니다.
Post Processing : 최종 생성된 텍스트에 대한 후처리 로직을 적용하여, 가독성과 전문성을 모두 만족하는 고품질 결과물을 산출했습니다.

코드 실행

github에 용량으로 학습 모델의 가중치는 repository에 포함되어 있지 않습니다.
Model_Training.ipynb 파일을 통해 LLM모델을 학습학고, Final_Submission_Guide.ipynb 파일을 순서대로 실행하면 됩니다.

github : https://github.com/poi2507/HansolDeco_S3_AI_Construction_Safety

PDF
로그인이 필요합니다
0 / 1000
옥계동
2025.04.15 17:10

삭제된 댓글입니다

도비콘
2025.04.16 16:24

옥계동님 안녕하세요.
제보해 주셔서 감사합니다. ☺️
버그 패치 완료 했습니다.

이전 글
이전 글이 존재하지 않습니다.
현재 글
[옥계동 Private 14th] 코드 및 PPT자료 공유
대회 - 건설공사 사고 예방 및 대응책 생성 : 한솔데코 시즌3 생성 AI 경진대회
좋아요 7
조회 852
댓글 1
3달 전
다음 글
생성문의 Embedding Vector 변환과 S-Bert Cosine 유사도 평가 산식
대회 - 건설공사 사고 예방 및 대응책 생성 : 한솔데코 시즌3 생성 AI 경진대회
좋아요 2
조회 2,674
댓글 1
5달 전