분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[public 30위/ private 8위 알잘딸깍센] 코드와 솔루션 PPT 제출합니다!
공동작성자
BERT 기반 텍스트 분류와 앙상블 학습을 결합하여 다중 모델 합의 투표 방식으로 강건한 예측을 수행하는 코드입니다.
제출 코드는 가독성을 위해 깃허브 링크 송부드립니다.
링크 :
https://github.com/jinnwoook/DACON-x-BDA-2nd-AI-Competition-Predicting-Learner-Completion-Rates
안녕하세요! 코드 공개 전환하였습니다. 전체 코드는 해당 글처럼 깃허브 링크로 공유 가능할까요??
네, 가능합니다.
감사합니다!
BERT 기반 모델로 접근하다 포기했었는데 저렇게 사용할 수도 있었네요..
좋은 인사이트 배우고 갑니다!
BERT 모델을 활용할 때, 어떤 사전 Task로 학습되었는지 그리고 train.csv 데이터를 BERT 인풋에 맞춰 어떻게 정제하는지에 따라 성능 차이가 정말 크더라고요. 그 과정에서 시행착오를 많이 겪은거 같습니다 ㅠㅠ
저는 XGBoost와 Catboost 조합으로 성능을 올리기가 쉽지 않았는데, knowin_kyeong님의 방법론을 보고 EDA의 디테일 차이에서 큰 인사이트를 얻었습니다. 정말 고생 많으셨습니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 검증을 위해 공개로 전환부탁드립니다.