분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[public 30위/ private 8위 알잘딸깍센] 코드와 솔루션 PPT 제출합니다!
공동작성자
BERT 기반 텍스트 분류와 앙상블 학습을 결합하여 다중 모델 합의 투표 방식으로 강건한 예측을 수행하는 코드입니다.
제출 코드는 가독성을 위해 깃허브 링크 송부드립니다.
링크 :
https://github.com/jinnwoook/DACON-x-BDA-2nd-AI-Competition-Predicting-Learner-Completion-Rates
안녕하세요! 코드 공개 전환하였습니다. 전체 코드는 해당 글처럼 깃허브 링크로 공유 가능할까요??
네, 가능합니다.
감사합니다!
BERT 기반 모델로 접근하다 포기했었는데 저렇게 사용할 수도 있었네요..
좋은 인사이트 배우고 갑니다!
BERT 모델을 활용할 때, 어떤 사전 Task로 학습되었는지 그리고 train.csv 데이터를 BERT 인풋에 맞춰 어떻게 정제하는지에 따라 성능 차이가 정말 크더라고요. 그 과정에서 시행착오를 많이 겪은거 같습니다 ㅠㅠ
저는 XGBoost와 Catboost 조합으로 성능을 올리기가 쉽지 않았는데, knowin_kyeong님의 방법론을 보고 EDA의 디테일 차이에서 큰 인사이트를 얻었습니다. 정말 고생 많으셨습니다!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 검증을 위해 공개로 전환부탁드립니다.