12월에도 스테이지1 무료 혜택은 쭈~욱 계속됩니다!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
EDA 공유
안녕하세요
단순히 의식의 흐름 대로 진행해 본 EDA 내용들을 공유합니다.
NLP 분야가 아직 익숙하진 않아서 맞는 방법들로 진행했는지 잘 모르겠네요.
colab으로 진행했고 마지막에 tokenizer는 koBERT Tokenizer를 활용했습니다.
(https://github.com/SKTBrain/KoBERT)
koBERT는 torch 기반인 것 같은데 text처리 메서드들은 keras가 더 익숙해서 keras로 사용했습니다.
데이콘 베이스라인 참고해서 시작했습니다.
(https://dacon.io/competitions/official/235744/codeshare/2861?page=1&dtype=recent)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
EDA 감사합니다 :)
Label = 0 은 기후기술이 아닌 항목입니다.
질환극복기술개발(R&D) 등과 같은 사업은 기후기술이 아니라서 모두 0으로 분류된 것 같습니다.