line-coupon

데이스쿨 할인 리턴즈

line-coupon-mobile

데이스쿨 할인 리턴즈

AI야 , 진짜 뉴스를 찾아줘! AI 경진대회

알고리즘 | 텍스트 | 분류 | 금융 | Accuracy + Time

상금 2,500만 원
626명 마감

마감

대회안내 데이터 코드 공유 토크 리더보드

제출

[NLP 언제까지 미룰래? 일단 들어와!!] #5. Modeling(완)

2020.11.27 15:19 15,035 조회 language

language

자연어 처리를 시작하고 싶었는데 어떻게 시작할지 막막하셨던 분
공부는 조금 했지만 정리가 필요하신 분
알고 있는 내용에 대해 복습이 필요하신 분

5회차의 튜토리얼 노트북을 통해 NLP를 쉽고 빠르게 정복하세요!!

#python #machinelearing #deeplearning #baseline #code #data #datascience #ai #dacon #competiton #tableu #jupyternotebook #code #randomforest #Regression #ML #DL #NLP

코드

로그인이 필요합니다

comment

0 / 1000

허니비

2020.11.29 22:41

embeding에서 말하는 vocabulary는 데이터 토큰화시킨 리스트를 말한다고 생각하면 될까요??!

DACONIO

2020.11.30 11:03

안녕하세요 허니비님

vocabulary는 고유한 토큰들을 담고 있는 리스트라고 생각하시면 됩니다.
즉, 데이터에서 "데이콘"이 여러번 나왔더라도 vocabulary에는 하나의 "데이콘"이 담겨있게 됩니다.

허니비

2020.12.02 10:39

아하 감사합니다!!

SensitiveBro

2020.12.19 22:25

안녕하세요. 혹시 vocabulary는 따로 생성한 리스트 이신가요?

DACONIO

2020.12.21 09:20

안녕하세요 SensitiveBro 님

네 vocabulary는 훈련 데이터의 고유 토큰들로 이루어진 리스트입니다.

Sun261

2020.12.28 13:32

fit 시킬때 어떻게 형태소분석기나 vetorizer 를 집어넣는건가요 ㅠㅠ..?

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동했습니다!

to_list

시작과 끝 문자에 대한 상관관계 분석

대회 - AI야 , 진짜 뉴스를 찾아줘! AI 경진대회

현재 글

[NLP 언제까지 미룰래? 일단 들어와!!] #5. Modeling(완)

대회 - AI야 , 진짜 뉴스를 찾아줘! AI 경진대회

좋아요 13

조회 15,035

댓글 6

6년 전

머신러닝 분야에서 베이스라인의 역할 (PB Score: 0.956)

대회 - AI야 , 진짜 뉴스를 찾아줘! AI 경진대회