[배경]
안녕하세요 기업은행 교육생 여러분!
<[기업은행 혁신리그 사전교육] 영화 리뷰 감성 분석>에 오신 것을 환영합니다.🙌
여러분들은 영화🎬를 관람하신 후 리뷰를 작성해 보신 경험이 있으신가요?
많은 사람들이 배달 애플리케이션을 이용해서 음식을 주문하거나 인터넷에서 쇼핑을 하거나 동영상을 시청한 후 리뷰를 남기곤 하는데요. 리뷰는 온라인에서 뿐만 아니라 식당을 방문하거나 영화를 보아도 리뷰를 남깁니다. 이런 사이트에는 하루에도 몇만 건씩 리뷰가 올라오는데, 인공지능을 이용하면 텍스트 속 단어를 비교해 분석할 수 있습니다.
이와 같이 리뷰를 작성한 사람의 기분이나 긍정, 부정 등 감정을 추출해 특정 이슈나 인물에 대한 사람들의 평가, 태도, 감정을 분류하는 방법을 ‘감성 분석’이라고 합니다. 영화 리뷰나 기사의 댓글, 어떤 상품의 후기와 같은 텍스트 자료에서 긍정적인 단어의 출현 빈도가 높다면 만족도가 높다고 분석할 수 있는 것입니다.
주어진 영화 리뷰 데이터 셋을 이용하여 영화 리뷰가 긍정👍인지 부정👎인지를 파악할 수 있는 알고리즘을 작성해 주세요!
[주제]
영화 감성 분류 AI 알고리즘 개발
[설명]
총 200,000개 리뷰로 구성된 데이터로 영화 리뷰에 대한 텍스트와 해당 리뷰가 긍정인 경우 1, 부정인 경우 0을 표시한 레이블로 구성되어져 있습니다.
텍스트로 구성된 영화 리뷰를 참고해 긍정인지 (1) , 부정인지 (0) 를 판별해야 합니다.
본 교육 페이지의 코드 공유 게시판에서 교재 확인 및 과제 업로드를 할 수 있고, 토크 게시판에 QnA, 토론 등을 업로드할 수 있습니다.
뿐만 아니라 교육에 사용된 데이터를 다운 받고 직접 제출해 볼 수 있습니다.
배운 내용들을 직접 활용해 보며 복습한다면 학습의 효과가 더욱 커진답니다!
[데이터셋 설명]
- Train Data: 모델을 훈련시키는 데 사용되며, Train Data 셋으로 여러분의 모델은 답을 찾아나가는 과정을 학습합니다.
- Test Data : 여러분이 개발한 모델의 성능을 평가하기 위한 데이터로, Test Data 셋은 학습 과정에 사용되지 않습니다.
[주최 / 운영]
[참가자격]