월간 데이콘 제 20대 대선 후보 정책•공약 시각화 경진대회

분석시각화 | NLP | 분석 | 선거 | 정성평가

  • moneyIcon 상금 : 100만원 + α
  • 734명 마감

 

2022 대선 공약, 그래서 하고 싶은 말이 뭔데!

공동작성자

stroke
2022.04.13 02:09 3,625 조회 language

서론
여러 후보자들이 말하고자 하는 공약들을 효과적으로 전달, 비교할 수 있도록 다양한 분석으로 시각화 했습니다.

목차
1. 워드 클라우드 : 핵심 키워드 추출 
=> 각각의 공약들의 핵심 키워드 확인
2. 후보별 빈도수가 높은 단어
=> 각각의 공약에서 빈도수가 높은 단어와 수 시각화
3. TF-IDF 분석
=> 모든 후보가 공통된 단어는 삭제 후 진행, 가중치를 부여해 후보자만의 키워드 확인
4. TF-IDF 분석에서 나온 키워드를 포함한 공약 찾기
=> 후보자만의 키워드를 포함한 공약(문장)을 찾아, 세부적인 공약 확인
5. 마인드맵
=> FT-IDF 결과를 마인드맵으로 시각화
6. 이행방법의 핵심 문장 추출
=> 각각 10개의 공약의 구체적인 이행방법 중, 30% 이상 포함되는 핵심 단어 추출, 이를 통해 핵심 문장 확인

사용 데이터 (https://drive.google.com/file/d/1U9DitxFyFon6DBCLb6rk37kSyrLu36dS/view?usp=sharing)
1. 제공된 데이터 중,  1~4번 후보자들의 데이터를 txt파일로 수정하여 사용
"기호1공약.txt" / "기호1공약(수정).txt" / "기호2공약.txt" / "기호2공약(수정).txt" / "기호3공약.txt" / "기호3공약(수정).txt" / "기호4공약.txt" / "기호4공약(수정).txt"

2. 마인드맵을 그리기 위해 TF-IDF 분석에서 나온 키워드로 csv파일 만듦
"TF-IDF_node.csv" / "TF-IDF_link.csv"

코드