서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
구내식당 식수 인원 예측 AI 경진대회
데이터셋 오류
데이터를 다운받았는데, 이렇게 데이터가 깨지는데 혹시 다른분들도 똑같으신가요..?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
인코딩 방식 때문에 그런 것 같습니다.
물론 DataFrame 내에서는 head나 tail로 봤을 때 멀쩡하게 나옵니다.
직접 파일을 열어서 한글이 안깨지게 보시는게 목적이시면
import pandas as pd
train = pd.read_csv('data/train.csv')
test = pd.read_csv('data/test.csv')
submission = pd.read_csv('data/sample_submission.csv')
train.to_csv('data_cp949/train.csv', encoding='cp949')
test.to_csv('data_cp949/test.csv', encoding='cp949')
submission.to_csv('data_cp949/submission.csv', encoding='cp949')
이와 같이 실행하시면 될 것 같습니다. 경로는 본인 설정에 맞게 만들거나 맞춰주시고
cp949의 형태로 to_csv 저장하셔서 열어보시면 확인하실 수 있습니다.