구내식당 식수 인원 예측 AI 경진대회

데이터셋 오류

2021.06.07 16:58 5,903 조회



데이터를 다운받았는데, 이렇게 데이터가 깨지는데 혹시 다른분들도 똑같으신가요..?

로그인이 필요합니다
0 / 1000
fakecan
2021.06.07 18:32

인코딩 방식 때문에 그런 것 같습니다.
물론 DataFrame 내에서는 head나 tail로 봤을 때 멀쩡하게 나옵니다.

직접 파일을 열어서 한글이 안깨지게 보시는게 목적이시면

import pandas as pd

train = pd.read_csv('data/train.csv')
test = pd.read_csv('data/test.csv')
submission = pd.read_csv('data/sample_submission.csv')

train.to_csv('data_cp949/train.csv', encoding='cp949')
test.to_csv('data_cp949/test.csv', encoding='cp949')
submission.to_csv('data_cp949/submission.csv', encoding='cp949')

이와 같이 실행하시면 될 것 같습니다. 경로는 본인 설정에 맞게 만들거나 맞춰주시고
cp949의 형태로 to_csv 저장하셔서 열어보시면 확인하실 수 있습니다.

띠로리
2021.06.07 21:41

넵 감사합니다.