감귤 착과량 예측 AI 경진대회

data 변수명 깨짐 관련 문의

2022.12.12 16:13 1,918 조회

안녕하세요, data를 다운로드 받으면 변수명이 깨져서 관련 문의드립니다.

로그인이 필요합니다
0 / 1000
David8
2022.12.12 16:22

train data 기준으로 CR열 부터 test data기준으로는 CQ열부터는 데이터에 해당하는 것으로 보이는 값이 변수명으로 입혀져있네요..

David8
2022.12.12 16:27

그리고 변수명이 아닌 것으로 보이는 값들이 데이터 오른쪽 끝부분에 변수명인것처럼 입력돼있습니다.
Airtable로 올라와있는 grid view로 csv를 다운받아 변수명만 수정해 분석중인데, 그렇게 해도 되는지 확인 부탁드립니다.
또는 data 파일 오류 확인 부탁드립니다.

David8
2022.12.12 16:54

submission sample에서는 TEST_0000 으로 시작되어 총 2208개의 data가 제출하도록 되어 있으나, 제공된 test data의 연번은 TEST_0001 부터 시작되어 총 2207개의 data를 포함하고 있습니다.

DACON.GM
2022.12.12 17:07

안녕하세요 David8님,
확인 결과  데이터에 문제가 없으며 sample_submission.csv와 test.csv의 ID는 TEST_0000부터 모두 시작되어있는 것을 확인하였습니다.
해당 csv파일을 '엑셀'로 바로 여신다면 Encoding이 달라 깨져보이는 경우가 발생할 수 있으며, 가급적 Python을 활용하여 파일을 열어주시길 바랍니다.
감사합니다.

David8
2022.12.12 17:33

감사합니다 파이썬으로 분석하여 제출했습니다. 혹시 R 로 분석한 결과를 제출할 수 있는 방법은 없나요? 인코딩 문제라면 인코딩만 바꾸면 가능할 것 같아서 문의드립니다.

DACON.GM
2022.12.13 13:01

안녕하세요 David8님,
Python 뿐 아니라 R 언어도 사용가능합니다.
감사합니다.