분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
감귤 착과량 예측 AI 경진대회
data 변수명 깨짐 관련 문의
안녕하세요, data를 다운로드 받으면 변수명이 깨져서 관련 문의드립니다.
그리고 변수명이 아닌 것으로 보이는 값들이 데이터 오른쪽 끝부분에 변수명인것처럼 입력돼있습니다.
Airtable로 올라와있는 grid view로 csv를 다운받아 변수명만 수정해 분석중인데, 그렇게 해도 되는지 확인 부탁드립니다.
또는 data 파일 오류 확인 부탁드립니다.
submission sample에서는 TEST_0000 으로 시작되어 총 2208개의 data가 제출하도록 되어 있으나, 제공된 test data의 연번은 TEST_0001 부터 시작되어 총 2207개의 data를 포함하고 있습니다.
안녕하세요 David8님,
확인 결과 데이터에 문제가 없으며 sample_submission.csv와 test.csv의 ID는 TEST_0000부터 모두 시작되어있는 것을 확인하였습니다.
해당 csv파일을 '엑셀'로 바로 여신다면 Encoding이 달라 깨져보이는 경우가 발생할 수 있으며, 가급적 Python을 활용하여 파일을 열어주시길 바랍니다.
감사합니다.
감사합니다 파이썬으로 분석하여 제출했습니다. 혹시 R 로 분석한 결과를 제출할 수 있는 방법은 없나요? 인코딩 문제라면 인코딩만 바꾸면 가능할 것 같아서 문의드립니다.
안녕하세요 David8님,
Python 뿐 아니라 R 언어도 사용가능합니다.
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
train data 기준으로 CR열 부터 test data기준으로는 CQ열부터는 데이터에 해당하는 것으로 보이는 값이 변수명으로 입혀져있네요..