SW중심대학 공동 AI 경진대회 2023

train.csv 파일 열람 시 '행 밀림' 현상 질의

2023.07.24 15:15 1,877 조회
행밀림.zip

안녕하세요.


submission.csv 파일을 제출하려고 하는데 계속 'csv 파일만 제출가능합니다.'라는 오류가 발생하여

csv 파일의  행이 정해진 형식에 맞지 않아서 발생하는 문제라고 판단하여 생성된 submission csv 파일을 열어봤는데(microsoft excel, 한셀) 특정 행들에서 '행 밀림 현상'이 발생하여 1열에 이미지의 ID가 들어가야 할 자리에 mask_rle 값으로 추정되는 긴 숫자들이 들어가있었습니다.


그래서 혹시나하여 원본 train.csv 파일을 직접 엑셀로 열어서 확인해보니 역시나 파일 중간 중간에 행이 밀려있는 현상이 발견되었습니다.

데이터 명세에서는 img_id, img_path, mask_rle 각 열에는 오직 해당 값들이 순서대로 잘 들어가있는데 실제 엑셀로 열어보니 행 밀림 현상이 발생하는건지,

아니면 다운로드 후 압축 해제시에 오류가 발생하는 것인지 의문이 들었는데 개인적으로는 해결이 되지 않아 문의드립니다.


csv 파일을 엑셀로 열때 행 밀림 현상을 유발할 수 있는 줄바꿈 및 쉼표가 존재하지 않는 것 같은데 왜 이런 현상이 발생한 건지,

이것 때문에 최종적으로 생성한 submission csv 파일이 계속 제출되지 않는 현상이 발생하는 것인지 꼭 해결해야 할 것 같아

질의 드립니다.

로그인이 필요합니다
0 / 1000
DACON.GM
2023.07.25 10:06

CSV파일을 엑셀 또는 기타 프로그램을 통해 열게 되면, 말씀해주신 현상이 발생하는 경우가 존재합니다.
그러나 실제로 파일에 문제가 있는 것은 아니며 이는 직접 Pandas DataFrame으로 Load하여 확인해보실 수 있습니다.
제출이 불가능한 문제는 해당 제출물의 용량이 200MB를 초과하는 지 확인 부탁드립니다.
제출물의 용량이 200MB을 초과하는 경우, 비정상적인 예측 결과로 간주하며 제출이 불가능합니다. (규칙 -> 유의사항 참고)
감사합니다.