2021년(제2회) NH투자증권 빅데이터 경진대회

알고리즘 | 정형 | 회귀 | 금융 | RMSE

  • moneyIcon 상금 : 총 5,000만원 규모 상금 및 경품 제공
  • 2021.08.30 ~ 2021.11.26 00:00 + Google Calendar
  • 832명 마감
마감

 

데이터 집합 크기로 인한 손실 문의

2021.08.30 13:39 940 조회

안녕하세요. 오늘 오전 10시에 공개된 데이터셋을 다운받아 손실된 것이 없는지 체크중, 'stk_bnc_hist.csv"의 데이터가 일부 손실됨을 확인하였습니다.

아래 사진은  마이크로소프트 엑셀로 실행시 나오는 경고 메시지이며 이를 확인으로 누를경우 데이터의 행의 갯수는 "1048576개"로 집계됨 (제공 데이터는 2,573,839건)을 확인하였습니다.


빠른 시일내 위 사안을 검토해 주시어 귀사의 귀중한 데이터를 분석할 수 있게 도와주시면 감사할 것 같습니다.

로그인이 필요합니다
0 / 1000
DACONIO
2021.12.21 12:12

안녕하세요 Sans Titre님.

말씀하신 'stk_bnc_hist.csv'에는 데이터 손실이 없음을 확인하였습니다.
해당 파일을 엑셀로 실행하면 수용할 수 있는 데이터를 초과하여 해당 메세지가 출력됩니다.
python의 pandas 라이브러리를 활용하여 데이터 프레임 형태로 데이터를 확인 부탁드립니다.

감사합니다. 
데이콘 드림.