도배 하자 유형 분류 AI 경진대회

알고리즘 | 비전 | 분류 | MLOps | Weighted F1 Score

  • moneyIcon 상금 : 1,000 만원
  • 2,059명 마감

 

[Google Colab] 한글 깨짐/자모 분리 현상, 제출 시 0점 문제

2023.05.08 20:44 1,101 조회 language

프로젝트가 어느정도 안정되기까지는 colab에서 밑작업을 하는 편인데 한글 깨짐, 자모 분리 등의 문제가 자꾸 발생하여 저와 같은 문제를 겪는 분이 계실까 하여 작성해봅니다.

한글 자체가 깨지는 것은 encoding 문제이고 자모가 분리된다면 unicode의 type 문제인 것으로 보입니다.




[내용 추가]

제 프로젝트만 그런 것인지는 모르겠지만, local windows에서 돌렸을 때 csv의 한글이 깨지는 현상이 있습니다. 이는 encoding = 'utf-8-sig' 옵션을 추가하시면 정상적으로 작성이 됩니다.

또한, Colab에서 local로 넘어오시면서 runtime error : nll_loss_forward_reduce_cuda_kernel_2d_index not implemented for 'int' 와 같은 에러가 발생할 수 있는데, label 부분의 type을 확인하시면 되겠습니다. Colab에서는 int64로 되어 잘 동작했는데, int32나 다른 type으로 생성되는 경우가 있는 것 같습니다.


수정할 부분이 있다면 말씀 부탁드립니다.

감사합니다.

코드