월간 데이콘 컴퓨터 비전 학습 경진대회

Letter 필드를 어떻게 사용하고 계신가요?

2020.08.07 23:25 4,591 조회

안녕하세요. CNN모델을 만든 이후에 레이어도 추가해보고 파라미터도 여러가지 시도해보다가 한계를 느껴서 이제 Letter 필드를 고려해서 모델을 만들어보려고 하고 있습니다.


저는 현재까지 두 가지를 시도해봤습니다.

1. 첫 번째 방법은 비슷한 Letter끼리 묶어서 훈련을 시키는 것이었습니다. 하지만 높은 accuracy를 얻기에는 샘플수가 너무 적은 것 같네요.

2. 두 번째 방법은 우선 모든 훈련 데이터를 사용해서 Letter별 평균 이미지를 구했습니다. 그리고 (훈련 이미지)에서 (Letter별 평균 이미지)를 뺀 이후에 모델을 훈련을 시켰습니다. 예를 들어 첫 번째 훈련 이미지가 'A'라면 (첫 번째 훈련 이미지) - (A의 평균 이미지)를 했습니다. 훈련 이미지를 보았을때 밝은 부분이 digit을 예측하는 힌트가 되는 것 같아서 최대한 Letter정보를 지워내는 것이 목적이었습니다.


혹시 다른 분들은 Letter 필드를 어떻게 사용하고 계신가요? 다양한 의견 나누어보면 좋을 것 같습니다. 감사합니다.

로그인이 필요합니다
0 / 1000
skyil7
2020.08.07 23:53

혹시 2번 방법은 효과가 어땠는지 알 수 있을까요?

저는 ConvNet을 통과한 이미지에 letter를 Concatenate 해볼까 합니다.

jhl
2020.08.08 00:56

안녕하세요. 평균값을 그대로 빼면 값이 음수인 픽셀도 생기고 남게 되는 부분이 거의 없어서 비율을 조금씩 조정하면서 빼봤는데 적어도 현재까지는 제가 원래 가지고 있던 모델보다 좋은 결과를 내지는 못 했습니다. 

말씀하신 Concatenate가 Concatenate layer를 활용하신다는 말씀 맞나요? 

skyil7
2020.08.08 00:41

네. ConvNet을 통과한 Image를 Flatten한 후, One-Hot 인코딩한 Letter를 Concatenate 해보고자 합니다.

jhl
2020.08.08 12:01

네 그것도 시도해봐야겠네요. One-hot 인코딩한 letter 대신 제가 위해 언급한 letter 평균값을 concatenate하는 것도 시도해볼만한 방법인 것 같습니다.