Iris 너비 예측 AI 해커톤

알고리즘 | 정형 | 회귀 | 과학 | MAE

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 540명 마감

 

iris 꽃받침/ 꽃잎 너비 예측 모델 (결과 : 0.16896)

2021.10.28 16:26 1,696 Views language

모자란 부분이 많지만 좋게 봐주시면 감사하겠습니다.
질문이나 피드백은 댓글로 주시면 참고하겠습니다!

Code
로그인이 필요합니다
0 / 1000
안녕해요
2021.10.28 17:26

안녕하세요. 좋은 코드 공유 감사합니다. DNN을 통한 모델과 관련 내용을 보고 많이 배웠습니다. 혹시 DNN말고 CNN도 적용해 보셨는지, validation 비율이 0.35정도로 좀 큰 것 같아서 혹시 validation비율을 0.35이외의 다른 값도 적용해보셨는지 궁금합니다.
그리고 10-fold, 혹은 5-fold CV를 진행한다면 성능이 더 좋아질 것이라고 생각합니다!

레알강함
2021.10.29 09:05

안녕하세요!
좋은 의견 주셔서 감사합니다!
CNN은 항상 이미지 학습의 예제로 배워서인지 적용해볼 생각을 못해봤네요! 한번 도전해보겠습니다!
Validation 비율의 경우 여러 값을 사용해보았는데 제 기준에서는 0.35의 값이 가장 적절하게 나온것으로 보여서 선택하게 되었습니다.
10 fold 5 fold CV도 모델에 적용하여 성능 확인 해봐야겠네요! 감사합니다!

저도 궁금한점이 하나 생겨 질문 남깁니다
문제해결에 CNN을 적용을 해보실 생각을 어떻게 하게 되셨을까요?
저는 주먹구구식으로 혼자 공부하고 경험도 적다보니 아직 문제에 대한 모델 선정 기준 등에 대한 혜안이 부족한데,
 어떻게 하면 문제 해결방법에 대한 통찰력이나 직관력을 기를 수 있는지 궁금합니다.

안녕해요
2021.10.29 13:13

저도 확실하진 않지만 CNN을 이미지 학습 이외에도 사용했을 때 효과가 있었다는 내용의 글을 본 기억이 있어서 궁금했습니다!
저도 아직 많은 경험이 없어서 문제에 대한 모델 선정 기준 등에 대한 혜안이 부족합니다 ㅠㅠ 그렇지만 직접 여러 모델들을 적용하고, 여러 경우의 수들을 테스트 해가면서 경험을 늘리는 것이 중요하다고 이야기를 들었습니다! 또 데이콘, kaggle 등 비슷한 데이터를 다루는 대회의 글들을 읽으며 필사하는 것도 좋다고 들었습니다. 함께 Dacon Basic을 해나가면서 서로 많이 배워가길 바라겠습니다. 감사합니다.

레알강함
2021.10.29 18:11

친절한 답변 감사합니다!

시간이 부족하여 아쉽게도 수정본으로 제출하지는 못했지만 좋은 의견으로 정말 많은 도움이 되었습니다!

감사합니다 좋은 주말 보내세요!

entropii
2021.10.29 10:25

공유 감사히 잘 보았습니다.
여러가지 scaler들 중에서 RobustScaler를 선택하신 이유를 여쭤봐도 될까요?

레알강함
2021.10.29 18:09

안녕하세요 entropii님!

명확한 근거를 기반으로 선택한 것 은 아니므로 원하시는 질문에 대한 답이 될지 모르겠으나 제가 선택한 기준을 말씀드리자면
다른 scaler들 모두 유의미한 scale 조정과 그래프로 보았을 때 사용에 문제 없어 보였지만, 2가지 이유로 RobustScaler 선택했습니다.

첫번째 이유는 양수로만 이루어 지지않고 0을 기준으로 양수, 음수 모두 존재함이 상대적인 수치 비교에 적절할 것으로 생각했습니다. 
(해당 조건에 맞는 scaler는  Standard 와 Robust 두개가 되겠네요)

두번째 이유는 0이라는 데이터가 학습에 기준이나 무의미하다는 의미를 전달할 것 같았습니다.
만약 다른 scaler에서 0값을 가지지 않았다면  선택 후보로 고려했을 것 같습니다.

해당 판단의 근거는 매우 빈약하고 아주 개인적인 견해로 선택했으므로 Scaler관련된 논문이나 자료를 찾아보시는게 더욱 도움이 될 것 같습니다.
감사합니다.