분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
감사합니다 !!
안녕하세요 먼저 좋은 소스코드 올려주셔서 감사합니다. 한가지 질문드리고 싶은데 왜 하필 각 채널의 온도 데이터를 서로 뺀 것인가요?
더하는 것도 아니고 곱하는 것도 아니고 굳이 빼는 이유가 궁금합니다!
안녕하세요. 답변드립니다.
데이터로 제공된 밝기온도 feature들은 서로 연관되어 있는 값이라 생각하고 서로의 밝기 온도 값의 차이를 새로운 feature로 사용하였습니다.
굳이 밝기온도의 차이를 사용한 이유는 덧셈과 곱셈의 경우에는 연산을 하고 난 후에 어떤 값이 크고 작은지 알 수 없고, 뺄셈의 경우 어떤 값이 얼마나 더 큰지 수치화 시킬 수 있기 때문 입니다.
또 저는 대회 진행시 어느정도 연관이 있는 feature에 대해 서로의 뺄셈, 곱셈, 덧셈, 나눗셈 등을 해보고 의미있는 feature인지 확인해 보는 편입니다.
결과적으로 밝기 온도 차이와 강수의 상관계수를 보았을 때 강수 측정에 대해 유의미한 feature일 수도 있겠다는 생각을 하였습니다.
그리고 강수 유무를 예측하는 데 밝기 온도 차를 feature로 이용한 몇 개의 논문이 있어 그 점도 참고 하였습니다. (검색 키워드 "강수량 예측 밝기온도 차" or "precipitation brightness temperatures difference")
크~ 완벽하신 답변 감사합니다. Feature engineering하는 부분과 상관계수를 활용하는 것들 많이 배워갑니다. 특히 기존에 관련 연구 논문을 활용하는 팁도 유용할 것 같네요. 저도 열심히 공부에 정진하겠습니다. 감사합니다.
감사합니다 !!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
축하드립니다!!