분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
감사합니다 !!
안녕하세요 먼저 좋은 소스코드 올려주셔서 감사합니다. 한가지 질문드리고 싶은데 왜 하필 각 채널의 온도 데이터를 서로 뺀 것인가요?
더하는 것도 아니고 곱하는 것도 아니고 굳이 빼는 이유가 궁금합니다!
안녕하세요. 답변드립니다.
데이터로 제공된 밝기온도 feature들은 서로 연관되어 있는 값이라 생각하고 서로의 밝기 온도 값의 차이를 새로운 feature로 사용하였습니다.
굳이 밝기온도의 차이를 사용한 이유는 덧셈과 곱셈의 경우에는 연산을 하고 난 후에 어떤 값이 크고 작은지 알 수 없고, 뺄셈의 경우 어떤 값이 얼마나 더 큰지 수치화 시킬 수 있기 때문 입니다.
또 저는 대회 진행시 어느정도 연관이 있는 feature에 대해 서로의 뺄셈, 곱셈, 덧셈, 나눗셈 등을 해보고 의미있는 feature인지 확인해 보는 편입니다.
결과적으로 밝기 온도 차이와 강수의 상관계수를 보았을 때 강수 측정에 대해 유의미한 feature일 수도 있겠다는 생각을 하였습니다.
그리고 강수 유무를 예측하는 데 밝기 온도 차를 feature로 이용한 몇 개의 논문이 있어 그 점도 참고 하였습니다. (검색 키워드 "강수량 예측 밝기온도 차" or "precipitation brightness temperatures difference")
크~ 완벽하신 답변 감사합니다. Feature engineering하는 부분과 상관계수를 활용하는 것들 많이 배워갑니다. 특히 기존에 관련 연구 논문을 활용하는 팁도 유용할 것 같네요. 저도 열심히 공부에 정진하겠습니다. 감사합니다.
감사합니다 !!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
축하드립니다!!