분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 1st] 코드 및 ppt입니다
공동작성자
안녕하세요. 팀 국민대 AI빅데이터 입니다.
작업환경이 Colab과 로컬로 구성되어 있어 깃허브 주소를 첨부합니다.
깃허브 내부 README.txt 파일에 외부데이터 사용방법 및 링크 첨부되어 있습니다.
모두 대회 참여하시느라 고생 많으셨습니다.
감사합니다.
https://github.com/JunYong-Choi/Daegu-Traffic-Accident-Damage-Prediction-AI-Competition
감사합니다!
1등 축하드립니다. 코드 감사합니다!
여쭙고 싶은게 있습니다. '날짜'와 '월'의 sin/cos 주기성 만드실때 -(음수)를 취한 이유는 무엇인가요?
일반적으로 월 데이터의 패턴은 시간과는 달리 특정 월에서 최댓값이나 최솟값을 가질 수 있습니다. 예를 들어, 여름철이나 겨울철과 같이 교통사고가 많이 발생할 것으로 예상되는 특정 월에 ECLO값이 최고점이나 최저점에 도달할 수 있습니다. 따라서 sin/cos 함수를 사용할 때 해당 월의 변동을 더 잘 반영하기 위해 결과값에 음수를 취해주었습니다. 종합하면, 시간과는 다르게 날짜 및 월 데이터 주기성 변환시 음수를 취해주는 것은 데이터의 패턴에 맞게 sin/cos 함수를 사용하여 주기성을 더 잘 캡처하기 위한 것입니다. 감사합니다!
축하드립니다, 코드 잘봤습니다.
감사합니다!
많이 배우고 갑니다. 코드 잘 봤습니다
감사합니다.
train을 전국 데이터를 기준으로 한 부분과 코로나, 고속도로 여부에 대한 변수 등은 생각하지 못했던 부분입니다.
고속도로여부에 '5'를 선정한게 EDA 정보로 한건지, 숫자를 변경하면서 찾은 값인지 궁금하긴 합니다.
잘 보고 갑니다. 수고하셨습니다.
--
추신. 코드가 colab 쪽을 미처보지 못했는 데, colab 소스에 지정된 외부데이터에 대한 자료가 없어 보입니다.
대구광역시로만 구성된 train을 가지고 동별 ECLO의 평균을 구해보았을 때, 평균이 5보다 큰 동들이 대부분 시외지역에 분포해 있다는 점을 바탕으로 주변에 고속도로가 있는 지 여부를 피처로 활용하기 위해 '고속도로여부'로 피처명을 선정하여 활용하였습니다. 외부데이터에 대한 소스는 현재 github 정리중에 있어 추후 업로드 해드리겠습니다. 감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
축하드려요 코드 잘봤습니다.