대구 교통사고 피해 예측 AI 경진대회

알고리즘 | 정형 | 회귀 | 교통 | RMSLE | 정성평가

  • moneyIcon Prize : 1,000만원
  • 2,274명 마감

 

[Private 1st] 코드 및 ppt입니다

공동작성자

stroke
2023.12.12 02:20 4,277 Views language

안녕하세요. 팀 국민대 AI빅데이터 입니다.
작업환경이 Colab과 로컬로 구성되어 있어 깃허브 주소를 첨부합니다.
깃허브 내부 README.txt 파일에 외부데이터 사용방법 및 링크 첨부되어 있습니다.

모두 대회 참여하시느라 고생 많으셨습니다.
감사합니다.
https://github.com/JunYong-Choi/Daegu-Traffic-Accident-Damage-Prediction-AI-Competition

PDF
Code
로그인이 필요합니다
0 / 1000
Oak_tree
2023.12.12 08:21

축하드려요 코드 잘봤습니다. 

Stay
2023.12.12 15:02

감사합니다!

다냐니라
2023.12.12 11:06

1등 축하드립니다. 코드 감사합니다!
여쭙고 싶은게 있습니다.  '날짜'와 '월'의 sin/cos 주기성 만드실때 -(음수)를 취한 이유는 무엇인가요?

Stay
2023.12.12 15:02

일반적으로 월 데이터의 패턴은 시간과는 달리 특정 월에서 최댓값이나 최솟값을 가질 수 있습니다. 예를 들어, 여름철이나 겨울철과 같이 교통사고가 많이 발생할 것으로 예상되는 특정 월에 ECLO값이 최고점이나 최저점에 도달할 수 있습니다. 따라서 sin/cos 함수를 사용할 때 해당 월의 변동을 더 잘 반영하기 위해 결과값에 음수를 취해주었습니다. 종합하면, 시간과는 다르게 날짜 및 월 데이터 주기성 변환시 음수를 취해주는 것은 데이터의 패턴에 맞게 sin/cos 함수를 사용하여 주기성을 더 잘 캡처하기 위한 것입니다. 감사합니다!

셀렌디스
2023.12.12 10:04

축하드립니다, 코드 잘봤습니다.

Stay
2023.12.12 15:02

감사합니다!

힙힌지
2023.12.12 22:56

많이 배우고 갑니다. 코드 잘 봤습니다

상준.
2023.12.12 23:28

감사합니다.

basslibrary
2023.12.13 00:11

train을 전국 데이터를 기준으로 한 부분과 코로나, 고속도로 여부에 대한 변수 등은 생각하지 못했던 부분입니다.
고속도로여부에 '5'를 선정한게 EDA 정보로 한건지, 숫자를 변경하면서 찾은 값인지 궁금하긴 합니다.
잘 보고 갑니다. 수고하셨습니다.
--
추신. 코드가 colab 쪽을 미처보지 못했는 데, colab 소스에 지정된 외부데이터에 대한 자료가 없어 보입니다.

Stay
2023.12.13 00:19

대구광역시로만 구성된 train을 가지고 동별 ECLO의 평균을 구해보았을 때, 평균이 5보다 큰 동들이 대부분 시외지역에 분포해 있다는 점을 바탕으로 주변에 고속도로가 있는 지 여부를 피처로 활용하기 위해 '고속도로여부'로 피처명을 선정하여 활용하였습니다. 외부데이터에 대한 소스는 현재 github 정리중에 있어 추후 업로드 해드리겠습니다. 감사합니다.