운수종사자 인지적 특성 데이터를 활용한 교통사고 위험 예측 AI 경진대회

[SCU] 운수종사자 인지적 특성 데이터를 활용한 교통사고 위험 예측 AI 경진대회 수상자 인터뷰

2025.11.28 11:41 443 조회

:짠: 축하합니다, SCU 님! 수상의 영광을 함께 나누게 되어 기쁩니다. :짠:


:스튜디오_마이크: 우승의 기쁨을 맛본 소감을 한마디로 표현해 주세요.

교육과 연구의 경계를 넘어, 실제 사회문제 해결에 기여할 수 있다는 것을 증명한 뜻깊은 순간이었습니다.


:스튜디오_마이크: 팀의 이야기를 들려주세요.

SCU는 Seoul Cyber University의 약자로, 서울사이버대학교 교수진 5명이 모인 팀입니다. 평소 학교에서 안전관리학과 교수님과 인공지능·빅데이터·정보보호 전공 교수님들이 학제간 연구의 필요성에 대해 논의하던 중, 이번 대회 공고를 접하게 되었습니다.

"운수종사자의 교통안전"이라는 주제를 보는 순간, 안전관리 전문가의 도메인 지식과 AI 전문가들의 기술력이 만나면 의미 있는 결과를 만들 수 있겠다는 확신이 들었습니다. 특히 우리 팀의 안전관리 전문가 교수님께서는 산업안전과 교통안전 분야에서 오랜 실무 경험과 연구 이력을 가지고 계셔서, 데이터에 담긴 안전관리의 본질을 꿰뚫어 볼 수 있었습니다.

각자의 전공 분야는 달랐지만, "AI 기술로 교통사고를 예방하고 생명을 지킨다"는 공통된 목표 아래 자연스럽게 하나가 되었습니다.


:스튜디오_마이크: 여러분을 돋보이게 한 특별한 점은 무엇인가요?

우리 팀의 가장 큰 강점은 학제간 융합이었습니다.

안전관리 전문가 교수님은 운수종사자 자격검사의 각 항목이 실제 운전 상황에서 어떤 의미를 갖는지, 어떤 인지적 특성이 사고 위험과 연결되는지에 대한 깊은 통찰을 제공해주셨습니다. 이는 단순히 데이터만 보고는 절대 알 수 없는 도메인 지식이었습니다.

AI/빅데이터 전문가들은 이러한 도메인 지식을 바탕으로 feature engineering과 모델 설계를 진행했고, 정보보호 전문가는 민감한 개인 정보를 다루는 만큼 데이터 처리 과정에서의 윤리적 측면을 환기시켜주셨습니다.

또한, 우리 팀은 19회라는 매우 적은 제출 횟수로 6위를 달성했습니다. 이는 무작위 시도보다는 이론적 근거와 도메인 지식에 기반한 체계적 접근을 했기 때문입니다.


:스튜디오_마이크: 이번 성과의 비결은 무엇이라고 생각하시나요?

세 가지 비결이 있었습니다.

첫째, 문제의 본질에 대한 이해입니다. 우리는 단순히 정확도를 높이는 것이 아니라, "왜 이 사람이 사고 위험군인가"를 설명할 수 있는 모델을 만들고자 했습니다. 평가지표가 AUC뿐만 아니라 Brier Score와 ECE를 포함한 것도 모델의 신뢰성과 calibration을 중요시한다는 의미였고, 우리는 이 점에 집중했습니다.

둘째, 효율적인 역할 분담입니다. 안전관리 전문가는 변수 해석과 가설 수립을, AI 전문가들은 모델 구현과 최적화를, 정보보호 전문가는 데이터 전처리와 검증을 담당하며 각자의 전문성을 최대한 발휘했습니다.

셋째, 학자로서의 엄밀함입니다. 교수진답게 매 단계마다 "왜?"라는 질문을 던지며, 경험적 결과뿐만 아니라 이론적 타당성을 끊임없이 검토했습니다.


:스튜디오_마이크: 대회 기간 중 특별히 기억에 남는 순간이 있다면 공유해 주세요.

가장 기억에 남는 순간은 첫 제출 후 결과를 확인했을 때였습니다.

우리는 충분한 문헌 검토와 데이터 탐색을 거친 후에야 첫 제출을 했는데, 예상보다 훨씬 좋은 성적이 나왔습니다. 그 순간 "도메인 지식 기반 접근"이라는 우리의 전략이 옳았다는 확신을 얻었습니다.

또 하나는 대회 막바지, 모델 개발 보고서와 데이터 분석 보고서를 작성하면서였습니다. 우리가 개발한 모델의 예측 결과를 안전관리 관점에서 해석하고, 실제 운수종사자 안전교육에 어떻게 활용될 수 있는지 논의하는 과정이 특히 보람찼습니다. 학술적 성과가 실제 사회에 기여할 수 있다는 점에서 연구자로서의 큰 보람을 느꼈습니다.

그리고 온라인 수업과 연구 업무 사이사이 시간을 쪼개 회의하고 코드를 작성하던 동료 교수님들의 열정도 잊을 수 없습니다. 특히 한 분은 새벽 시간대에도 카톡으로 아이디어를 공유하시며 팀에 활력을 불어넣어 주셨습니다.


:스튜디오_마이크: 데이터 분석이나 학습 과정에서의 나만의 비법이 있다면요?

우리 팀의 노하우는 "Data → Domain → Design → Deploy"의 4D 프로세스였습니다.

  1. Data: 먼저 데이터의 통계적 특성과 분포를 철저히 파악했습니다. 결측치, 이상치, 클래스 불균형 등을 체계적으로 분석했습니다.
  2. Domain: 안전관리 전문가의 지식을 활용해 각 변수가 실제 운전 안전성과 어떤 관계가 있는지 이해했습니다. 예를 들어, 특정 인지 반응 검사가 위급 상황에서의 판단력과 연결된다는 통찰을 얻었습니다.
  3. Design: 도메인 지식을 바탕으로 feature interaction, ensemble 전략, calibration 기법을 설계했습니다. 특히 ECE(Expected Calibration Error)를 줄이기 위해 temperature scaling과 같은 calibration 기법을 적용했습니다.
  4. Deploy: CPU 환경과 30분 제한이라는 제약 조건을 고려해 모델 경량화와 추론 최적화를 진행했습니다.

또한, 매 실험마다 상세한 실험 노트를 작성하여 어떤 가설을 검증했는지, 결과가 어땠는지를 기록했습니다. 이것이 적은 시도로도 효율적인 개선을 가능하게 했습니다.


:스튜디오_마이크: 수상을 기념하여 빌 수 있는 한 가지 소원이 있다면?

우리가 개발한 모델이 실제 운수종사자 안전관리 시스템에 pilot 형태로라도 적용되어, 교통사고 예방에 실질적으로 기여하는 것을 보고 싶습니다.

AI 모델의 진정한 가치는 논문이나 대회 성적이 아니라, 실제 현장에서 사람의 생명을 지키는 데 있다고 믿습니다. 우리의 연구가 작은 씨앗이 되어 더 안전한 도로 환경을 만드는 데 일조할 수 있다면, 그것이야말로 가장 큰 보상이 될 것입니다.


:스튜디오_마이크: 앞으로의 목표와 꿈을 말씀해 주세요.

단기적으로는 이번 대회 경험을 바탕으로 운수종사자 안전관리 관련 학술 논문을 작성하고자 합니다. 특히 인지적 특성 데이터를 활용한 사고 위험 예측의 이론적 프레임워크를 정립하고, explainable AI 기법을 통해 모델의 해석 가능성을 높이는 연구를 진행할 계획입니다.

중장기적으로는 서울사이버대학교 내에 "AI 기반 안전관리 연구센터" 같은 학제간 연구 조직을 만들고 싶습니다. 산업안전, 교통안전, 재난안전 등 다양한 안전 분야에 AI 기술을 접목하여, 사이버대학교만의 차별화된 연구 브랜드를 구축하는 것이 꿈입니다.

또한 이번 경험을 수업에도 접목하여, 학생들에게 실제 사회문제 해결 프로젝트를 경험하게 하고 싶습니다. 교육과 연구, 사회 기여가 선순환하는 모델을 만들어가고자 합니다.


:스튜디오_마이크: 데이콘 커뮤니티에 바라는 점이 있다면 무엇인가요?

세 가지를 제안하고 싶습니다.

첫째, 도메인 전문가와 AI 전문가의 협업을 장려하는 프로그램을 더 많이 만들어주시면 좋겠습니다. 이번 대회처럼 실제 사회문제를 다룰 때는 기술만으로는 부족하고, 해당 분야의 깊은 이해가 필수적입니다. 전문가 매칭 프로그램이나 도메인 특강 등이 있다면 참가자들의 학습에 큰 도움이 될 것입니다.

둘째, 모델의 성능뿐만 아니라 해석 가능성과 실용성을 평가하는 대회가 더 많아지길 바랍니다. 이번 대회처럼 AUC, Brier, ECE를 복합적으로 평가한 것은 매우 좋은 시도였습니다. 나아가 모델 설명성이나 공정성 같은 요소도 평가에 포함된다면, AI의 책임 있는 활용에 대한 인식을 높이는 데 기여할 것입니다.

셋째, 학계와 산업계, 공공기관이 함께하는 대회를 지속적으로 개최해주시길 바랍니다. 이번 대회처럼 행정안전부, 한국교통안전공단 같은 기관이 참여하면, 우수한 모델이 실제로 활용될 가능성이 높아지고, 참가자들도 더 큰 동기부여를 받을 수 있습니다.

데이콘이 단순한 경진대회 플랫폼을 넘어, "사회문제 해결을 위한 AI 혁신의 허브"로 자리매김하길 응원합니다.


로그인이 필요합니다
0 / 1000
진욱
2025.11.28 12:18

안녕하세요! 
적은 제출 횟수에도 불구하고 매우 높은 성능을 달성하신 점, 그리고 도메인 지식과 AI 기술을 결합해 문제의 본질에 접근하신 방식이 정말 인상 깊었습니다. 교수님들의 연구적 깊이와 엄밀함이 녹아 있는 후기 글을 읽으며 많은 배움을 얻었습니다.

후기 글을 읽다가 궁금한 점이 있어 두 가지 여쭤보고 싶습니다.

1. 도메인 기반 feature engineering이 예상과 다르게 성능 향상을 못 가져왔던 경험이 있으셨는지, 그리고 그런 상황에서 어떻게 의사결정을 하셨는지 궁금합니다.

2. Calibration(Temperature Scaling)을 적용할 때 어떤 근거를 기준으로 선택하고 판단하셨는지 궁금합니다.

후기 글에서 정말 많은 것을 배웠습니다! 감사합니다.

TREX99
2025.11.28 13:59

 질문들이 실제 기술적 디테일을 요구하는 좋은 질문들이네요. 학술적이면서도 실무적인 답변으로 요약하면..

1. 실제로 그런 경험이 있었습니다. 안전관리 전문가 교수님의 조언으로 시각 반응과 청각 반응을 조합한 '멀티모달 반응 지표' 같은 상호작용 피처를 만들었습니다. 운전 중 동시다발적 자극 대응 능력을 나타낼 것으로 기대했지만, validation AUC가 하락하고 ECE가 증가했습니다. 분석 결과 다중공선성 문제가 발견되었고, 단순 조합 피처로는 본질을 포착하지 못한다는 결론에 도달했습니다. 결국 tree-based 모델의 자동 interaction 학습을 활용하기로 전략을 수정했고, feature engineering은 단순하고 해석 가능한 변환에 집중하며 복잡한 패턴은 모델 앙상블로 학습하도록 했습니다.
2. 평가식 Score = 0.5×(1-AUC) + 0.25×Brier + 0.25×ECE에서 AUC는 예측 순서만 중요하고, Brier와 ECE는 확률값의 정확한 크기가 중요합니다. 따라서 AUC를 유지하면서 calibration을 개선하는 post-hoc 방법이 필요했습니다. Temperature Scaling은 단일 파라미터만 학습하여 overfitting 위험이 낮고, AUC를 보존하며, CPU 환경의 시간 제약에서도 효율적이라는 장점이 있었습니다. Guo 등의 2017년 논문 "On Calibration of Modern Neural Networks"에서 검증된 방법을 개념적으로 응용했습니다.

진욱
2025.11.28 16:30

정성스러운 답변 감사드립니다!

이전 글
AI한테 맡겨본 초간단 시각화
대회 - Track1 알고리즘 부문 : K리그-서울시립대 공개 AI 경진대회
좋아요 25
조회 1,881
댓글 1
2달 전
현재 글
[SCU] 운수종사자 인지적 특성 데이터를 활용한 교통사고 위험 예측 AI 경진대회 수상자 인터뷰
대회 - 운수종사자 인지적 특성 데이터를 활용한 교통사고 위험 예측 AI 경진대회
좋아요 5
조회 443
댓글 3
2달 전
다음 글
Track1과 Track2 동시 참여 가능 여부
대회 - Track1 알고리즘 부문 : K리그-서울시립대 공개 AI 경진대회
좋아요 8
조회 1,107
댓글 2
2달 전