분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
FSI AIxData Challenge 2024 : 생성 AI
FSI AIxData Challenge 2024 수상자 인터뷰_GNOEYHEAT
축하합니다, GNOEYHEAT 님! 수상의 영광을 함께 나누게 되어 기쁩니다.
본인을 대표하는 이미지 한 장을 첨부해 주세요.
김태형 : 데이콘 프로필 사진입니다 :)
서지원 : 저의 데이콘 닉네임이자 가장 좋아하는 음식인 맥도날드의 더블쿼터파운더 치즈버거입니다.
우승의 기쁨을 맛본 소감을 한마디로 표현해 주세요.
김태형 : 좋은 성적을 도출하게 되어 뿌듯합니다 :)
설근형 : 노력한 성과를 얻어가는 것 같아 기쁩니다.
서지원 : 수상을 하게 되어 정말 기쁘고 행복합니다.
조주혜 : 상을 받게 되어 정말 행복하고 뿌듯합니다!!
팀의 이야기를 들려주세요.
김태형 : 고려대학교 산업경영공학부 인공지능 및 데이터 분석 연구실 소속 대학원생으로 이루어진 팀입니다!
설근형 : 저희는 고려대학교 산업경영공학과 같은 연구실 출신으로 구성된 팀입니다.
서지원 : 저희는 고려대학교 산업경영공학과 AIDA 연구실 대학원생들로 구성된 팀입니다.
조주혜 : 저희는 고려대학교 산업경영공학부 인공지능 및 데이터 분석 연구실 소속 대학원생으로 이루어진 팀입니다!
여러분을 돋보이게 한 특별한 점은 무엇인가요?
김태형 : 대회 마지막까지 조금이라도 점수를 올리기 위한 노력이 빛을 발했습니다.
설근형 : 데이터 전처리, feature engineering 과정도 의미있었지만 diffusion, llm을 활용한 최신의 생성형 ai 방법론을 활용했다는 것이 가장 특별한 것 같습니다.
서지원 : 같은 대학원 연구실 선후배들로 팀이 이루어져 서로 으쌰으쌰 잘해보자는 분위기가 빛을 발한 것 같습니다.
조주혜 : LLM 마스킹 기법을 통해 익명화를 한 점이 돋보였던 것 같습니다
이번 성과의 비결은 무엇이라고 생각하시나요?
김태형 : 팀원들의 소통과 노력이라고 생각합니다.
설근형 : 무엇보다 아이디어를 떠올리는 과정부터 논문까지 읽어가며 진심으로 임했고, 각자 맡은 부분을 잘 이행한 성과라고 생각합니다.
서지원 : Tabular 데이터를 생성하는 Diffusion 기반의 최신 알고리즘인 Forest Diffusion을 사용한 점이 좋은 성과를 거둔 것 같습니다.
조주혜 : Feature engineering을 통해 좋은 성능을 보여줄 수 있었던 것 같습니다
대회 기간 중 특별히 기억에 남는 순간이 있다면 공유해 주세요.
김태형 : 문제를 해결하기 위해 다양한 테이블 생성형 AI 모델을 공부한 순간이 기억에 남습니다.
설근형 : 개인적으로 익명화 차원에서 TACP라는 메트릭을 처음 접해보기도 하고 주요 속성이 무엇인지 의문이었는데, 결국 실험적으로 찾아냈고 그것을 익명화했을때 점수가 많이 올랐던 순간이 기억이 납니다.
서지원 : Tabular 데이터 생성 AI 모델을 공부한 순간이 기억에 남습니다. 대회를 진행하면서 새로 공부하고, 알게 된 점이 정말 많았습니다.
조주혜 : 3차 평가 대상자로 선정되었을때 정말 기뻤고 기억에 남습니다.
데이터 분석이나 학습 과정에서의 나만의 비법이 있다면요?
김태형 : 데이콘 대회를 많이 참여하고 수상 코드를 리뷰하는 것이 공부가 많이 되었습니다.
서지원 : 선행 연구들을 찾아보고, 그것을 재현 실험해보는 것이 중요하다는 것을 느꼈습니다. 어떠한 Task에 알맞은 모델들의 발전 방향을 꼼꼼히 정리해두는 것도 좋은 것 같습니다.
조주혜 : 주제에 대한 이해가 선행되어야 하고, 그 후에 feature engineering과 EDA과정이 중요하다고 생각합니다.
수상을 기념하여 빌 수 있는 한 가지 소원이 있다면?
김태형 : 건강하고 행복하게 살고 싶습니다 :)
설근형 : 별탈없이 올 해가 지나가길 바랍니다.
서지원 : 대학원 학위과정 동안 좋은 연구 성과를 내고 동료들과 좋은 추억을 쌓는 것이 소원입니다.
조주혜 : 데이터 사이언티스트의 길을 걷는 모두 지치지 않고 항상 행복했으면 좋겠습니다!!
앞으로의 목표와 꿈을 말씀해 주세요.
김태형 : 인공지능 연구를 꾸준히 재밌게 하는 것이 목표입니다.
설근형 : 실제 산업환경에 도움이 되는, 실제로 가치를 만들어 낼 수 있는 방법론을 개발하는 것이 목표입니다.
서지원 : 저는 산업공학을 전공하면서 제조 산업에도 관심이 많았는데, 제조 인공지능 전문가가 되는 것이 인생 목표이자 꿈입니다.
조주혜 : 훌륭한 데이터 사이언티스트로서 현업에 기여하고 싶습니다
데이콘 커뮤니티에 바라는 점이 있다면 무엇인가요?
김태형 : 바라는 점은 없습니다. 재밌는 대회가 많이 열리고 있고 좋은 기회를 주셔서 감사합니다 :)
설근형 : 이런 금융 도메인의 대회가 많이 열렸으면 좋겠습니다.
서지원 : 이미 너무 운영을 원활히 잘 해주셔서 크게 바라는 점은 없습니다. 대회를 진행해주신 데이콘 측에 감사드립니다.
조주혜 : 다양한 주제의 AI 경진대회가 많이 나왔으면 좋겠습니다
수상 축하드립니다!
감사합니당 :)
혹시 Forest Diffusion 사용시 전처리는 어떻게 하셨나요?
https://github.com/GNOEYHEAT/FSI-AIxData_2024
위의 code 및 ppt를 참고해주시기 바랍니다!!!
감사합니다~!@
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
wow wow 정형 데이터 합성기 CTGAN 말고 더럽게 없다 ctab-gan은 먹통이고 nen은 이진분류만 지원하고 tabddpm이 제일 최신이라고 생각했는데 Forest Diffusion라는 더 좋은 모델이 있었군요