FSI AIxData Challenge 2024 : 생성 AI

FSI AIxData Challenge 2024 수상자 인터뷰_GNOEYHEAT

2024.11.04 17:24 1,144 Views

:짠: 축하합니다, GNOEYHEAT 님! 수상의 영광을 함께 나누게 되어 기쁩니다. :짠:


:플래시가_깜박이는_카메라: 본인을 대표하는 이미지 한 장을 첨부해 주세요.

김태형 : 데이콘 프로필 사진입니다 :)

서지원 : 저의 데이콘 닉네임이자 가장 좋아하는 음식인 맥도날드의 더블쿼터파운더 치즈버거입니다.


:스튜디오_마이크: 우승의 기쁨을 맛본 소감을 한마디로 표현해 주세요.

김태형 : 좋은 성적을 도출하게 되어 뿌듯합니다 :)

설근형 : 노력한 성과를 얻어가는 것 같아 기쁩니다.

서지원 : 수상을 하게 되어 정말 기쁘고 행복합니다.

조주혜 : 상을 받게 되어 정말 행복하고 뿌듯합니다!!


:스튜디오_마이크: 팀의 이야기를 들려주세요.

김태형 : 고려대학교 산업경영공학부 인공지능 및 데이터 분석 연구실 소속 대학원생으로 이루어진 팀입니다!

설근형 : 저희는 고려대학교 산업경영공학과 같은 연구실 출신으로 구성된 팀입니다.

서지원 : 저희는 고려대학교 산업경영공학과 AIDA 연구실 대학원생들로 구성된 팀입니다.

조주혜 : 저희는 고려대학교 산업경영공학부 인공지능 및 데이터 분석 연구실 소속 대학원생으로 이루어진 팀입니다!


:스튜디오_마이크: 여러분을 돋보이게 한 특별한 점은 무엇인가요?

김태형 : 대회 마지막까지 조금이라도 점수를 올리기 위한 노력이 빛을 발했습니다.

설근형 : 데이터 전처리, feature engineering 과정도 의미있었지만 diffusion, llm을 활용한 최신의 생성형 ai 방법론을 활용했다는 것이 가장 특별한 것 같습니다.

서지원 : 같은 대학원 연구실 선후배들로 팀이 이루어져 서로 으쌰으쌰 잘해보자는 분위기가 빛을 발한 것 같습니다.

조주혜 : LLM 마스킹 기법을 통해 익명화를 한 점이 돋보였던 것 같습니다


:스튜디오_마이크: 이번 성과의 비결은 무엇이라고 생각하시나요?

김태형 : 팀원들의 소통과 노력이라고 생각합니다.

설근형 : 무엇보다 아이디어를 떠올리는 과정부터 논문까지 읽어가며 진심으로 임했고, 각자 맡은 부분을 잘 이행한 성과라고 생각합니다.

서지원 : Tabular 데이터를 생성하는 Diffusion 기반의 최신 알고리즘인 Forest Diffusion을 사용한 점이 좋은 성과를 거둔 것 같습니다.

조주혜 : Feature engineering을 통해 좋은 성능을 보여줄 수 있었던 것 같습니다


:스튜디오_마이크: 대회 기간 중 특별히 기억에 남는 순간이 있다면 공유해 주세요.

김태형 : 문제를 해결하기 위해 다양한 테이블 생성형 AI 모델을 공부한 순간이 기억에 남습니다.

설근형 : 개인적으로 익명화 차원에서 TACP라는 메트릭을 처음 접해보기도 하고 주요 속성이 무엇인지 의문이었는데, 결국 실험적으로 찾아냈고 그것을 익명화했을때 점수가 많이 올랐던 순간이 기억이 납니다.

서지원 : Tabular 데이터 생성 AI 모델을 공부한 순간이 기억에 남습니다. 대회를 진행하면서 새로 공부하고, 알게 된 점이 정말 많았습니다.

조주혜 : 3차 평가 대상자로 선정되었을때 정말 기뻤고 기억에 남습니다.


:스튜디오_마이크: 데이터 분석이나 학습 과정에서의 나만의 비법이 있다면요?

김태형 : 데이콘 대회를 많이 참여하고 수상 코드를 리뷰하는 것이 공부가 많이 되었습니다.

서지원 : 선행 연구들을 찾아보고, 그것을 재현 실험해보는 것이 중요하다는 것을 느꼈습니다. 어떠한 Task에 알맞은 모델들의 발전 방향을 꼼꼼히 정리해두는 것도 좋은 것 같습니다.

조주혜 : 주제에 대한 이해가 선행되어야 하고, 그 후에 feature engineering과 EDA과정이 중요하다고 생각합니다. 


:스튜디오_마이크: 수상을 기념하여 빌 수 있는 한 가지 소원이 있다면?

김태형 : 건강하고 행복하게 살고 싶습니다 :)

설근형 : 별탈없이 올 해가 지나가길 바랍니다.

서지원 : 대학원 학위과정 동안 좋은 연구 성과를 내고 동료들과 좋은 추억을 쌓는 것이 소원입니다.

조주혜 : 데이터 사이언티스트의 길을 걷는 모두 지치지 않고 항상 행복했으면 좋겠습니다!!


:스튜디오_마이크: 앞으로의 목표와 꿈을 말씀해 주세요.

김태형 : 인공지능 연구를 꾸준히 재밌게 하는 것이 목표입니다.

설근형 : 실제 산업환경에 도움이 되는, 실제로 가치를 만들어 낼 수 있는 방법론을 개발하는 것이 목표입니다.

서지원 : 저는 산업공학을 전공하면서 제조 산업에도 관심이 많았는데, 제조 인공지능 전문가가 되는 것이 인생 목표이자 꿈입니다.

조주혜 : 훌륭한 데이터 사이언티스트로서 현업에 기여하고 싶습니다


:스튜디오_마이크: 데이콘 커뮤니티에 바라는 점이 있다면 무엇인가요?

김태형 : 바라는 점은 없습니다. 재밌는 대회가 많이 열리고 있고 좋은 기회를 주셔서 감사합니다 :)

설근형 : 이런 금융 도메인의 대회가 많이 열렸으면 좋겠습니다.

서지원 : 이미 너무 운영을 원활히 잘 해주셔서 크게 바라는 점은 없습니다. 대회를 진행해주신 데이콘 측에 감사드립니다.

조주혜 : 다양한 주제의 AI 경진대회가 많이 나왔으면 좋겠습니다


Login Required
0 / 1000
임하식
2024.11.04 17:29

wow wow 정형 데이터 합성기 CTGAN 말고 더럽게 없다 ctab-gan은 먹통이고 nen은 이진분류만 지원하고 tabddpm이 제일 최신이라고 생각했는데  Forest Diffusion라는 더 좋은 모델이 있었군요

상준.
2024.11.11 02:51

수상 축하드립니다!

태형이
2024.11.12 20:14

감사합니당 :)

임하식
2024.11.13 09:26

혹시 Forest Diffusion 사용시 전처리는 어떻게 하셨나요?

태형이
2024.11.13 19:08

https://github.com/GNOEYHEAT/FSI-AIxData_2024

위의 code 및 ppt를 참고해주시기 바랍니다!!!

임하식
2024.11.14 08:48

감사합니다~!@