2024 Samsung AI Challenge : Black-box Optimization

알고리즘 | 채용 | 정형 | 최적화 | Recall

  • moneyIcon 상금 : 2,100만원
  • 971명 마감

[배경] 

반도체 공정은 설비와 공정 파라미터의 조정에 따라 재현성 있는 결과를 얻을 수 있도록 파라미터화되어 있습니다. 그러나 반도체 공정이 점점 더 미세화됨에 따라 기존의 지식에 기반한 개발은 점점 어려워지고 있습니다. 이러한 복잡한 공정에서 최적의 파라미터를 찾는 일은 높은 복잡성 때문에 매우 어려운 문제입니다. 더불어, 최적화된 파라미터의 타당성을 검증하는 과정에서도 큰 비용이 소요되어 문제가 더욱 해결하기 힘듭니다.

이를 해결하기 위해 모델 기반 최적화(model-based optimization) 방법이 사용됩니다. 모델 기반 최적화는 시뮬레이션이나 과거 데이터를 활용하여 최적의 파라미터를 찾는 방법입니다. 특히, 새로운 데이터 조회 없이 과거 데이터로부터 학습한 모델을 활용해 복잡한 공정의 입력 변수를 최적화하는 과정을 오프라인 모델 기반 최적화(Offline Model-based Optimization)라고 합니다.

이 문제의 어려움 중 하나는 기존 데이터로만 학습해야 하므로, 데이터 분포에서 벗어난 파라미터에 대해 학습된 모델이 이를 제대로 반영하지 못할 가능성이 높다는 점입니다. 특히 최적화된 파라미터는 기존 데이터와 많이 차이가 날 가능성이 큽니다. 따라서, 데이터 분포와 최적화된 파라미터 사이의 균형점을 잘 찾는 것이 중요합니다.

이러한 상황에서 본 대회는 반도체 공정과 같이 복잡한 Black box 문제에 대한 최적화 문제를 풀 수 있는 AI 알고리즘의 발전을 목표로 합니다.


[주제]

Model기반 Black-box 최적화 알고리즘 개발


[설명]

최적의 모델을 개발하기 위해, 오프라인 모델 기반 최적화 기법을 활용하여 데이터 분포와 최적화된 파라미터의 균형점을 잘 찾아야 합니다. 이를 통해 Black box 문제에 대한 AI 알고리즘의 성능을 최대한 향상시키는 것이 목표입니다.

주어진 입력 변수 x_0​부터 x_10​까지의 값을 통해 예측된 타겟 변수 y의 값 중에서 상위 10%를 찾아내고, 이 예측된 상위 10%의 데이터 중 실제 상위 5%에 해당하는 데이터가 얼마나 포함되어 있는지를 측정하고 평가합니다.


[참가자격]

대학생/대학원생 (개인 또는 팀 단위, 팀 최대 3명)

  • 팀 구성원 모두 국내외 재학중인 대한민국 국적의 대학(원)생
  • 수상은 아래 조건을 충족해야 함
  1. 학적 상태가 재학 또는 휴학 상태이어야함
  2. 산업체, 연구소 등에 재직 중인 사람은 수상 불가 (학술 연수중인 사람, 산업정부출연연구소 소속 학생연구원 포함)
  3. 최종 수상후보 팀은 재학증명서 또는 대체인증서류 제출 필수


졸업 유예생의 경우, 본인 소속 대학의 학적 상태를 따름

박사 수료생의 경우, 수상 후보팀 선정시에 학생 신분을 증빙하는 서류 제출 필요 (재학증명서, 연구생증명서, 재적증명서 등)


[주최 / 운영]

  • 주최: 삼성전자 SAIT
  • 운영: 데이콘

대회 주요 일정

  1. 07.29

    참가 신청 시작

  2. 08.01

    대회 시작

  3. 09.06

    팀 병합 마감

  4. 09.13

    대회 종료

  5. 09.25

    코드 및 PPT 제출 마감

  1. 10.04

    코드 검증 및 내부 평가

  2. 10.08

    최종 결과 발표

[배경] 

반도체 공정은 설비와 공정 파라미터의 조정에 따라 재현성 있는 결과를 얻을 수 있도록 파라미터화되어 있습니다. 그러나 반도체 공정이 점점 더 미세화됨에 따라 기존의 지식에 기반한 개발은 점점 어려워지고 있습니다. 이러한 복잡한 공정에서 최적의 파라미터를 찾는 일은 높은 복잡성 때문에 매우 어려운 문제입니다. 더불어, 최적화된 파라미터의 타당성을 검증하는 과정에서도 큰 비용이 소요되어 문제가 더욱 해결하기 힘듭니다.

이를 해결하기 위해 모델 기반 최적화(model-based optimization) 방법이 사용됩니다. 모델 기반 최적화는 시뮬레이션이나 과거 데이터를 활용하여 최적의 파라미터를 찾는 방법입니다. 특히, 새로운 데이터 조회 없이 과거 데이터로부터 학습한 모델을 활용해 복잡한 공정의 입력 변수를 최적화하는 과정을 오프라인 모델 기반 최적화(Offline Model-based Optimization)라고 합니다.

이 문제의 어려움 중 하나는 기존 데이터로만 학습해야 하므로, 데이터 분포에서 벗어난 파라미터에 대해 학습된 모델이 이를 제대로 반영하지 못할 가능성이 높다는 점입니다. 특히 최적화된 파라미터는 기존 데이터와 많이 차이가 날 가능성이 큽니다. 따라서, 데이터 분포와 최적화된 파라미터 사이의 균형점을 잘 찾는 것이 중요합니다.

이러한 상황에서 본 대회는 반도체 공정과 같이 복잡한 Black box 문제에 대한 최적화 문제를 풀 수 있는 AI 알고리즘의 발전을 목표로 합니다.


[주제]

Model기반 Black-box 최적화 알고리즘 개발


[설명]

최적의 모델을 개발하기 위해, 오프라인 모델 기반 최적화 기법을 활용하여 데이터 분포와 최적화된 파라미터의 균형점을 잘 찾아야 합니다. 이를 통해 Black box 문제에 대한 AI 알고리즘의 성능을 최대한 향상시키는 것이 목표입니다.

주어진 입력 변수 x_0​부터 x_10​까지의 값을 통해 예측된 타겟 변수 y의 값 중에서 상위 10%를 찾아내고, 이 예측된 상위 10%의 데이터 중 실제 상위 5%에 해당하는 데이터가 얼마나 포함되어 있는지를 측정하고 평가합니다.


[참가자격]

대학생/대학원생 (개인 또는 팀 단위, 팀 최대 3명)

  • 팀 구성원 모두 국내외 재학중인 대한민국 국적의 대학(원)생
  • 수상은 아래 조건을 충족해야 함
  1. 학적 상태가 재학 또는 휴학 상태이어야함
  2. 산업체, 연구소 등에 재직 중인 사람은 수상 불가 (학술 연수중인 사람, 산업정부출연연구소 소속 학생연구원 포함)
  3. 최종 수상후보 팀은 재학증명서 또는 대체인증서류 제출 필수


졸업 유예생의 경우, 본인 소속 대학의 학적 상태를 따름

박사 수료생의 경우, 수상 후보팀 선정시에 학생 신분을 증빙하는 서류 제출 필요 (재학증명서, 연구생증명서, 재적증명서 등)


[주최 / 운영]

  • 주최: 삼성전자 SAIT
  • 운영: 데이콘

대회 주요 일정

  1. 07.29

    참가 신청 시작
  2. 08.01

    대회 시작
  3. 09.06

    팀 병합 마감
  4. 09.13

    대회 종료
  5. 09.25

    코드 및 PPT 제출 마감
  6. 10.04

    코드 검증 및 내부 평가
  7. 10.08

    최종 결과 발표