생육 환경 최적화 경진대회

알고리즘 | CV | 회귀 | 생육 | NMAE

  • moneyIcon 상금 : 총 300만원
  • 778명 마감

 

대회 관련 문의

2022.04.01 16:04 2,885 조회

안녕하세요. 참가자 여러분 대회 관련 자주 묻는 질문들을 모았습니다.

그 외 대회 관련 궁금하신 부분은 댓글로 남겨주세요. 즐거운 코딩 되세요.🧑‍💻🧑‍💻


[팀 구성]

Q) 팀 구성 기간이 지났는데 추가로 등록 가능한가요?

  • 팀 구성 기간 이후에는 팀을 구성할 수 없습니다.

Q) 팀 원 초대는 어떻게 하나요?

  • 대회 페이지의 팀 탭에서 팀원을 초대할 수 있습니다. 닉네임, 이메일, 팀 이름을 통해 팀원을 초대하고 해당 팀원이 팀 탭에서 초대를 수락하면 팀이 구성됩니다.


Q) 최초 1회 제출의 의미가 무엇인가요?

  • 팀 구성을 하기 위해서는 대회 제출 탭에서 적어도 1회 제출을 해야 합니다.

Q) 팀 구성이 안돼요

  • 팀 구성은 팀 구성 기간 내에 팀원을 초대해 진행할 수 있습니다. 팀 구성 기간과 팀원 초대 방법을 대회 팀 탭에서 확인해 주세요.


Q) 팀 탈퇴 후 재구성하고 싶은데 방법이 있나요?

  • 아이디어 공유 방지를 위해 팀 탈퇴 후 재구성은 불가능합니다.



[제출 파일]

Q) 최종 파일은 어떤 걸 제출하면 되나요?

  • private 채점 결과가 가장 좋을 것으로 예상되는 파일을 선택하여 제출하시면 됩니다.

Q) 최종 파일 제출 방식은 어떻게 되나요?

  • 해당 대회 페이지에서 제출 메뉴를 통해 진행할 수 있습니다. 제출할 파일을 선택 후 제출 버튼을 클릭하면 제출이 진행됩니다.

Q) Baseline 코드에서 쓴 라이브러리만 사용해야 하나요?

  • 베이스라인은 참고 용 자료이며 참가자분들만의 코드를 작성해 주시면 됩니다.

Q) 제출 결과물을 삭제하고 싶어요

  • 제출 결과물을 개별 삭제하는 것은 불가능합니다.

Q) 대회 종료 후에도 결과물 제출이 가능한가요?

  • 연습이 가능한 대회는 제출이 가능합니다.

Q) 제출 파일 점수 확인은 어떻게 하나요?

  • 최고 점수는 리더보드에 표시되며 각 파일의 점수는 제출 탭에서 확인하실 수 있습니다.

Q) 최종 파일 선택 개수는 몇개 인가요?

  • 최종 파일 선택 개수는 대회 규칙에서 확인해 주시기 바랍니다.

Q) csv파일 제출 시 에러가 발생합니다.

  • 제공된 sample_submission.csv 파일과 제출 파일의 행, 열 의 크기가 동일해야 하며, 만약 해당 부분이 일치하지 않을 경우 에러가 발생할 수 있습니다.



[리더보드 점수]

Q) 리더보드에서 점수가 삭제된 이유가 뭔가요?

  • 대회 규정 위반이 의심되는 경우 치팅 처리되어 점수가 삭제됩니다. 점수 복구를 위해서는 코드를 제출하여 검증을 받아야 합니다.

Q) 리더보드 업데이트 시간이 어떻게 되나요?

  • Public Score는 실시간으로 최고 점수로 업데이트되며, Private Score는 대회 종료 후 점수 계산에 오류가 없으면 공개됩니다.

Q) 동점인 경우 어떻게 하나요?

  • 동점의 경우 해당 점수를 먼저 기록한 팀이 높은 순위에 위치하게 됩니다.

Q) 리더보드 점수에 문제가 있는 것 같습니다.

  • 리더보드 점수에 이상이 있다고 여겨지는 경우 데이콘 계정의 메일로 해당 제출물을 설명과 함께 전달해 주시면 확인하여 답변드립니다.

Q) Private점수 확인 가능한가요?

  • 최종 선택한 파일 이외의 제출물에 대해서는 따로 Private Score를 계산하지 않습니다. 다만, 대회 종료 이후 연습 기간에는 정답 파일을 제출하면 제출 탭에서 Private Score를 확인하실 수 있습니다.

Q) Private, Public 차이가 뭔가요?

  • Test Data를 특정한 비율로 나누어 Private Score와 Public Score를 계산합니다. Public Score는 대회 기간 중에 리더보드에서 확인가능합니다. Private Score는 대회 종료 후 리더보드에서 확인 가능하며 Private Score를 통해 최종 순위가 결정됩니다.



[2차 평가]

Q) 발표 자료에 어떤 내용이 포함되어야하나요?

  • 발표 자료 내용은 평가 지표를 바탕으로 중요하다고 여겨지는 내용을 위주로 담아주시면 됩니다.

Q) 발표 일정은 어떻게 되나요?

  • 발표 일정은 대회 일정 페이지에서 확인하실 수 있으며, 변경사항이 있을 경우 따로 공지와 안내를 해드립니다.



[코드공유]

Q) 코드공유 시 외부 데이터 제출 어디에 해야 하나요?

  • 코드 공유 시 외부 데이터는 구글 드라이브에 업로드 하여 다운로드 링크를 코드 공유 게시글에 포함시켜 주시면 됩니다.

Q) 코드공유에 포함되어야 하는 내용은 어떤 것이 있나요?

  • 코드 공유 시 제출하신 코드를 작동시켜 최종 제출 파일과 동일한 파일이 생성될 수 있는 코드를 제출해 주시면 됩니다.



[규정]

Q) 코드 검증 과정에서 규정 위반이란 어떤 것 인가요?

  • test 데이터를 모델 학습 시 활용하거나, 허가되지 않은 외부 데이터 및 사전 학습 모델 사용 시 규정 위반 처리될 수 있습니다.


Q) GPU로 인해 결과물 재현이 되지 않아도 괜찮나요?

  • 최종 제출 점수 재현이 100% 일치하지 않더라도, 순위가 변경되지 않을 수준의 차이는 감안하여 수상자를 결정하게 됩니다.

Q) 어떤 경우가 Data leakage에 해당되나요?

  • label encoding, one-hot encoding 시 test 데이터 셋 활용
  • data scaling 적용 시 test 데이터 셋 활용
  • test 데이터 셋의 결측치 처리 시 test 데이터 셋의 통계 값 활용
  • 위 예시 외에도 test 데이터 셋이 모델 학습에 활용되는 경우에 Data leakage에 해당됨.


로그인이 필요합니다
0 / 1000
코오디잉
2022.04.06 16:06

대회 시작이 1주일 연기 됐는데 혹시 추가로 연기될 가능성이 있을까요?

DACONIO
2022.04.06 16:20

안녕하세요 코오디잉 님,

대회 일정은 추가로 연기되지 않습니다 :)

감사합니다.

우악우악
2022.04.08 19:52

학습 데이터에 image에 대한 segmentation label도 되어있나요? 
혹시 안되어있다면 직접 labeling을 해서 사용해도 되나요?

DACONIO
2022.04.11 08:47

안녕하세요 우악우악님,

학습 데이터에 대한 세그멘테이션 정보는 제공되지 않습니다.
직접 세그멘테이션 하여 피쳐로 사용하셔도 무방합니다.

감사합니다.

BeneciaLee
2022.04.18 15:16

안녕하세요 :D.

다름이 아니라 학습데이터 CASE 71~73 번에 해당하는 meta 데이터 에서 엑셀 파일만 존재하고 내용이 따로 존재하지 않는 것을 확인했습니다. 본 대회의 의도가 이미지 + Tabular 데이터를 통한 잎 면적 예측 모델 개발로 알고 있는데, 다른 데이터와 다르게 CASE 71~73번에서만 meta 데이터를 제거한 이유가 따로 있을까요? 
아니면 단순히 압축하는 도중에 파일이 손실된 것인가요?

DACONIO
2022.04.18 15:43

안녕하세요 LeeJaeWook님,

대부분의 케이스의 환경데이터에 결측치가 일부 포함되어있지만, 
문의 주신 케이스와 같이 1일 간의 모든 환경 데이터가 결측이 된 케이스도 존재합니다.
참가자분들의 다양한 방법으로 결측치를 채워 학습에 사용하거나, 
혹은 노이즈로 판단하여 학습에 포함시키지 않을 지 등등 다양한 방법으로 접근하셔도 무방합니다.

감사합니다.

BeneciaLee
2022.04.18 16:46

답변 주셔서 감사합니다 ! :D. 

잎 면적 측정 시점에 대해서 궁금증이 생겨서 질문드리게 되었습니다.

잎 면적 라벨링 시점이 두 시점 중 어느 시점에 해당하나요? 

1) 해당 잎 면적(label)측정 당시에 사진이 image 폴더에 있는 사진임 
2) 아니면, image 폴더에 있는 사진에서 meta 폴더에 있는 Tabular 데이터만큼 시간이 흐른 뒤에 잎 면적(label) 측정을 실시함

본 대회 특성상 후자에 해당할 것 같은데, 별도의 설명이 없어서 질문드립니다. 

DACONIO
2022.04.18 16:50

안녕하세요 LeeJaeWook님,

해당 Label에 관한 정보는 데이터 탭의 설명 부분에 기재되어있습니다.

이미지에 해당하는 Label은, 해당 이미지가 촬영된 시점으로부터 1일 후의 잎 면적 (중량)입니다.

감사합니다.

BeneciaLee
2022.04.18 16:56

아~!!! 죄송합니다. ㅜㅜ. 엑셀 파일만 확인했을 때는 컬럼 명만 있어서 홈페이지에 설명이 따로 있는 줄 몰랐네요.
답변 해주셔서 감사합니다 ~!! 😌

물린다
2022.04.18 22:10

여기다 질문해야 하나요?
test 데이터의 이미지를 이미지 편집 프로그램을 이용해서 살짝 편집해도 될까요? 광량이 너무 적거나 너무 많은 것 등 train 데이터와 조금 다른 것 같아서요. 불필요한 것도 보이고요.

DACONIO
2022.04.19 09:36

안녕하세요 물린다님,

학습, 추론의 모든 과정은 코드로 재현 가능해야합니다.
추가로 특정 test 데이터의 샘플만 임의로 변형하여 추론하는 것은 Data Leakage에 해당될 수 있으므로
https://dacon.io/forum/405758 을 참고해주시길 바랍니다.

감사합니다.

물린다
2022.04.19 12:53

그럼, 코드로 특정 조건을 만족할 경우 데이터 전처리를 다르게 하는 건 괜찮은건가요?

DACONIO
2022.04.19 13:54

안녕하세요 물린다님,

대회의 특성상, Test data들이 노출이 되고 어떤 Test data들이 주어지는지 살펴 볼 수 있지만
일반적으로 Test data는 '아예 볼 수 없다' 라고 생각하고 모델링과 전처리를 진행해야 합니다.

즉, Train data와 Test data를 살펴보고 Test data를 Train data와 비슷하게 만들어주기 위해 Test data만 따로 전처리하는 것은
Test data의 정보를 사용하는 것과 같으며 이는 Data Leakage입니다.

감사합니다.

푸른은율
2022.04.19 15:19

안녕하세요. 혹시 해당 데이터를 논문 등으로 이용가능 할까요?

DACONIO
2022.04.19 17:14

안녕하세요 푸른은율님,

토론 게시판의 데이터 사용 신청 게시글을 참고하시어
사용 신청을 해주시기 바랍니다.
https://dacon.io/competitions/official/235897/talkboard/406228?page=1&dtype=recent

감사합니다.

푸른은율
2022.04.20 01:14

안녕하세요. 문의드립니다.  leaf데이터의 엽면적값은 한 이미지에 있는 5개 청경채의 면적의 합인건가요? 5개 면적의 평균인건가요?

DACONIO
2022.04.20 09:07

안녕하세요 푸른은율님,

Leaf Weight (해당 이미지의 Label)은 해당 이미지에 존재하는 5개의 작물이 촬영 된 시간으로부터 1일 후의 잎면적(중량)입니다.
즉, 5개의 작물이 모두 고려된 값입니다.

감사합니다.

물린다
2022.04.20 08:32

사진을 보면 잎이 누렇게 뜬 경우가 있습니다. 잎의 면적(혹은 무게) 계산할 때 누렇게 뜬 잎도 포함된 값인가요? 

DACONIO
2022.04.20 09:17

안녕하세요 물린다님,

작물이 촬영된 시간으로부터 1일 후에, 시들어버린 잎의 부분은 Label 수치에 포함되지 않습니다.

감사합니다.

물린다
2022.04.20 09:54

약간 애매하게 시든 경우가 있습니다. 반쯤 시들었다고 할까요? CASE02_09.png 처럼요. 이런 경우는 무게 잴 때 어떻게 처리했나요?
아울러 test 데이터에서 시든 잎이 있는지의 여부, 정도의 차이를 눈으로 확인 한 후 해당 데이터를 지정해서 데이터 전처리를 조금 다르게 적용하는 것도 Data Leakage에 해당되나요? 물론 train 데이터도 같은 방식으로 처리하구요.

DACONIO
2022.04.20 10:10

안녕하세요 물린다님,

1.  모든 이미지에 대한 Label은 촬영된 시점으로부터 1일 후의 활용 가능한 잎의 부분(시들지 않은)으로 도출된 값입니다.
2. 기본적으로 test data는 '아예 볼 수 없다'라고 생각하고 모델링과 전처리가 진행되어야합니다.
또한 Train / Test data에 모두 동일한 코드로 전처리가 적용되었다 하더라도, 추후 대회가 종료되고 코드 검증 과정에서 'Test data로부터 인사이트를 도출하여 전처리가 진행되었다' 라면 이는 Data Leakage에 해당될 수 있습니다.

감사합니다.

참치캔
2022.04.25 02:33

안녕하세요. 궁금증이 있어서 질문드립니다.
train데이터의 특정 이미지나 특정케이스를 버리고 학습을 해도 괜찮은가요?
test데이터를 건드린게 아니니 상관이 없을까 해서 질문드립니다.

DACONIO
2022.04.25 09:53

안녕하세요 참치캔님,

train 데이터의 일부를 사용하지 않으셔도 괜찮습니다 :)

감사합니다.

참치캔
2022.04.25 22:32

추가적으로, 최종test pred결과에서 잎면적(무게)은 -값이 나오면 안되므로, -값을 0으로 대체해주는 처리를 해도 되나요?

임도담
2022.04.26 22:28

삭제된 댓글입니다

DACONIO
2022.04.25 09:59

안녕하세요 임도담님,

1. 주제 1과 2에 대해서 자율적으로 주제를 선택하여 진행해 주시면 됩니다.
2. 앞서 말씀드린 것처럼 1개의 게시물 안에 1개 또는 2개의 주제에 대한 분석 내용을 담아 제출해 주시면 됩니다.

감사합니다.

tinyheadedbear
2022.05.17 17:31

안녕하세요
Analytics 적상추 분석을 진행할 때 Algorithm 청경채  데이터를 참고하여 진행해도 괜찮을까요?

DACONIO
2022.05.17 17:54

안녕하세요 tinyheadedbear님,

Analytics 분야 (적상추 데이터)를 진행하실 때, Algorithm 분야 (청경채 데이터)를 참고하셔서 진행하셔도 무방합니다.

감사합니다.