문장 유형 분류 AI 경진대회

[DACON 답변 요청] 데이콘 제출 문의

2022.12.23 10:09 1,341 Views
  1. Gnn 사용 가능 유무
  2. Gnn의 학습방법상 graph를 test셋 까지 같이 그려야하는데 이 과정에서 test set의 문장으로 adj matrix를 구성하는 과정이 있습니다. 해당 부분이 data leak으로 적용될수 있는지 문의드립니다.
  3. koelectra 모델 사용가능여부
  4. https://huggingface.co/monologg/koelectra-base-v3-discriminator < 해당 모델 사용가능한지 문의드립니다.
  5. 데이콘 private submission 선택을 하지 못하였는데, 선택이 지금 가능한지 문의드립니다.
  6. 가능하다면 제출물중 781292번 csv를 추가 선택해주시면 감사하겠습니다.



감사합니다.

로그인이 필요합니다
0 / 1000
DACON.GM
2022.12.23 10:35

안녕하세요 payitffoward님,
1. 코드를 직접 확인해야 확답을 드릴 수 있는 부분입니다. 단순히 test set에 대한 전처리가 독립적으로 이루어진다면 Data Leakage에 해당하지 않습니다.
단, pmi와 tf-idf로 계산하여 adj matrix를 test set을 바탕으로 구성하는 과정이 우려되며 샘플 2개 이상의 test set에 대한 정보를 활용한다면 Data Leakage에 해당합니다.
2. 사용 가능합니다.
3. 대회 종료 후에는 불가능합니다.
감사합니다.