Sentence Type Classification AI Competition

Algorithm | NLP | Classification | Weighted f1 Score

  • moneyIcon Prize : 5,000,000 KRW
  • 1,073 Users Completed

 

[DACON 답변 요청] 데이콘 제출 문의

2022.12.23 10:09 2,320 Views
  1. Gnn 사용 가능 유무
  2. Gnn의 학습방법상 graph를 test셋 까지 같이 그려야하는데 이 과정에서 test set의 문장으로 adj matrix를 구성하는 과정이 있습니다. 해당 부분이 data leak으로 적용될수 있는지 문의드립니다.
  3. koelectra 모델 사용가능여부
  4. https://huggingface.co/monologg/koelectra-base-v3-discriminator < 해당 모델 사용가능한지 문의드립니다.
  5. 데이콘 private submission 선택을 하지 못하였는데, 선택이 지금 가능한지 문의드립니다.
  6. 가능하다면 제출물중 781292번 csv를 추가 선택해주시면 감사하겠습니다.



감사합니다.

Login Required
0 / 1000
DACON.GM
2022.12.23 10:35

안녕하세요 payitffoward님,
1. 코드를 직접 확인해야 확답을 드릴 수 있는 부분입니다. 단순히 test set에 대한 전처리가 독립적으로 이루어진다면 Data Leakage에 해당하지 않습니다.
단, pmi와 tf-idf로 계산하여 adj matrix를 test set을 바탕으로 구성하는 과정이 우려되며 샘플 2개 이상의 test set에 대한 정보를 활용한다면 Data Leakage에 해당합니다.
2. 사용 가능합니다.
3. 대회 종료 후에는 불가능합니다.
감사합니다.

Previous
No Previous Post
Current
[DACON 답변 요청] 데이콘 제출 문의
Competition - 문장 유형 분류 AI 경진대회
Likes 7
Views 2,320
Comments 1
3년 전
Next
문장 유형 분류 AI 경진대회_gtx750ti
Competition - 문장 유형 분류 AI 경진대회
Likes 2
Views 2,029
Comments 0
3년 전