분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
대회 데이터셋 설명 (22.07.08 11:16 업데이트)
안녕하세요 Max Shin님,
Protein 사전학습 모델은 UR50 데이터셋으로 사전 훈련된 Weight만 사용가능하며,
이 사전학습 모델에 대회에서 제공하는 데이터셋으로 Fine tuning하는 것은 문제 없습니다 :)
감사합니다.
안녕하세요!!
외부데이터는 사용불가라고 공지되어있는데,
참고자료에 있는 AAindex와 같은 자료들은 사용할 수 없는건가요?
그렇다면, 오롯이 데이터탭에 제공되는 데이터만을 사용해야 하는건가요?
감사합니다:)
안녕하세요 neutro_zina님,
이번 대회는 규칙에 명시된 바와 같이 '외부데이터 사용 금지' 입니다.
따라서 대회 데이터는 대회 데이터 탭으로부터 배포되는 대회용 데이터셋만 사용 가능합니다.
감사합니다.
안녕하세요 neutro_zina님,
추가로 답변사항이 있어 답변드립니다.
언급해주신 참고자료의 AAindex의 경우에는 amino acids feature와 관련 된 자료이기 때문에
외부데이터가 추가되는 것이 아니므로 사용하셔도 무방합니다.
감사합니다.
Positive-low, Positive, Positive-high 사이의 관계가 궁금합니다.
Negative < Positive-low < Positive < Positive-high 라는 의미인가요?
안녕하세요 화이트하임님,
대부분 맞게 이해하셨지만, Positive는 order 구분이 안되어있는 class입니다.
Positive 대신에 Negative < Positive-Low < Positive-Intermediate < Positive-High의 의미가 맞습니다.
감사합니다.
positive는 order 구분이 안되어있는 class라는 말은 실제로는 positive-low, positive-intermediate, positive-high 중에 하나라는 의미인가요?
안녕하세요 GDAI초호기님,
질문 주신 내용이 맞습니다.
qualitative label은 DB 큐레이터가 원문을 보고 판단하거나 저자에게 문의하여 파악한 값인 '정성적인 Label'로,
Positive는 Positive-Low, Intermediate, High 중 하나에 해당할 수 있지만 확실하게 알 수 없을 때 부여된 값입니다.
감사합니다.
sample_submission.csv 파일 제출시 "CSV 파일의 Row Error가 발생하였습니다." 라는 문구가 뜨면서 제출이 안되는데 확인 부탁드립니다.
안녕하세요 landu님,
배포되고 있는 sample_submission.csv 파일을 직접 제출하여 확인해본 결과
이상 없이 제출되어 점수가 채점되는 것을 확인하였습니다.
똑같은 현상이 반복되신다면 페이지 새로고침 혹은 캐시 및 쿠키 삭제를 시도한 후 제출해보시는 것을 권장드립니다.
감사합니다.
데이터를 확인하는 도중 train 파일에서 156,550 번째 데이터의 start_position과 end_position이 epitope의 position과 차이가 있는 것 같습니다. 확인 부탁드립니다.
안녕하세요 안녕해요님,
해당 게시글의 데이터셋 설명과 같이 해당 데이터셋(DB)은 실험 논문의 결과들을 큐레이터가 옮긴 것으로 실험 오류나 기록 오류가 존재할 수 있습니다.
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Protein 사전학습 모델 학습에 대회에서 제공하는 학습 데이터도 사용하면 안되나요?