2024 생명연구자원 AI활용 경진대회 : 인공지능 활용 부문

알고리즘 | 유전체 | 정형 | 분류 | 바이오 | Macro F1 Score

 

기초적인 코드 공유

2024.11.07 22:02 1,473 조회 language

도메인 지식 없이 도전해보려다가 일이 생겨 한동안 신경 못쓰다가 급히 공부해서 시도해보려던 코드입니다.
토크에서 몇몇 분들이 class가 불균형하다, 훈련용 데이터에 없는 것들이 테스트 데이터에 있다는 말씀들을 하셔서 일단 종류 개수부터 파악을 하고 진행했습니다. 
학습용 코드에서는 WT는 0으로, 나머지는 맨 앞과 맨 뒤의 알파벳을 각각 맵핑하는데 둘이 같은 문자면 WT와 마찬가지로 0으로 처리했습니다. A->A나 B->B는 0으로 A->B는 1로, A->C는 2로 매핑하는 식으로 진행했습니다. 코드 공유가 파일 한개만 올릴 수 있어서 학습용 코드만 올립니다.

코드