제1회 신약개발 AI 경진대회

HLM, MLM 값이 100% 를 초과하는 데이터... 문의

2023.08.10 21:21 3,498 조회

"HLM 및 MLM은 간 및 마우스의 간 대사효소와 화합물을 30분 동안 반응시킨 후, 대사되지 않고 남아있는 화합물의 양을(%)"

이라고 안내되었습니다. 그렇다면 HLM, MLM 값은 100을 넘어서는 안됩니다. 


하지만, 데이터셋에 남아있는 화합물의 양을이 100%를 초과하는 데이터들이 있습니다.

잘못된 데이터가 아닌지요?

로그인이 필요합니다
0 / 1000
EISLab_이희원
2023.08.10 23:02

삭제된 댓글입니다

DACON.SeungYoon
2023.08.11 10:34

안녕하세요, suleezard 님
문의주신 사항에 대해 주최측 답변을 전달드립니다:
논리적으로는 아무리 안정한 물질이라도 100%를 넘는 값은 나올 수 없는 수치입니다.
그러나 간혹 용해도가 극히 좋지 않으면서 대사안정성이 높은 물질의 경우, 
37도에서 30분간 반응하며 주어진 시간동안 실험 전보다 용해도가 더 증가하여 
반응 후 % remaining값이 반응 전 대비 더 큰 값으로 계산되는 경우도 발생될 수 있습니다.
모든 실험값들은 본 상황과 같은 문제를 포함하여 편차가 있을 수 있는 다양한 가능성이 있으므로 실측값들을 그대로 게시하였습니다.
실험값 데이터의 분석에 항상 수반되는 문제이므로 이런 데이터의 처리에 대하여서도 분석하시는 분들이 고려하셔야 할 것입니다.
감사합니다.

suleezard
2023.08.11 10:38

네. 설명 감사합니다.
test set에도 동일한 현상의 데이터가 포함되었겠군요... 

joker1251
2023.08.27 00:25

추가적인 질문입니다.

실제 실험 결과를 바탕으로 발생할 수 있다고 설명주셨는데요.
그럼 test_dataset에서 train_dataset과 마찬가지로 100을 초과하는 값이 존재할 수 있는 것인지요?

DACON.SeungYoon
2023.08.30 10:42

안녕하세요, joker1251 님
운영방침상 test 데이터 관련 정보는 제공하고 있지 않습니다.
감사합니다.