분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제1회 신약개발 AI 경진대회
HLM, MLM 값이 100% 를 초과하는 데이터... 문의
"HLM 및 MLM은 간 및 마우스의 간 대사효소와 화합물을 30분 동안 반응시킨 후, 대사되지 않고 남아있는 화합물의 양을(%)"
이라고 안내되었습니다. 그렇다면 HLM, MLM 값은 100을 넘어서는 안됩니다.
하지만, 데이터셋에 남아있는 화합물의 양을이 100%를 초과하는 데이터들이 있습니다.
잘못된 데이터가 아닌지요?
안녕하세요, suleezard 님
문의주신 사항에 대해 주최측 답변을 전달드립니다:
논리적으로는 아무리 안정한 물질이라도 100%를 넘는 값은 나올 수 없는 수치입니다.
그러나 간혹 용해도가 극히 좋지 않으면서 대사안정성이 높은 물질의 경우,
37도에서 30분간 반응하며 주어진 시간동안 실험 전보다 용해도가 더 증가하여
반응 후 % remaining값이 반응 전 대비 더 큰 값으로 계산되는 경우도 발생될 수 있습니다.
모든 실험값들은 본 상황과 같은 문제를 포함하여 편차가 있을 수 있는 다양한 가능성이 있으므로 실측값들을 그대로 게시하였습니다.
실험값 데이터의 분석에 항상 수반되는 문제이므로 이런 데이터의 처리에 대하여서도 분석하시는 분들이 고려하셔야 할 것입니다.
감사합니다.
네. 설명 감사합니다.
test set에도 동일한 현상의 데이터가 포함되었겠군요...
추가적인 질문입니다.
실제 실험 결과를 바탕으로 발생할 수 있다고 설명주셨는데요.
그럼 test_dataset에서 train_dataset과 마찬가지로 100을 초과하는 값이 존재할 수 있는 것인지요?
안녕하세요, joker1251 님
운영방침상 test 데이터 관련 정보는 제공하고 있지 않습니다.
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
삭제된 댓글입니다