분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
사전 학습모델의 사용 제약
※ 사용에 법적 제약이 없는 : 오픈소스 라이센스로 공개되어 있으며, 상업적 이용을 포함한 자유로운 사용이 허용되는 경우를 의미합니다.
별 생각없이 timm 모델을 사용하면 되겠거니 했는데, 생각보다 성능이 안나와서 다른 모델을 사용해보려고 라이선스 조항을 살펴보게 되었습니다.
timm 모델의 경우, 모델자체는 상업적 이용을 포함한 오픈소스 라이선스 이지만, 사전학습 가중치는 데이터 라이선스를 따른다고 되어 있습니다.
timm 모델의 사전학습 가중치가 거의 100%가 ImageNet으로 훈련되어 있는데, ImageNet 의 라이선스는 비 상업적인 사용에 대해서만 허가됩니다.
따라서, dacon에서 언급하는 "사용에 법적 제약이 없는"에서 언급하는 내용에 맞으려면, 현실적으로 "사전학습모델" 사용이 불가능해 보입니다.
혹시, 점수에 관여는 할 텐데, 가중치 데이터는 라이선스에서 예외로 보면 되는 걸까요?
항상 AI교육에 힘써주시는 dacon의 노고에 감사드립니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요, basslibrary님.
소중한 의견 주셔서 감사합니다.
말씀해주신 대로, timm 및 torchvision 등에서 제공하는 사전학습 모델은 모델 구조 자체는 오픈소스 라이선스를 따르지만, 대부분 ImageNet 데이터로 학습된 가중치를 사용하며, 이는 비상업적 이용만 허용하는 ImageNet 데이터셋 라이선스의 제약을 받습니다.
본 경진대회에서는 원칙적으로 "상업적 이용을 포함한 자유로운 사용이 가능한 경우"만을 ‘사용에 법적 제약이 없는’ 것으로 정의하고 있었기에, 엄밀히 해석하면 ImageNet 기반 가중치의 사용은 제한되는 것이 맞습니다.
그러나 현실적으로 컴퓨터 비전 분야에서 공개된 대부분의 사전학습 모델은 ImageNet 기반 가중치를 사용하고 있으며, 대부분 컴퓨터 비전 분야의 경진대회에서도 관행적으로 가중치 사용을 허용하고 있습니다. 심지어 본 월간데이콘에서 제공된 베이스라인 코드 또한 ImageNet 가중치를 활용하고 있습니다.
이러한 상황을 반영하여, 참가자 간 조건의 형평성과 실질적인 제약 완화를 위해 규정을 다음과 같이 수정하였습니다.
"오픈소스 라이선스로 공개되어 있으며, 최소 비상업적 이용을 포함한 자유로운 사용이 허용되는 경우"를 의미합니다.
이에 따라, timm 및 torchvision 등에서 제공하는 ImageNet 기반 사전학습 모델도 이번 대회에서는 사용 가능합니다.
다시 한 번 귀중한 지적 감사드립니다. 향후에도 명확하고 일관된 기준 마련에 참고하도록 하겠습니다.