데이스쿨! 가을맞이 특별할인
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
2025 Samsung Collegiate Programming Challenge : AI 챌린지
Laion 데이터 사용 질문
아래 질문에서 이미지들이 CC3M 사용이 안된다고 하셨는데 추가로 질문이 있습니다.
감사합니다.
https://huggingface.co/datasets/liuhaotian/LLaVA-Pretrain 데이터셋의 경우 사용가능할까요?
댓글 말구 본 글로 써주시면 좋을 것 같아요:)
질문이 많아서 그러는시지 간혹 답글에는 답장 못하실때가 있으시더라구요
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
1. 네. LAION 데이터셋도 마찬가지로 URL과 페어한 캡션으로 구성되어있고, LAION 라이센스는 URL과 페어한 캡션에만 부여가되어있습니다. 즉, 이미지에 대한 라이센스는 명확하지 않아 사용이 어렵습니다.
따라서 사용하는 외부 DB(데이터셋)이 이미지 파일까지 포함되어있고, 명확하게 라이센스가 부여되어있는 데이터셋을 활용하시길 바랍니다.
아울러, LAION이나 CC3M의 캡션 데이터는 라이센스가 명확히 부여되어있으므로 사용 가능합니다.
2. 외부 DB로 CC3M 이미지를 사용할 수 없습니다.