분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
※ S-Bert Cosine 유사도는 예측(생성) 문장과 정답 문장간의 의미론적 유사성을 측정합니다.
※ S-Bert Cosine 유사도에 활용되는 정답(GT)의 Embedding Vector는 ‘jhgan/ko-sbert-sts’ 모델을 통해 추출되었습니다.
※ Jaccard 유사도는 예측(생성) 문장과 정답 문장에서 사용된 단어들의 집합을 비교하여 어휘적 유사성을 측정합니다.
※ S-Bert Cosine 유사도에 활용되는 Embedding Vector는 반드시 Jaccard 유사도에 활용되는 Text이어야 합니다.
def cosine_similarity(a, b):
"""코사인 유사도 계산"""
dot_product = np.dot(a, b)
norm_a = np.linalg.norm(a)
norm_b = np.linalg.norm(b)
return dot_product / (norm_a * norm_b) if norm_a != 0 and norm_b != 0 else 0
def jaccard_similarity(text1, text2):
"""자카드 유사도 계산"""
set1, set2 = set(text1.split()), set(text2.split()) # 단어 집합 생성
intersection = len(set1.intersection(set2)) # 교집합 크기
union = len(set1.union(set2)) # 합집합 크기
return intersection / union if union != 0 else 0
※ Private 리더보드 환산 점수는 순위 별 차등 점수가 아닌 2차 평가자 중 최고점수를 만점(20)으로 하여 이후 비율로 환산됩니다.
※ 내부 평가의 평가 질의 데이터 샘플 번호(ID)는 참가자에게 공개되지 않으며, 결과 품질을 심사위원이 직접 '정성 평가'합니다.
※ 내부 평가의 추론 리소스 평가는 Pass / Non-Pass 방식으로 진행되며, Pass의 경우 만점(5점)이며 Non-Pass의 경우 최하점(0점)이 부여됩니다.
※ 내부 평가의 추론 리소스 평가에 기준이 되는 컴퓨팅 리소스는 A100-80GB X 2대 (Total VRAM 160GB) 이며, 해당 리소스 범위 내에서 모델이 동작할 수 있어야합니다.
o 코드에 데이터 입/출력 상대 경로 포함
o 코드 파일 확장자: .py, .ipynb
o 코드와 주석 인코딩: UTF-8
o 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
o 개발 환경(OS) 및 라이브러리 버전 기재
o Private Score 복원이 가능한 전처리, 학습, 추론 코드 파일 (필수)
o Private Score 복원이 가능한 모델 weight 파일 (필수)
o 서면 평가 PPT 자료 (필수)
-> 2차 평가 기준(2. 평가 방식 -> 2차 평가 기준)에 맞춰 자유 양식으로 작성
https://dacon.io/notice/notice/13
예) [DACON 답변 요청] 시상식은 언제 열리나요?
대회 시작
팀 병합 마감
대회 종료
코드 및 PPT 제출 마감
코드 검증 및 2차 평가
최종 수상자 발표
※ S-Bert Cosine 유사도는 예측(생성) 문장과 정답 문장간의 의미론적 유사성을 측정합니다.
※ S-Bert Cosine 유사도에 활용되는 정답(GT)의 Embedding Vector는 ‘jhgan/ko-sbert-sts’ 모델을 통해 추출되었습니다.
※ Jaccard 유사도는 예측(생성) 문장과 정답 문장에서 사용된 단어들의 집합을 비교하여 어휘적 유사성을 측정합니다.
※ S-Bert Cosine 유사도에 활용되는 Embedding Vector는 반드시 Jaccard 유사도에 활용되는 Text이어야 합니다.
def cosine_similarity(a, b):
"""코사인 유사도 계산"""
dot_product = np.dot(a, b)
norm_a = np.linalg.norm(a)
norm_b = np.linalg.norm(b)
return dot_product / (norm_a * norm_b) if norm_a != 0 and norm_b != 0 else 0
def jaccard_similarity(text1, text2):
"""자카드 유사도 계산"""
set1, set2 = set(text1.split()), set(text2.split()) # 단어 집합 생성
intersection = len(set1.intersection(set2)) # 교집합 크기
union = len(set1.union(set2)) # 합집합 크기
return intersection / union if union != 0 else 0
※ Private 리더보드 환산 점수는 순위 별 차등 점수가 아닌 2차 평가자 중 최고점수를 만점(20)으로 하여 이후 비율로 환산됩니다.
※ 내부 평가의 평가 질의 데이터 샘플 번호(ID)는 참가자에게 공개되지 않으며, 결과 품질을 심사위원이 직접 '정성 평가'합니다.
※ 내부 평가의 추론 리소스 평가는 Pass / Non-Pass 방식으로 진행되며, Pass의 경우 만점(5점)이며 Non-Pass의 경우 최하점(0점)이 부여됩니다.
※ 내부 평가의 추론 리소스 평가에 기준이 되는 컴퓨팅 리소스는 A100-80GB X 2대 (Total VRAM 160GB) 이며, 해당 리소스 범위 내에서 모델이 동작할 수 있어야합니다.
o 코드에 데이터 입/출력 상대 경로 포함
o 코드 파일 확장자: .py, .ipynb
o 코드와 주석 인코딩: UTF-8
o 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
o 개발 환경(OS) 및 라이브러리 버전 기재
o Private Score 복원이 가능한 전처리, 학습, 추론 코드 파일 (필수)
o Private Score 복원이 가능한 모델 weight 파일 (필수)
o 서면 평가 PPT 자료 (필수)
-> 2차 평가 기준(2. 평가 방식 -> 2차 평가 기준)에 맞춰 자유 양식으로 작성
https://dacon.io/notice/notice/13
예) [DACON 답변 요청] 시상식은 언제 열리나요?
02.17
대회 시작03.17
팀 병합 마감03.24
대회 종료03.28
코드 및 PPT 제출 마감04.07
코드 검증 및 2차 평가04.08
최종 수상자 발표
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved