AI야 , 진짜 뉴스를 찾아줘! AI 경진대회

데이터 스키마 질문드립니다.

2020.11.23 13:46 5,288 조회

1) 데이터 스키마에서 info 컬럼(정보 유무)에서 1이 정보 있음, 0이 정보 없음인데 이게 곧 진짜뉴스, 가짜뉴스를 의미하는 것인지 궁금합니다.


2) 트레인과 테스트 데이터 모두를 살펴보면 후반부에는 같은 뉴스 id를 가진, 중복 데이터들이 많던데 올바르게 제공된 데이터인지 궁금합니다.


3) ord 변수는 한 뉴스 내의 문장 순서인지 혹은 연합뉴스 같은 뉴스통신사 기사를 언론사에서 재배포한 순서인지 등 어떤 순서를 말하는 건지 모호한데, 전체적으로 데이터 명세서의 설명이 조금 부족한 것 같습니다.


감사합니다!

로그인이 필요합니다
0 / 1000
DACONIO
2020.11.23 18:35

안녕하세요
NH에서 제공한 데이터 상세설명에 대한 자료를 업로드 하였습니다.
확인해주시면 감사하겠습니다. 

HONGYP
2020.11.23 20:35

동일한 부분이 궁금한데 위 세가지 질문에 대해서 답변 가능한가요?