악성 URL 분류 AI 경진대회

외부 데이터 범위 관련 질문

2025.02.19 20:12 736 Views

데이터 분석 경험은 많지 않고 모르는 건 많아서 질문 드립니다.

본 대회는 외부 데이터 사용을 금지하고 있는데, 그 범위가 어디까지인지 궁금합니다.

예를 들면, 1) python Whois 모듈을 통해 도메인의 생성일자/갱신일자/만료일자를 추출한다거나, 2)  DNS의 SOA 레코드 질의를 통해 DNS TTL(Time To Live)이나 네임서버 명칭을 추출하는 행위는 외부 데이터 사용에 해당하는 건가요?

이외에도 외부 데이터 사용 금지 규칙에 대한 더 자세한 기준이 있다면 알려주시면 감사하겠습니다 ㅠ

Login Required
0 / 1000
DACON.GM
2025.02.20 09:03

안녕하세요 반도체의황제님,
문의주신 내용에 대한 답변입니다.
대회 제공된 학습데이터만 학습에 활용할 수 있습니다. 또한 추출할 수 있는 정보는 제공한 URL이 담고있는 오직 Text 정보로부터 추출될 수 있어야합니다.
1) 도메인 등록 정보를 조회하는 것은 새로운 데이터를 가져오는 것이며, 외부 데이터 활용에 해당합니다.
2) DNS 질의는 실시간으로 네트워크 정보를 가져오는 것으로 외부 데이터 활용에 해당합니다.
감사합니다.