Share AI knowledge and Solve curiosities

9,662 Posts

Discuss all aspects of artificial intelligence and data science.
Satisfy your curiosity through Q&A and share new learnings.

Competitions Learning Hiring

2025 Samsung Collegiate Programming Challenge : AI 챌린지

참가자격

졸업 유예자는 참가 불가하다고 되어있는데요 이번학기 졸업예정자는 가능한가요?

jmjung1997

326

2025.07.01

326

2025.07.01

Boost up AI 2025 : 신약 개발 경진대회

데이터셋 실험 조건 공유합니다

구글링하면 나오는 내용이라(과기부 보도자료) 정보 공정성 측면에서 대회 데이터셋 실험 조건 공유합니다.

NAJUNGHWAN

511

2025.07.01

511

2025.07.01

2025 Samsung Collegiate Programming Challenge : AI 챌린지

데이터셋 활용 재문의

현재 테스트를 위해 제공된 축소 평가 데이터(60개 샘플)에 대해 궁금한 점이 있습니다. 안내에 따르면, 7월 3일 10:00부터는 본선 진출자 선발을 위한 최종 평가 데이터가 새롭게 배포되고, 기존 축소 평가 데이터는 정답과 함께 학습용 데이터로 전환되어 제공된다고 안내되어 있습니다. 이와 관련해, 실험을 해보려고 하는데 현재 모델 테스트 기간에도 “이미지의 전체적인 배경 정보”를 프롬프트 엔지니어링에 활용하거나, 해당 데이터를 활용해 모델을 추가로 학습시키는 것이 허용되는지 문의드립니다. 즉, 지금 시점에서 이러한 방식을 이용하여 제출하면 데이터 리키지 등으로 규정 위반(실격 처리 등)에 해당하는지, 아니면 추후 공식적으로 학습 데이터로 제공될 예정이므로 지금 활용해도 무방한지 명확한 답변 부탁드립니다.

건우조

127

2025.07.01

127

2025.07.01

갑상선암 진단 분류 해커톤 : 양성과 악성, AI로 정확히 구분하라!

public/private shake-up 관련 데이터셋 비판

여러분 대회 고생 많으셨습니다. public/private 결과를 보시면 갑갑한 점이 많으리라 생각합니다. 입문 대회 특성상 그냥 넘어가도 되는 문제이기도 하지만, 대회가 간절한 사람 입장에서는 Daycon에 충분히 불만을 가질만한 사항이라고 생각합니다. 구체적으로 public/private 모두 동일 score가 많다는 점에서 데이터셋에 분명 문제가 많습니다. 사실 입상하신 분도 뛰어난 알고리즘이나 방법론을 적용해 입상하신 것인지 다소 의문이 듭니다. 여러분은 어떻게 생각하시나요?

NAJUNGHWAN

121

2025.07.01

121

2025.07.01

2025 Samsung Collegiate Programming Challenge : AI 챌린지

모델 사용 규정 관련 문의드립니다

vision encoder와 llm을 조합할 때, 그 둘을 이어주는 bridge module을 학습 시키는 것이 가능한가요? 허용된 외부 데이터셋으로요. 만일 학습시킬 경우 bridge module 부분의 가중치가 2023년 12월 31일 이전에 공개된 것이 아니게 되는데, 혹시 규정 위반인건지 궁금합니다. (bridge module은 제가 직접 설계해서 구현할 예정입니다.) frozen된 llm에 LoRA와 같은 PEFT 기법을 적용하여 adapter weight만 학습시키는 것이 허용되는 게 맞는지 궁금합니다. 제가 구현한 부분의 파라미터까지 파라미터 제한에 들어가는 건지 궁금합니다. 외부 데이터셋을 이용해서 학습시킬 경우, 가중치 업데이트를 하면 안되는 건지 궁금합니다. 감사합니다.

Spatz

144

2025.07.01

144

2025.07.01

2025 Samsung Collegiate Programming Challenge : AI 챌린지

모델 사용 기준에 대해서 궁금한 점이 있습니다

안녕하세요 모델 아키텍처는 24년 이전인데, 내부 llm을 이후 것으로 바꾸는 것은 안되는거죠? 데이터 증강할 때도 사용하는 VLM 모델 자체도 24년 이전만 사용 가능한건가요?

ingbeeeded

149

2025.07.01

149

2025.07.01

문맥 기반 문장 순서 예측 AI 경진대회

LLM의 블랙박스 문제에 관하여

여러분 대회 고생 많으셨습니다. LLM 특성상 블랙박스적인 요소는 항상 있습니다만, 이번 대회의 경우 프롬프팅에 따라 같은 모델도 score가 크게 왔다갔다하는 특징이 있어 더욱 까다로웠던 것 같습니다. 특히 순서 편향 문제가 어려웠던 거 같아요. 아마 프롬프팅과 finetuning, 모델 선정 등이 중요했을 것으로 보이는데 다들 어떤 방식으로 접근하셨는지, score 향상에 어떤 점이 주요했는지 궁금합니다.

NAJUNGHWAN

121

2025.07.01

121

2025.07.01

대출 상점 총 매출 예측 경진대회

Hi, in the evaluation formula, when the y < yhat (actual ...

Hi, in the evaluation formula, when the y < yhat (actual sales are less than the forecasted) --> total Error = sum(y-yhat), while the y<yhat --> Error < 0. Is this reasonable?

thaihq

4,725

2025.06.30

4,725

2025.06.30

🎯 인재 확보부터 기술 홍보까지! 🔑 기업 혁신의 새로운 열쇠 - 해커톤 소개서

1. 설명 영상 KRX 금융 빅데이터 활용 아이디어 경진대회 영상 HAICon2021 산업 제어 시스템 보안 위협 탐지 AI 경진대회 영상 국토 교통 빅데이터 온라인 해커톤 영상 2. 알고리즘 경진대회 결과물 성공사례 (건설분야) 건설기계 오일 상태 분류 AI 경진대회 (산업/채용) 유방암의 임파선 전이 예측 AI 경진대회 (의료) 제주도 도로 교통량 예측 AI 경진대회 (교통) 3. 분석 아이디어 경진대회 결과물 신한AI, 보다 나은 금융 생활을 위한 AI 서비스 아이디어 경진대회 한국 거래소 KRX | 금융 분석 아이디어 경진대회 국토 교통 빅테이터 온라인 해커톤 경진대회 OneLine Tech. - 금융교육 콘텐츠 빅데이터 API (CoP: 주식투자게임 'StockVity') 4. 출판 데이콘 경진대회 1등 솔루션 5. 경진 대회 리스트 📣 보다 자세한 문의는 이메일 dacon@dacon.io 로 보내 주시면, 빠르게 확인하고 회신드리겠습니다. 감사합니다.

도비콘

242

37,819

2025.06.30

242

37,819

2025.06.30

2025 Samsung Collegiate Programming Challenge : AI 챌린지

데이터셋 활용 및 참가자격 재문의

1.데이터셋 활용 문의 : 현재 테스트를 위해 제공된 축소 평가 데이터(60개 샘플)에 대해 궁금한 점이 있습니다. 안내에 따르면, 7월 3일 10:00부터는 본선 진출자 선발을 위한 최종 평가 데이터가 새롭게 배포되고, 기존 축소 평가 데이터는 정답과 함께 학습용 데이터로 전환되어 제공된다고 안내되어 있습니다. 이와 관련해, 실험을 해보려고 하는데 현재 모델 테스트 기간에도 “이미지의 전체적인 배경 정보”를 프롬프트 엔지니어링에 활용하거나, 해당 데이터를 활용해 모델을 추가로 학습시키는 것이 허용되는지 문의드립니다. 즉, 지금 시점에서 이러한 방식을 이용하여 제출하면 규정 위반(실격 처리 등)에 해당하는지, 아니면 추후 공식적으로 학습 데이터로 제공될 예정이므로 지금 활용해도 무방한지 명확하게 안내 부탁드립니다. 2.참가자격 문의 : 저는 이번년도 8월 졸업 예정자로, 학교 측 문의 결과 8월 22일 학위수여식까지는 재학생 신분이 유지되어 재학증명서 발급이 가능하다고 안내받았습니다. 참가자격 안내문에 따르면 대학(원) 재학 또는 휴학생(전공·학년 무관)만 참여할 수 있으며, 졸업유예생은 참여가 불가 하다고 명시되어 있습니다. 현재 참가 중인 대회의 오프라인 본선이 8월 22일, 시상식이 8월 29일에 예정되어 있는 것으로 알고 있습니다. 이와 관련하여, 1차 예선(7월 28일 종료)에서 본선 진출(50등 이내)에 선정될 경우, 재학생 신분 유지 기준일이 예선 종료일(7월 28일)까지인지, 아니면 본선 시상식(8월 29일)까지 재학생 신분을 유지해야 하는지 궁금합니다. 결과적으로, 위와 같은 저의 상황에서 대회 참여 및 수상 자격이 가능한지 확인 부탁드립니다. 정확한 답변 부탁드립니다.

건우조

247

2025.06.30

247

2025.06.30

Boost up AI 2025 : 신약 개발 경진대회

실험하면서 얻게된 경험(?) 공유 드립니다.

rmse 수치는 public score와 비례하진 않는 것 같습니다. -> 실험 결과 rmse의 수치가 낮았을 때보다, rmse의 수치가 높았을 때 기존 1등 public score가 높게 나왔었습니다. (아마 데이터셋이 적어서 그런 것 같습니다(?)) train.csv의 값에서 0의 라벨은 학습에 필요하다고 생각됩니다. -> 실험 결과 라벨에서 0을 무시하고 결과를 봤더니 오히려 점수가 하락했었습니다. (만약 0을 없애고 학습을 하게 되면 모델이 이 구조가 필요한 지, 아닌지 모르는 것 같습니다.) inhibition의 평균이 높다고 좋은 것도 아닌 것 같습니다. -> 제 지식에선 Inhibition이 높으면 약효가 강한 것으로 알고 있습니다. 그렇다고 Inhibition의 평균이 높다고 또 점수가 높게 나오는 건 아닌 것 같습니다. 나중에 새로운 거 발견하면 또 올릴게용♥ --------------------------------------------------------------------------- 실험결과 똑같은 파일을 제출하더라도 점수가 다르게 나오는 걸 확인했습니다. 리더보드 채점에 명시되어 있는 테스트 샘플 50% 중 무작위 80%를 평가하는 것 때문에 그런 것 같습니다. 즉 운이 좋아서, 예측한 샘플들의 점수가 무작위 80%에 잘 맞으면 점수가 높게 나오고, 그렇지 않다면 낮게 나오는 것 같습니다. 이 문제를 해결하기 위해선 모델을 보다 견고하게 조정하고 오차 값을 줄이는 게 포인트인 것 같습니다.

신약보단마약이지

863

2025.06.30

863

2025.06.30

Boost up AI 2025 : 신약 개발 경진대회

데이터 질문 드립니다.

Inhibition에 대한 Assay 정보(예를들어: 농도, 인큐베이션 타임) 제공이 가능한지 궁금합니다.

Dalsong

312

2025.06.30

312

2025.06.30

Boost up AI 2025 : 신약 개발 경진대회

데이터에 대한 문의

현재 제공되는 훈련, 테스트 데이터의 실험 조건에 대해 알고 싶습니다. 조건은 모두 동일할까요?

곱슬곱슬

365

2025.06.29

365

2025.06.29

대출 상점 총 매출 예측 경진대회

What does it mean by "*Please be noted that the data is samp...

What does it mean by "*Please be noted that the data is sampled by the ‘card ID’" ?

Bellagio

5,446

2025.06.28

5,446

2025.06.28

신용카드 고객 세그먼트 분류 AI 경진대회

[ Awards 1st ] 신용카드 고객 세그먼트 분류 AI 경진대회

----------- 본인을 대표하는 이미지 한 장을 첨부해 주세요. 축하합니다, 과적합방지위원회 님! 수상의 영광을 함께 나누게 되어 기쁩니다. 우승의 기쁨을 맛본 소감을 한마디로 표현해 주세요. 2달간 정말 매일 열심히 고민하고, 찾아본 노력의 결과가 나온 것 같아 기분이 좋습니다! 팀의 이야기를 들려주세요. 저희는 기존에는 조선대학교 경영학부 내 동아리에서 해당활동을 참여하였는데, 나머지 팀원분들과는 데이콘 프로필을 통해 추후 연락을 진행하여, 저희의 부족한 부분을 보완하고 싶어 팀을 합치게 되었습니다. 여러분을 돋보이게 한 특별한 점은 무엇인가요? 아래서도 언급하겠지만, 저희가 차별성으로 가지고 갈 수 있었던건 아이디어적인 부분이라고 생각합니다. 코드적인 부분에서는 다른 분들에 비해 비전공자다보니 떨어질 수 밖에 없다고 판단하여 색다르게 접근하고 다양한 방법들을 시도해보려고 노력한게 좋은 성과를 이끌었던 것 같습니다. 이번 성과의 비결은 무엇이라고 생각하시나요? 아무래도 저희 팀원분들이 비전공자(경영학부)가 2분, 전공자가 2분 계셔서 각자의 강점과 도메인 지식을 살려 성과를 낸 점이 해당 성과를 이끄는데 가장 큰 도움이 될 수 있지 않았나 싶습니다. 대회 기간 중 특별히 기억에 남는 순간이 있다면 공유해 주세요. 아무래도 가장 기억에 남는 순간은 Private가 1등으로 고정된 순간이었습니다. 저희가 코드에는 전부 공유하지 못했지만, 이름에 맞게 과적합을 줄이기 위해 정말 많은 노력을 했습니다. 거의 1달 이상 1등을 유지하였기에, Public 점수에 대한 신뢰성을 높히기 위해 다양한 모델을 사용해 각 세그먼트에 대한 검증을 많이 진행하였는데 Private가 1등으로 고정되었을 때 정말 짜릿했던 것 같습니다. 데이터 분석이나 학습 과정에서의 나만의 비법이 있다면요? 제가 비전공자라 코드 짜는게 아직도 어렵고, 힘들때가 많은데 뭐든 색다르게 생각하려고 노력해보고 그 틀에서 항상 벗어나려고 노력하고 있습니다. 일단 생각을 정하고 나면 그걸 코드로 풀어내는 건 그 이후의 일이라고 생각하고 머리 속으로 구상과 아이디어를 먼저 정리하려고 노력하는 편입니다. 수상을 기념하여 빌 수 있는 한 가지 소원이 있다면? 아무래도 이제 제가 4학년이다 보니 졸업 후 취업이 빠르게 되었으면 좋겠습니다. 앞으로의 목표와 꿈을 말씀해 주세요. 앞으로 다양한 경험을 통해 더 많은 데이터들을 접해보고 싶습니다. 또한, 최종적으로 데이터를 통해 기업들의 효율적인 의사결정을 지원하는 일을 하고 싶습니다. 데이콘 커뮤니티에 바라는 점이 있다면 무엇인가요? 데이콘 커뮤니티에 대해선 잘 모르겠지만, 데이콘에 대해서 이야기를 좀 해보자면 우선 최근 들어선 굉장히 만족하고 있는 편입니다. 많은 대회들과 여러기관들과의 협업을 통해 실제 데이터들을 사용해볼 수 있는게 만족스럽습니다. 다만, 이번 자갈 분석이나 카드 세그먼트 등은 데이터 규모가 커서 접근 조차 힘든 분들이 많았을거 라고 생각합니다. 저 역시 구글 코랩을 사용했는데, A100을 사용하느라 많은 비용을 지불했습니다 (ㅠㅠ) 많은 분들이 참여할 수 있게, 조금은 데이터 규모를 줄이면 어떨까 싶습니다. ----------------

과적합방지위원회

343

2025.06.27

343

2025.06.27