SeSAC Hackathon: Generative AI conjugation

Idea | AI | Generative | Qualitative evaluation

  • moneyIcon 15,000,000 KRW
  • 924 Users Completed
Closed

 

Compiler_Editors : Edit-Click(모바일 편집기)

공동작성자

stroke
2025.11.18 21:30 340 Views language

팀 명 : Compiler_Editors
서비스 명 : Edit-Click
GitHub Repository 링크 : https://github.com/00hskim/25_SeSAC_Compiler-Editors

1. 서비스 주제 음성·감정·장면 분석 기반 End-to-End 모바일 AI 자동 영상 편집 앱 
2. 핵심 내용 사용자가 영상을 업로드하면 AI가 컷 편집·저작권 프리 BGM·다국어 동적 자막을 한 번에 자동 생성하여, 편집 시간을 90% 절감하고 무음 시청 몰입도를 극대화함.
3. 세부 내용
Whisper(STT)로 다국어 자막 생성 및 Wav2Vec2(감정)·librosa(리듬)로 편집 포인트 추출.
분석된 감정선(JSON)에 맞춰 Stable Audio 2로 맞춤형 BGM 생성 및 동적 자막 적용.
TransNet V2(장면 전환) 분석을 결합하여 컷 편집 타이밍 정밀 보정.

PDF
Login Required
0 / 1000
염정운
2025.11.20 13:27

잘 보았습니다. Edit-Click은 음성, 감정, 장면에 기반한 End-to-End AI 영상 편집 파이프라인을 구축하여 편집 시간을 획기적으로 줄이려는 목표가 인상적입니다. Whisper STT, Wav2Vec2 SER, Stable Audio 2 BGM 생성 등 다양한 최신 AI 기술을 통합적으로 활용한 기술 스택과, 이를 JSON 메타데이터로 통합 관리하는 구조 설계가 매우 탄탄하고 체계적입니다. 특히 무음/머뭇거림을 감지한 컷 편집 후보 탐지와 감정에 맞춘 BGM 자동 생성 기능은 실제 크리에이터들의 니즈를 정확히 파악한 실용적인 핵심 기능으로 판단됩니다. 최종 MVP에서 약 70% 구현된 백엔드 파이프라인과 UI 연동이 기대됩니다.

류태환
2025.11.20 16:53

말씀해주신 것처럼, 저희 팀은 음성, 감정, 장면 분석 기반의 End-to-End AI 영상 편집 파이프라인을 구축하여  편집 시간을 획기적으로 줄이는 것을 핵심 목표로 하고 있습니다!
귀한 의견 말씀해주셔서 감사드립니다!

야호-
2025.11.20 18:25

사용자가 영상을 올리기만 하면 이렇게 세세한 분석을 통해 완성도 높은 결과물을 만들어준다는 점이 정말 인상적이에요!
감정선·장면·리듬까지 함께 보는 편집 방식이라, 초보자도 전문가 같은 결과물을 얻을 수 있을 것 같아요 😊

저희는 이번에 가족 간 소통을 돕는 AI 서비스 ‘모야(MOYA)’를 기획했습니다!!>__<
캐릭터도 정말 귀엽게 만들었고 기획도 열심히 했으니, 괜찮다고 느껴지신다면 작은 응원 한 표와 편히 피드백 부탁드립니다!! 🐾💌!!

류태환
2025.11.20 22:02

정성스러운 피드백 남겨주셔서 감사합니다! 초보자도 쉽게 쓸 수 있도록 기획했는데, 그 점을 높게 평가해 주셔서 큰 힘이 됩니다. 가족 간 소통을 돕는 '모야' 서비스도 기획 의도가 정말 좋네요. 말씀하신 귀여운 캐릭터랑 기획서 보러 지금 바로 방문하겠습니다. 좋은 결과 있으시길 응원할게요!

JEMIN
2025.11.21 11:40

영상 편집에 대한 수요가 늘어나는 와중에 Edit-Click이라는 서비스는 수요에 걸맞는 서비스라고 생각이 되네요! 요즘 유튜브의 전반적인 추세가 영상의 업로드 주기를 줄이는 분위기던데, 일이 늘어난 편집자들 입장에서는 필수 서비스라고 생각이 됩니다 잘보고 갑니다!

류태환
2025.11.21 12:06

좋은 말씀 감사합니다! 편집자분들이 늘어난 업무량 때문에 힘들어하는 걸 보고 기획했는데, 그 마음을 딱 알아봐 주셔서 감동이에요. 말씀해주신 대로 진짜 꼭 필요한 서비스가 될 수 있도록 더 열심히 해보겠습니다! 응원 감사드려요!

saikey
2025.11.21 14:27

프로젝트 정말 인상 깊게 봤습니다. Whisper → Wav2Vec2 → librosa → Stable Audio까지를 세그먼트 기반 JSON으로 깔끔히 통합한 구조가 개발자 입장에서 특히 좋았습니다. 
그리고 무엇보다 감정 분석을 편집 포인트로 삼는 역발상이 너무 재밌었어요. 숏츠는 보통 자극 컷만 뽑는데, 감정선 기반으로 BGM·컷 타이밍을 잡는 방식이 확실히 차별화돼 보였습니다. 저희도 드론 추적 시스템에서 멀티모달 정보를 단일 프레임으로 묶는 구조를 쓰고 있어 많이 배웠습니다.
혹시 괜찮으시면 Edit-Click의 segment merging 접근법을 저희가 어떻게 참고해서 적용할 수 있을지 짧은 조언 주시면 감사하겠습니다! 🙌🔥

류태환
2025.11.21 16:03

안녕하세요! 저희 아키텍처 로직을 이렇게 꼼꼼하게 분석해 주시다니 정말 감사합니다! 개발자분께서 알아봐 주시니 더 뿌듯하네요!

말씀하신 Segment Merging 부분에 대해 조금 더 부연 설명을 드리자면, 사실 저희는 모든 정보를 한 덩어리로 합치기보단 '레이어(Layer) 방식'에 가깝게 설계했습니다!

1. 컷 편집(Base): 철저하게 무음/머뭇거림 같은 오디오 신호와 샷 전환 정보를 기준으로 잡고,

2 .감정/리듬(Overlay): 분석된 시퀀스를 바탕으로 그 위에 BGM 전환점이나 동적 자막을 얹는 방식입니다.

이렇게 설계한 가장 큰 이유는 '전문 편집자의 판단 과정'을 모사하기 위해서였어요. 사람이 편집할 때 프레임 하나하나를 뜯어보기보단 전체적인 흐름(Flow)을 보니까요. 또, 프레임 단위 분석을 피해서 연산 비용과 시간을 획기적으로 줄이려는 목적도 컸습니다.

드론 팀은 멀티모달 정보를 단일 프레임 단위로 묶으신다고 하셨는데, 혹시 실시간 처리나 리소스 부하 쪽은 괜찮으신가요? 드론 영상 데이터량이 상당할 텐데, 프레임 단위보다는 의미 있는 '이벤트'나 '타임 블록' 단위로 뭉쳐서 처리해보시면 리소스 효율 면에서 훨씬 유리하지 않을까 조심스럽게 의견 드려봅니다!

멋진 드론 프로젝트도 응원하겠습니다! 같이 파이팅해요!

saikey
2025.11.24 10:13

와… 상세하게 구조까지 설명해주셔서 진짜 감사합니다 🙏
말씀해주신 레이어 방식 + 이벤트 단위 플로우 접근이 왜 효율적인지 확실히 이해됐습니다.
저희도 실시간 드론 추적에서 비슷한 고민을 했었거든요!

다만 저희는 Hailo NPU 기반으로 YOLO → ReID → Depth → Tracking이 전부 하드웨어 가속으로 돌아가서 프레임 단위로 묶어도 부하가 크게 없다는 점이 좀 특이한 케이스긴 합니다 ㅎㅎ

오히려 이런 이유 때문에 말씀해주신 “이벤트·타임 블록 단위 처리”가 저희 시스템에서는 어떻게 맞아떨어질지 더 흥미롭게 다가오는데요,
혹시 시간 괜찮으시면 저희 데모도 한번 짧게 구경 오셔서 의견 주시면 정말 좋을 것 같습니다!
실제 화면으로 보시면 구조가 훨씬 이해가 잘 되실 거예요 😆🔥

다시 한번 좋은 설명 정말 감사드립니다!

문동민
2025.11.22 18:13

안녕하세요🙇🏻, 팀 [PrePair]입니다!
음성·감정·장면 분석 결합해서 E2E 자동 편집이라니 임팩트가 큽니다.
사실 다들 크리에이터 말만 하지 영상 편집 이런거 못해서 못하는 사람들에게는 좋은 프로젝트네요!
화이팅입니🔥

류태환
2025.11.22 23:16

좋게 봐주셔서 정말 감사합니다!! 누구나 쉽게 영상을 만들 수 있게 하자는 게 저희 목표였는데, '임팩트 있다'고 해주시니 정말 뿌듯하네요 ㅎㅎ PrePair 팀의 응원 받아서 더 열심히 마무리해 보겠습니다! 저희도 PrePair 팀 프로젝트 응원할게요! 같이 파이팅해요!

아웃_탈출하기
2025.11.22 22:41

🧅안녕하세요 팀-밤티 입니다🧅

최근 전 연령대에서 sns 사용자가 폭발적으로 증가중인데 트랜드를 잘 반영한 아이디어같네요!
세상에 나오면 좋을 아이디어같아 추천 눌러드립니다 :)

번아웃 탈출 프로젝트 ONION이 괜찮으시다면 추천 부탁드립니다!

류태환
2025.11.22 23:22

밤티 팀 안녕하세요! '세상에 나오면 좋을 아이디어'라니 최고의 칭찬 감사합니다! 듣던 중 가장 힘이 되는 말이네요 ㅎㅎ 저도 아까 ONION 기획서 봤는데, 특히 '상사 페르소나' 기능이 진짜 대박이더라고요! 직장인으로서 감정이입 100% 완료했습니다! 저도 바로 추천 누르러 달려가겠습니다! 남은 기간 같이 파이팅해요!

은룡
2025.11.22 22:50

저도 영상 편집을 할 때마다 컷 편집, BGM 선택, 자막 싱크 맞추기에 시간이 정말 오래 걸려서 고민이 많았어요. 특히 감정에 맞는 음악을 고르고, 자막을 일일이 타이밍에 맞춰 넣는 작업은 정말 번거롭더라고요.
Edit-Click처럼 AI가 음성, 감정, 장면을 분석해서 컷 편집부터 저작권 프리 BGM, 다국어 동적 자막까지 한 번에 자동 생성해준다면 편집 시간을 엄청나게 줄일 수 있을 것 같습니다. 특히 Whisper와 Wav2Vec2, Stable Audio 2를 결합해 감정선에 맞춘 BGM까지 자동 생성한다니 정말 혁신적이네요. 영상 크리에이터들에게 큰 도움이 될 서비스라고 생각합니다!
저희 NADA 서비스도 사용자에게 도움이 되도록 개발 중이니, 한번 확인해주시고 피드백 주시면 감사하겠습니다.
https://dacon.io/competitions/official/236624/talkboard/415847

류태환
2025.11.22 23:28

NADA 팀 안녕하세요! 편집할 때 BGM이랑 자막 싱크 맞추는 게 진짜 제일 귀찮은 작업인데, 그 고충을 딱 공감해 주시니 너무 반갑네요! 저희가 공들인 기술 스택(Whisper, Stable Audio)까지 꼼꼼히 봐주셔서 개발자로서 정말 감동했습니다!

저도 아까 NADA 기획서 정독했는데, 단순 뷰티 앱이 아니라 '논문 기반 RAG'로 자존감 회복까지 돕는다는 점이 너무 따뜻하고 인상 깊었어요. 남은 기간 같이 힘내봐요!

스마일3
2025.11.23 22:26

BGM, 다국어 자막, 컷 편집까지 한 방에 뚝딱 처리해서 편집 시간을 절감해준다니...진짜 편리할 것 같아요...! 
크리에이터는 물론, 그냥 영상 편집 귀찮은 사람들한테도 정말 필요한 서비스라고 생각합니다! 
여행 다녀오고 집 오는 길에, 친구랑 찍은 추억 영상도 바로 편집해서 SNS에 올릴 수 있겠네요 ㅎㅎ! 

아크사벤
2025.11.24 15:12

Compiler_Editors 팀의 Edit-Click은 "이거 편집자들 숨통 트이게 하겠는데?" 라는 생각이 드는 압도적인 실용성을 갖춘 서비스입니다.
영상 편집 작업의 90%를 AI가 책임져서 크리에이터들의 고질적인 야근 문제를 해결할 수 있는 솔루션이라고 보여지는데, 특히 무음 구간 자동 컷 편집과 감정에 맞는 BGM, 다국어 동적 자막까지 AI가 알아서 처리해주는 기능들은 현장 편집자들의 효율을 극단적으로 높여줄 것 같습니다. 다만... 편집자들 일자리를 잃게 만들거 같아서 걱정이 드는군요

저희 AIpex 팀은 자동차의 HUD를 개인 이동수단 이용자에게 제공하는 AI 주행보조 AR 헬멧을 제작하여 교통 안전이라는 핵심 사회 문제 해결을 위해 초저지연 임베디드 AI 시스템 구현이라는 특수한 기술 난이도에 도전하고 있습니다. 관심 부탁드립니다! https://dacon.io/competitions/official/236624/codeshare/13363

잊ㄴ구
2025.11.24 15:27

사용자가 직접 영상을 올리기만 하면 AI가 알아서 컷 편집부터 자막, BGM까지 모두 자동으로 맞춤 제작해준다는 점이 정말 획기적이네요. Whisper·Wav2Vec2·librosa 등 최첨단 음성·감정·리듬 분석 기술을 결합해, 영상 몰입도와 편집 완성도를 동시에 잡은 솔루션이라고 생각합니다.

특히 여러 언어 자막과 동적 감정 분석 결과에 맞춘 BGM 적용, 장면 전환까지 End-to-End로 처리해서 유튜브·SNS에서 영상 제작이 부담됐던 사람들에게 큰 도움이 될 것 같아요. 편집 시간을 대폭 줄이면서도 감정·리듬처럼 섬세한 부분까지 자동 편집해주는 점이 인상적입니다.

앞으로 더 다양한 영상 타입 지원과, 사용자 맞춤 설정 추가가 된다면 크리에이터와 일반 사용자 모두에게 필수 앱으로 자리잡을 것 같습니다. 영상 편집의 한계를 넘는 멋진 프로젝트 응원합니다! 

혹시 경제에 관심 있으시다면, AI 금융 문해력 향상 서비스 <FinFit>도 한 번 방문 부탁드립니다 !
https://dacon.io/competitions/official/236624/codeshare/13285

yoon22
2025.11.24 16:52

와, 정말 혁신적인 앱이네요. 영상 업로드만으로 AI가 컷 편집부터 다국어 자막, 저작권 프리 BGM까지 한 번에 처리해준다니 편집 시간을 대폭 줄일 수 있겠어요. 감정과 리듬 분석으로 맞춤형 BGM을 만들고, 장면 전환까지 정밀하게 반영한다는 점이 특히 인상적입니다. 영상 편집을 훨씬 직관적이고 몰입감 있게 바꿔줄 서비스 같아요.
응원합니다!
저희팀 서비스 "모야"도 구경와주세요~
https://dacon.io/competitions/official/236624/codeshare/13476#reply_area

DoxB
2025.11.24 18:44

영상을 보다가 어설픈 자막 때문에 몰입이 깨져서 다른 영상으로 넘어간 적이 종종 있었는데...
이런 서비스가 있으면 그런 자막들도 많이 줄어들 것 같네요! 😊