2025년 1월 25일,
국내 최초 빅데이터 연합동아리 BOAZ - 분석 22기를 수료했다
🎉🥳🎉
BOAZ는 한 학기는 BASE, 한 학기는 ADV 2개의 term으로 이루어져
1년의 과정으로 진행되는 동아리이다.
얼마전, 나는 ADV까지 끝내 장장 1년간의 결실을 맺을 수 있었다.
ADV프로젝트는 팀 빌딩부터 팀별 프로젝트까지 포함해서 약 6개월 간 진행하는 BOAZ의 꽃, Final 프로젝트이다!
나의 ADV프로젝트는 2024년 7월부터 2025년 1월까지 진행했다 💁🏻
Thanks to 팀원이였던 준스톤오빠
TEAM 2인 3각 , 너무너무 수고했어요
대표진 역할과 함께 병행하면서 쉽지만은 않았던 6개월이지만,
이만큼 충만하게 보낼 수 있었다니 돌아보면 뿌듯함뿐이다
📌 프로젝트 모아보기
Github 추후 추가
Youtube 추후 추가
SlideShare 추후 추가 예정 (https://www.slideshare.net/BOAZbigdata/presentations)
📝 7월, 프로젝트의 시작 📝
팀 구성원이 확정되고 초반 회의에서는
1. 도메인 결정
2. 전체적인 프로젝트 타임라인 결정
이 주된 task 였다.
우리팀은 '금융 도메인 + LLM(NLP분야) + RAG'에 대한 관심사를 중심으로 모인 팀이여서 도메인은 자연스럽게 금융이 되었다.
BOAZ에서는 기업 컨택이라는 아름다운,,문화가 있기에
'기업에서 실질적으로 분석할 수 있는 데이터를 얻어, 도메인 특화 LLM + RAG 모델 성능 향상 프로젝트를 해보자'라는 게 주된 의견이였다.
하지만, 금융 도메인 특성상 데이터 보안이 학부생입장에서 뚫을 수 있을지에 대한 고민이 커져서 '서비스 개발' 프로젝트로 방향성이 조정된 시기 이기도하다.


또한 프로젝트와 관련해서 프로젝트 CASE STUDY + 논문 리뷰 STUDY 도 진행하였다. (주 2회? 정도 초반 몇주간 진행)
다른 사람들은 어떤 방식으로 프로젝트를 성공적으로 이끌었는지 1차적으로 파악하고, 벤치마킹할 수 있는 부분은 가지고 가되 논문 등에서 우리팀만의 독자적인 차별성을 가지고자 했다.

진행했던 케이스 스터디들!
주로 금융 분야 공모전에서 수상했던 서비스들, Awsome paper, AI빅테크 기업의 최신 논문 등을 참고하였다.







초반 회의에서 준스톤오빠가 찾은 논문
이후, 프로젝트의 핵심 방법론 중 하나가 되었다.


📝 8월~9월, 프로젝트의 1차 개발 및 공모전을 통한 예행연습 📝
8월에는 논문 스터디를 심화해서 하면서 팀 전체에게 공유했었다.
이 과정에서 초반 기획이였던 Knewledge Distillation에서 Dynamic Few-shot에 대한 방향으로 전환이 있었고,
LLM+RAG 기술을 위해 Vector DB에서 데이터를 끌어오는 연습을 더 해보고자 2024 빅콘테스트에도 지원하였다.
(실전이야말로 실력을 올리는 가장 빠른 길 아니겠습니까)
sLLM을 사용할 예정이라 Meta의 Llama 3.1 - 8B모델 테스트도 진행했다.
동시에 하고 있던 일이 많았고, 팀원이 2명이라 빅콘에 대한 아쉬움이 조금 남지만, 이때의 llm 챗봇 프로젝트 경험으로 ADV 프로젝트는 훨씬 수월하게 굴러갈 수 있었다.
당시 프로젝트 타임라인

초기 프로젝트 아키텍쳐 (KD)


회의를 거쳐 수정된 최종 프로젝트 아키텍쳐 (Dynamic Few-shot)


빅콘테스트에 제출했던 PPT(일부)





📝 10월~1월(3개월), 본격적인 FinSum 프로젝트의 진행📝
마지막 3개월은 굳히기이자,,,,정말 본격적으로 코드 제작 Start.
이 단계에서 Retrieve 전 후로 Vetor데이터를 불러올 때 성능향상을 할 AdvancedRAG 기법을 추가적으로 시도하는 것과,
최소한의 기능 구현(MVP)형태로 서비스 구현을 해보면서 프로젝트를 진행했다.
모든 AI 프로젝트가 그렇겠지만,
백엔드 / 프론트 엔드로 나눠진 것이 아니다 보니 각자 코드를 작성한 후 합치는 단계에서 조정할게 정말 많았다.(빅콘에서 얻은 교훈)
그래서 애초에 사용자 쿼리 처리를 2단계로 분리해서 초반 단계는 내가, 후반 단계는 준스톤오빠가 제작해서
합치는 주간을 따로 만들면서 해결하였다. ㅎㅎㅎ

우리의 주 집결지는 합정 디벙크였는데,
정말 사람이 많은 곳이라 매주 자리가 있을지 긴장했어야했다 ^_^배려심깊고, 실력좋은 팀원과 함께 했기에 잘 마무리 할 수 있던 프로젝트
🐘 Final 발표 자료 🐘
1월 25일 , BOAZ 21회 컨퍼런스에서 발표했던 발표 자료이다.



























끝!
마지막으로 프로젝트를 하면서
내 경험 상 초반에 고민안했던 부분은 끝까지 고민하지 않는다는 것을,,,,알기 때문에 ㅎㅎㅎㅎ
초반부터 최대한 플젝 타임라인을 미리 정해두고, 기술적으로 부족한 부분을 논리적으로 채우고자 노력했는데 QnA에서 이를 알아봐준것 같아서 기분 좋았다 ㅎㅎ

'🎖️contest' 카테고리의 다른 글
2023 AI 허브 안심존 데이터 활용 경진대회 (feat. 최우수상) (0) | 2023.12.15 |
---|