본문 바로가기

■ Data Science Lab36

[RAG] 항공편탐색 Functiona Calling 구현 공부 (Ollama + RAG + ChromaDB + Function Calling) Function Calling 이 글은 스티븐 바티폴 (Milvus 개발자)가 작성한 Llama 3.1을 벡터 DB Milvus와 간단한 API들과 연동해서 Function Calling기능을 구현한 글을 참고하였습니다. 제시된 코드에서 ChromaDB로 수정하여 Function Calling을 소개하는 글입니다.추가적인 의견 환영합니다!▶ 참고 GitHub : stephen37/ollama_local_rag▶ 참고 : [전문가 기고] Ollama, Llama 3, Milvus로 함수 호출 (Function Calling)하기 by Stephen Batifol 함수 호출 (Function Calling)을 이해해 보자현재 GPT-4, Llama 3.1 등의 LLM은.. 2025. 6. 2.
[Prompt Engineering] Google Prompt Enigineering 백서 요약 10X AI Club의 'Prompt Engineering에 대한 모든 기법 소개' 영상과 Google Prompt 엔지니어링 백서(64p,PDF)을 보고 요약한 내용을 정리하였습니다. 이미 알고 있던 ReAct, Few-shot, Zero-shot 기법뿐아니라 전반적인 프롬프트엔지니어링 기법이 총망라되어있어 참고하면 좋을 듯합니다. 기본 기법 Zero-Shot prompting Few-Shot Prompting System, Context, Role Prompting 고급 기법Step-Back Prompting CoT(Chain of Thought) 셀프 컨시스턴시(Self Consistency) Tree of Thoughts(ToT) 리액트(ReAct) 프롬프팅 APE(Automatic Prompt .. 2025. 5. 16.
[gemma3모델 사용하기] 멀티모달 vs 텍스트 only Gemma3ForConditionalGeneration과 AutoProcessor를 > 멀티모달 사용(이미지 + 텍스트)을 염두에 둔 구성면 내가 위에서 보여준 코드는 텍스트 전용 모델 로딩은 AutoModelforCausalLM 사용 TIP. 만약 huggingface에서 접근 권한이 필요한 모델이라면 hugging face웹사이트에서 모델 접근신청 > 토큰 다운 > 로그인코드에 토큰 입력먼저 해줘야함(gemma 3 Model은 권한 신청 필요) 로그인 코드import huggingface_hubhuggingface_hub.login()# 위 코드 실행 후 나오는 창에 토큰 입력# MY_HF_TOKEN = "내 토큰"from huggingface_hub import loginlogin(token="내.. 2025. 4. 25.
[논문리뷰/NLP] ARAGOG: Advanced RAG Output Grading(2024) 1. TopicARAGOG: Advanced RAG Output Grading(2024) [LINK]단순한 RAG(Naive RAG) 성능의 한계를 극복하기 위해 다양한 'Advanced RAG' 기법들이 연구됨.그러나 너무나 많은 Advanced RAG 테크닉 중에 어떤 것이 효과적인지 파악하기 어려움ARAGOG: Advanced RAG Output Grading에서는 주요 Advanced RAG 기법들의 성능을 비교하여, RAG 기법 선택에 유용한 정보를 제공. 다양한 테크닉을 검색 정밀도와 답변 유사성으로 평가한 결과를 공개 연구 배경논문에서 다룬 문제와 배경을 간단히 소개 (1~2분)  ✔️ RAG 소개  RAG란?Indexing → Retrieval → Generation 단계를 통해 외부 지식.. 2025. 1. 26.
[Fintech TREND] 토스의 페이스결제 사례로 알아보는 '임베디드 금융'을 통한 실시간 결제 시스템의 발전 - '1초 만에 간편결제' 해당 컨텐츠는 아래 게시물들을 기반으로 작성되었습니다.1. 쿠팡페이, 당근페이... 이게 뭐지? '임베디드 금융'을 알아보자(2024,7,17) 2. 얼굴로 결제하는 시대, 준비되셨나요?(feat. 토스 페이스 페이) (2025.6.15)3. 얼굴이 지갑이 되는 시대: 토스의 페이스 페이 결제 시스템 분석(2025.3.13) 1. 임베디드 금융이란 무엇일까? ​임베디드 금융(Embedded Finance)은 은행, 카드사가 아닌 비금융 기업이 자신의 플랫폼 내에 금융 서비스를 탑재하는 것: 국내에선 네이버페이, 카카오페이, 토스페이, 쿠팡페이 등이 대표적인 임베디드 금융에 해당 카카오와 토스 뱅크의 경우, 제1금융권이지만 인터넷은행으로 분류되어 시중은행(우리은행 , 신한은행 등)과는 차이를 보인다.카카.. 2024. 11. 20.
[IT TREND] 'FMOps, LLM 시대의 AI 애플리케이션 개발 방법론 분석' (카카오엔터프라이즈 기술블로그 Tech&) https://tech.kakaoenterprise.com/196 를 보고 요약 및 생각 정리한 게시글입니다.검정 글씨 : 요약, 원문 / 파란 글씨 : 내 생각 FMOps란? MLOps에 이어 새롭게 등장하고 떠오르고 있는 기반 모델, 그중에서도 특히 LLM 기반의 앱 개발을 위한 방법론 ※ LLMOps가 아닌 FMOps라는 표현을 선택하여 사용하는 이유는? LLMOps는 자연어 처리 분야에만 국한되는 기반 모델을 칭하는 용어인 LLM이 포함된 반면 FMOps는 자연어 처리를 포함한 이미지, 음성 등 더욱 다양한 모달리티의 기반 모델들 (예: DALL-E) 을 포함하여 해당 용어를 사용하게 되었습니다. 하지만 현재 시장에서는 기반 모델 중에서도 LLM을 활용하여 앱을 개발하는 것에 관심이 몰려있기 .. 2024. 10. 21.
[논문리뷰/NLP] Adapting Large Language Models to Domains via Reading Comprehension 출처 : https://arxiv.org/abs/2309.09530  Adapting Large Language Models to Domains via Reading ComprehensionWe explore how continued pre-training on domain-specific corpora influences large language models, revealing that training on the raw corpora endows the model with domain knowledge, but drastically hurts its prompting ability for question answering. Takenarxiv.org  대규모 언어 모델의 도메인 적응이 논문의 제목은.. 2024. 9. 30.
[논문리뷰/CV] YOLO(You Only Look Once: Unified, Real-Time Object Detection) 객체 탐지 모델 YOLO You Only Look Once: Unified, Real-Time Object Detection 논문을 리뷰한 게시글 입니다 1. 소개 1.1 Two-Stage Detector vs One-Stage Detector regional proposal과 classification이 순차적으로 이루어짐. classification과 localization문제를 순차적으로 해결 E.G, R-CNN계열 (R-CNN, Fast R-CNN, Faster R-CNN, Mask R-CNN ...) regional proposal와 classification이 동시에 이루어짐 즉, classification과 localization문제를 동시에 해결하는 방법 E.G, YOLO 계열, SSD 계.. 2024. 4. 14.
[논문리뷰/CV] Faster R-CNN 모델 (R-CNN, Fast R-CNN과 비교) Computer Vision모델 중 Faster R-CNN 모델의 논문 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks를 리뷰한 게시글입니다. #FBF977 ✅Summary Intro Faster R-CNN은 고전적인 객체 탐지 시스템에서 속도의 병목 현상(Selective search알고리즘을 통해 regeion proposals를 추출하기 때문에 발생)을 해결하기 위해 개발된 객체 탐지 프레임워크이다. 이 방법은 이미지 내 객체의 위치를 가정하는 지역 제안(region proposal) 알고리즘의 계산 부담을 줄일 수 있었다. Faster R-CNN은 지역 제안 네트워크(Region Proposal Netwo.. 2024. 4. 4.
[논문리뷰] GPT-1 : Improving Language understanding by Generative pre-Training (2018년) GPT-1은 OpenAI에서 Improving Language understandingby Generative pre-Training (2018년) 논문에서 공개된 Transformer의 decorder만 활용한 자연어 모델입니다. 해당 글은 이 논문의 리뷰입니다. 논문 원문 : GPT-1 (https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf) 1 Introduction 1. 첫 번째 섹션 : 기존의 자연어 처리 방법, 그것들이 겪는 주요한 문제점들에 대해 논의 - 기존 모델들의 제한된 문맥 이해와 처리 능력, 그리고 복잡한 작업에 대한 어려움.. 2024. 3. 24.