본문 바로가기

Data Science

(42)
[논문리뷰/NLP] ARAGOG: Advanced RAG Output Grading(2024) 1. TopicARAGOG: Advanced RAG Output Grading(2024) [LINK]단순한 RAG(Naive RAG) 성능의 한계를 극복하기 위해 다양한 'Advanced RAG' 기법들이 연구됨.그러나 너무나 많은 Advanced RAG 테크닉 중에 어떤 것이 효과적인지 파악하기 어려움ARAGOG: Advanced RAG Output Grading에서는 주요 Advanced RAG 기법들의 성능을 비교하여, RAG 기법 선택에 유용한 정보를 제공. 다양한 테크닉을 검색 정밀도와 답변 유사성으로 평가한 결과를 공개 연구 배경논문에서 다룬 문제와 배경을 간단히 소개 (1~2분)  ✔️ RAG 소개  RAG란?Indexing → Retrieval → Generation 단계를 통해 외부 지식..
[Fintech Trend]1초만에 간편결제, 임베디드 금융이란 무엇인가? 출처 : 쿠팡페이, 당근페이... 이게 뭐지? '임베디드 금융'을 알아보자(2024,7,17) https://steppay.kr/blog/embedded-finance해당 게시글은 위 내용을 기반으로 정리한 내용입니다(거의 동일)   ​임베디드 금융(Embedded Finance)은 은행, 카드사가 아닌 비금융 기업이 자신의 플랫폼 내에 금융 서비스를 탑재하는 것: 국내에선 네이버페이, 카카오페이, 토스페이, 쿠팡페이 등이 대표적인 임베디드 금융에 해당 카카오와 토스 뱅크의 경우, 제1금융권이지만 인터넷은행으로 분류되어 시중은행(우리은행 , 신한은행 등)과는 차이를 보인다.카카오페이와 토스페이는 카카오뱅크, 토크 뱅크 와는 관계없이 앱의 간편결제 서비스로 임베디드 금융이다.페이코도 임베디드 금융이며 쿠팡..
[IT TREND] 'FMOps, LLM 시대의 AI 앱 개발 방법' https://tech.kakaoenterprise.com/196 를 보고 요약 및 생각 정리한 게시글입니다.검정 글씨 : 요약, 원문 / 파란 글씨 : 내 생각   FMOps란? MLOps에 이어 새롭게 등장하고 떠오르고 있는 기반 모델, 그중에서도 특히 LLM 기반의 앱 개발을 위한 방법론 ※ LLMOps가 아닌 FMOps라는 표현을 선택하여 사용하는 이유는? LLMOps는 자연어 처리 분야에만 국한되는 기반 모델을 칭하는 용어인 LLM이 포함된 반면 FMOps는 자연어 처리를 포함한 이미지, 음성 등 더욱 다양한 모달리티의 기반 모델들 (예: DALL-E) 을 포함하여 해당 용어를 사용하게 되었습니다. 하지만 현재 시장에서는 기반 모델 중에서도 LLM을 활용하여 앱을 개발하는 것에 관심이 몰려있기 ..
[논문리뷰/NLP] Adapting Large Language Models to Domains via Reading Comprehension 출처 : https://arxiv.org/abs/2309.09530  Adapting Large Language Models to Domains via Reading ComprehensionWe explore how continued pre-training on domain-specific corpora influences large language models, revealing that training on the raw corpora endows the model with domain knowledge, but drastically hurts its prompting ability for question answering. Takenarxiv.org  대규모 언어 모델의 도메인 적응이 논문의 제목은..
[논문리뷰/CV] YOLO(You Only Look Once: Unified, Real-Time Object Detection) 객체 탐지 모델 YOLO You Only Look Once: Unified, Real-Time Object Detection 논문을 리뷰한 게시글 입니다 1. 소개 1.1 Two-Stage Detector vs One-Stage Detector regional proposal과 classification이 순차적으로 이루어짐. classification과 localization문제를 순차적으로 해결 E.G, R-CNN계열 (R-CNN, Fast R-CNN, Faster R-CNN, Mask R-CNN ...) regional proposal와 classification이 동시에 이루어짐 즉, classification과 localization문제를 동시에 해결하는 방법 E.G, YOLO 계열, SSD 계..
[논문리뷰/CV] Faster R-CNN 모델 (R-CNN, Fast R-CNN과 비교) Computer Vision모델 중 Faster R-CNN 모델의 논문 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks를 리뷰한 게시글입니다. #FBF977 ✅Summary Intro Faster R-CNN은 고전적인 객체 탐지 시스템에서 속도의 병목 현상(Selective search알고리즘을 통해 regeion proposals를 추출하기 때문에 발생)을 해결하기 위해 개발된 객체 탐지 프레임워크이다. 이 방법은 이미지 내 객체의 위치를 가정하는 지역 제안(region proposal) 알고리즘의 계산 부담을 줄일 수 있었다. Faster R-CNN은 지역 제안 네트워크(Region Proposal Netwo..
[A/B test] Ch6. 조직 운영을 위한 지표 | 목표지표, 동인 지표, 가드레일 지표 intro 조직은 좋은 지표를 가져야 한다 → 설명 책임을 측정 OKR( Objective , Key, Results 목표, 핵심, 결과 ) Objective : 장기 목표 Results : 목표를 향한 단기적이고 측정 가능한 결과 목표를 향한 진보를 추적하기 위한 좋은 지표가 필요하다 (기준, 작성 및 평가 방법) 지표의 분류 조직 지표 전체에 초점을 맞춰 논의 ( 7장 , 실험에 대한 특정 지표 논의 , 21장 실험에 경보를 주는 가드레일 지표 ) 조직지표는 목표지표, 동인지료, 가드레일 지표가 있음 1. 목표 지표goal metrics = 성공지표, 북극 지표 목표 지표 : 추구하는 궁극적 성공을 포착하는 단일 or 작은 지표 집합 (조직이 궁극적으로 무엇을 신경쓰는지를 보여주는것) 각 이니셔티브가..
[논문리뷰] GPT-1 : Improving Language understanding by Generative pre-Training (2018년) GPT-1은 OpenAI에서 Improving Language understandingby Generative pre-Training (2018년) 논문에서 공개된 Transformer의 decorder만 활용한 자연어 모델입니다. 해당 글은 이 논문의 리뷰입니다. 논문 원문 : GPT-1 (https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf) 1 Introduction 1. 첫 번째 섹션 : 기존의 자연어 처리 방법, 그것들이 겪는 주요한 문제점들에 대해 논의 - 기존 모델들의 제한된 문맥 이해와 처리 능력, 그리고 복잡한 작업에 대한 어려움..