본문 바로가기

Data Science/📝 논문리뷰

(8)
[논문리뷰/NLP] ARAGOG: Advanced RAG Output Grading(2024) 1. TopicARAGOG: Advanced RAG Output Grading(2024) [LINK]단순한 RAG(Naive RAG) 성능의 한계를 극복하기 위해 다양한 'Advanced RAG' 기법들이 연구됨.그러나 너무나 많은 Advanced RAG 테크닉 중에 어떤 것이 효과적인지 파악하기 어려움ARAGOG: Advanced RAG Output Grading에서는 주요 Advanced RAG 기법들의 성능을 비교하여, RAG 기법 선택에 유용한 정보를 제공. 다양한 테크닉을 검색 정밀도와 답변 유사성으로 평가한 결과를 공개 연구 배경논문에서 다룬 문제와 배경을 간단히 소개 (1~2분)  ✔️ RAG 소개  RAG란?Indexing → Retrieval → Generation 단계를 통해 외부 지식..
[Fintech Trend]1초만에 간편결제, 임베디드 금융이란 무엇인가? 출처 : 쿠팡페이, 당근페이... 이게 뭐지? '임베디드 금융'을 알아보자(2024,7,17) https://steppay.kr/blog/embedded-finance해당 게시글은 위 내용을 기반으로 정리한 내용입니다(거의 동일)   ​임베디드 금융(Embedded Finance)은 은행, 카드사가 아닌 비금융 기업이 자신의 플랫폼 내에 금융 서비스를 탑재하는 것: 국내에선 네이버페이, 카카오페이, 토스페이, 쿠팡페이 등이 대표적인 임베디드 금융에 해당 카카오와 토스 뱅크의 경우, 제1금융권이지만 인터넷은행으로 분류되어 시중은행(우리은행 , 신한은행 등)과는 차이를 보인다.카카오페이와 토스페이는 카카오뱅크, 토크 뱅크 와는 관계없이 앱의 간편결제 서비스로 임베디드 금융이다.페이코도 임베디드 금융이며 쿠팡..
[IT TREND] 'FMOps, LLM 시대의 AI 앱 개발 방법' https://tech.kakaoenterprise.com/196 를 보고 요약 및 생각 정리한 게시글입니다.검정 글씨 : 요약, 원문 / 파란 글씨 : 내 생각   FMOps란? MLOps에 이어 새롭게 등장하고 떠오르고 있는 기반 모델, 그중에서도 특히 LLM 기반의 앱 개발을 위한 방법론 ※ LLMOps가 아닌 FMOps라는 표현을 선택하여 사용하는 이유는? LLMOps는 자연어 처리 분야에만 국한되는 기반 모델을 칭하는 용어인 LLM이 포함된 반면 FMOps는 자연어 처리를 포함한 이미지, 음성 등 더욱 다양한 모달리티의 기반 모델들 (예: DALL-E) 을 포함하여 해당 용어를 사용하게 되었습니다. 하지만 현재 시장에서는 기반 모델 중에서도 LLM을 활용하여 앱을 개발하는 것에 관심이 몰려있기 ..
[논문리뷰/NLP] Adapting Large Language Models to Domains via Reading Comprehension 출처 : https://arxiv.org/abs/2309.09530  Adapting Large Language Models to Domains via Reading ComprehensionWe explore how continued pre-training on domain-specific corpora influences large language models, revealing that training on the raw corpora endows the model with domain knowledge, but drastically hurts its prompting ability for question answering. Takenarxiv.org  대규모 언어 모델의 도메인 적응이 논문의 제목은..
[논문리뷰/CV] YOLO(You Only Look Once: Unified, Real-Time Object Detection) 객체 탐지 모델 YOLO You Only Look Once: Unified, Real-Time Object Detection 논문을 리뷰한 게시글 입니다 1. 소개 1.1 Two-Stage Detector vs One-Stage Detector regional proposal과 classification이 순차적으로 이루어짐. classification과 localization문제를 순차적으로 해결 E.G, R-CNN계열 (R-CNN, Fast R-CNN, Faster R-CNN, Mask R-CNN ...) regional proposal와 classification이 동시에 이루어짐 즉, classification과 localization문제를 동시에 해결하는 방법 E.G, YOLO 계열, SSD 계..
[논문리뷰/CV] Faster R-CNN 모델 (R-CNN, Fast R-CNN과 비교) Computer Vision모델 중 Faster R-CNN 모델의 논문 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks를 리뷰한 게시글입니다. #FBF977 ✅Summary Intro Faster R-CNN은 고전적인 객체 탐지 시스템에서 속도의 병목 현상(Selective search알고리즘을 통해 regeion proposals를 추출하기 때문에 발생)을 해결하기 위해 개발된 객체 탐지 프레임워크이다. 이 방법은 이미지 내 객체의 위치를 가정하는 지역 제안(region proposal) 알고리즘의 계산 부담을 줄일 수 있었다. Faster R-CNN은 지역 제안 네트워크(Region Proposal Netwo..
[논문리뷰] GPT-1 : Improving Language understanding by Generative pre-Training (2018년) GPT-1은 OpenAI에서 Improving Language understandingby Generative pre-Training (2018년) 논문에서 공개된 Transformer의 decorder만 활용한 자연어 모델입니다. 해당 글은 이 논문의 리뷰입니다. 논문 원문 : GPT-1 (https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf) 1 Introduction 1. 첫 번째 섹션 : 기존의 자연어 처리 방법, 그것들이 겪는 주요한 문제점들에 대해 논의 - 기존 모델들의 제한된 문맥 이해와 처리 능력, 그리고 복잡한 작업에 대한 어려움..
[논문 리뷰] Sequence to Sequence Learning with Neural Networks(Seq2Seq) (2014) NLP논문 Sequence to Sequence Learning with Neural Networks 논문을 읽고 정리한 내용입니다 1. Introduction 심층 신경망(DNNs)은 음성 인식 및 시각 객체 인식과 같은 어려운 문제에 대한 탁월한 성능을 달성하는 매우 강력한 기계 학습 모델 적은 수의 단계로 임의의 병렬 계산을 수행 예) 2개의 2차 크기의 숨겨진 레이어만 사용하여 N개의 N비트 숫자를 정렬할 수 있는 능력 신경망은 기존의 통계 모델과 관련이 있지만 복잡한 계산을 학습 벨이 지정된 교육 세트가 네트워크의 매개 변수를 명시하는 데 충분한 정보를 가지고 있을 때 큰 DNNs는 지도된 역전파를 사용하여 훈련 문제 : DNNs는 입력 및 대상이 고정 차원의 벡터로 합리적으로 인코딩 될 수있는..