Skip to content

coldrain-f/langchain-document-loader-chatbot

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

33 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Overview

image

본 프로젝트는 LangChain 프레임워크와 OpenAI의 대규모 언어 모델(LLM)을 기반으로 한 검색 증강 생성(RAG) 시스템입니다. 사용자와의 자연스러운 대화를 통해 문서 기반 지식을 제공하는 대화형 인터페이스를 구현했습니다.

기술 스택

프론트엔드

  • Next.js와 TypeScript를 기반으로 구축
  • Shadcn-ui를 활용한 모던한 사용자 인터페이스

백엔드

  • Python과 FastAPI를 활용한 REST API
  • LangChain을 통한 강력한 자연어 처리 파이프라인

시스템 아키텍처

시스템은 크게 두 가지 핵심 프로세스로 구성됩니다:

  1. 데이터 전처리

    • PDF 문서 로드
    • PDF 문서를 페이지 별 이미지 파일로 변환 후 저장
    • 효율적인 처리를 위한 문서 청크 분할
    • OpenAI 임베딩 모델을 통한 벡터 변환
    • FAISS 벡터 저장소를 활용한 검색 인덱스 구축
  2. 대화형 질의응답 시스템

    • 사용자 질의에 대한 컨텍스트 기반 검색
    • LLM을 활용한 자연스러운 응답 생성
    • 마크다운 형식의 구조화된 문서 요약 제공
    • 참고한 컨텍스트 기반 PDF 이미지 제공

이 프로젝트는 최신 RAG 아키텍처를 실제 애플리케이션에 적용한 사례로, 범용 언어 모델의 강점과 도메인별 문서 지식을 효과적으로 결합하는 방법을 보여줍니다.

RAG 프로세스

데이터 전처리(Data Preprocessing)

image

About

React, Python으로 개발한 심플 LLM RAG 시스템

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published