AI

LLM 정리

Astero 2025. 2. 20. 21:35
728x90

LLM이란 Large Language Model의 약자로 대규모 데이터로 사전 학습된 초대형 딥러닝 모델을 의미합니다.

 

  • Large의 두가지 의미
    • 대규모 데이터셋을 사용
    • 매우 큰 파라미터 수
  • 다양한 작업을 수행하며 일반적으로 대부분 잘 답변하는 모델

 

LLM 챗봇?

  • LLM  기술을 기반으로 만들어진 대화형 인공지능 시스템 (ChatGPT)

LLM 챗봇 설계 시 고려사항

  • 이해관계자들에 대한 정의 (End User, 이해관계자)
    • End User (최종 사용자)
      • 실제로 서비스를 이용하는 사용자
    • Stakeholder(이해 관계자)
      • 프로젝트 또는 서비스에 직/간접적으로 영향을 받는 모든 사람
      • EX, CEO, 기획자, 개발자 등이 포함될 수 있음
    • 프로젝트의 End User와 이해관계자는 다를 수 있음
      • 즉 최종 사용자가 반드시 프로젝트의 주요 이해관계자일 필요는 없으며, 프로젝트의 목표와 성격에 따라 이해관계자의 범위가 달라질 수 있음
  • 서비스 유형에 따른 고려사항
    • 사내용 vs 고객용 서비스 (B2B/B2C)
    • 사내용 서비스:
      • 이해관계자 간 기능 조정 가능
      • Error / Bug 허용 가능성 높음
    • 고객용 서비스 : 
      • B2B/B2C 여부 고려
      • B2B (기업 대상 서비스)
        • 실제 고객도 이해관계자로 포함될 수 있음
      • B2C (일반 소비자 대상 서비스)
        • 실시간 대응 필요 (속도 중요)
      • 철저한 테스트 필요 (고객 요구 불확실성)

 

  • 프로젝트 성공 기준 (Metric / KPI ) 와 시나리오별 고려
    • 성공 기준 & 리스크 관리
    • 오픈 or 성공 기준 (Metrics 정의 필요!)
    • 최악의 시나리오: 실패 방지 위한 전략 필요
    • 고려할 사항:
      • 충족시켜야 할 정보는?
      • 생겨선 안 되는 최악의 상황은?
      • 이를 막기 위한 Metric & Test Case 설계

 

  • Use Case 및 Test Case 설계
    • Use Case 정의
      • 서비스가 어떻게 사용될 것인가?
    • Test Case 설계
      • 사내용 서비스 -> 이해 관계자와 협의하여 버그 허용 범위 설정
      • 고객용 서비스 -> 예상할 수 없는 상황 대비 (QA 강화)

 

  • 이해관계자들과의 커뮤니케이션 전략
    • 고객/이해관계자는 원하는 것을 명확히 알지 못할 수도 있다.
    • 핵심은?
      • 질문을 통해 요구사항 도출
      • 말, 글, 그림 & 아키텍처 다이어그램 활용
    • 회의 시 일정 관리:
      • 명확한 Agenda 설정 필수

 

  • Prompt Engineering
    • 원하는 응답을 유도하기 위해 prompt (모델 명령문 / 지시문) 를 정교하게 설계하는 기술
    • 모델 자체를 변경하지 않고 prompt를 통한 문제 해결을 의도함
      • P : 너는 훌룡한 영어 선생님이야 내가 말한 질문에 대해서 영어로 잘못된 정보가 있으면 고쳐줘
      • Q : She go to school every day -> A : She goes to school every day
  • RAG ( Retrieval-Augmented Generation)
    • 검색 기반 응답 생성 모델
    • LLM이 사용자의 질문과 관련된 정보를 검색(Retrieval)하여 응답을 생성
    • 답을 하기 위해 필요한 참조 정보를 (context) 결합하여 답을 하는 방식
      • P : 당신은 친절하고 전문적인 고객 지원 담당자입니다.
      • Q : 딸기 배송 상태를 확인하고 싶어
      • C : 딸기 배송 상태 : 도착 예정 : 2일 후
      • A : 고객님의 주문은 현재 배송 중이며, 약 2일 내에 도착할 예정입니다.
  • Chain / Agent / Multi-Agent
    • Chain (체인 구조)
      • 여러 개의 단계적인 처리를 연결하여 응답 생성
      • 고객 문의 응답 시스템 ( ex. 질문 분석 -> 문서 검색 -> 정보 요약 -> 응답 생성)
    • Agent (에이전트 기반)
      • 다양한 기능을 수행하는 개별 AI 에이전트를 활용
      • 스마트 홈 시스템 (ex. 음성 인식 agent, 자연어 처리 agent, 제어/모니터링 agent - 개별 동작)
    • Multi-Agent (멀티 에이전트 구조)
      • 여러 개의 AI 에이전트가 협력하여 고도화된 응답을 생성
      • 자율 주행 시스템 (ex. 인지 & 판단 & 제어 & 통신 agent 협력)

 

  • 아키텍쳐 Best Practice
    • 디자인 패턴 / 베스트 프랙티스
      • 이미 알려진 사례 ( 타 회사, 오픈 소스 등) 참고
      • 논문, 책 등 다양한 자료 활용 가능
    • 사례 조사
      • 공개적으로 발표된 아키텍처 ( 예 : OpenAI, Hugging Face 사례 등)
      • 자체 구현(Private) 사례

 

  • LLM 종류 (Private & Public)
    • Private 모델 (ex. OpenAI-gpt4)
      • 장점 : 빠른 적용 (API), 업데이트 용이
      • 단점 : 비용 (토큰 사용량)
    • Public 모델 (ex. Meta - Llama 개열)
      • 장점 : 커스텀 가능
      • 단점 : 데이터 보안 이슈, 유지 비용, 인프라 필요

 

  • Embedding vs Generation ( LLM 활용 범위 )
    • Embedding 모델 기준
      • Context 길이 제한
      • 비용 (Private/Public)
      • Multi-modal 지원 여부
    • 답변 Generation 모델
      • 비용, 시간, context size
      • GPU 리소스, API 유무, 라이선스 제한
      • Human alignment, 데이터 보안

 

  • 데이터 & API 고려사항
    • API 및 Data 확보
      • 이미 데이터가 존재하는지, 혹은 신규로 구축해야 하는지
      • Real-time API / Async / Batch / Serverless 형태 고려
    • 데이터가 없다면?
      • Prompt Engineering 위주 접근
    • 데이터가 있다면?
      • Data Engineer, DBA, DevOps/MLOps 와 협업
      • DB 구조, CDC(변경 데이터 캡처) 필요성

 

  • 스토리지(DB) & Vector Store
    • File / DB 구조
      • csv, json, pickle 등 파일 형태
      • local DB (sqlite, duckdb 등)
    • Vector Store
      • OpenSearch, ChromaDB, Milvus 등
    • 개인 이력 관리
      • 로컬 분석용 "Sercverless db" (duckdb, sqlite)

 

  • Batch vs 실시간 처리
    • 배치성 처리
      • 정기적으로 대량 데이터 업데이트
      • ETL 툴 활용 (polars, pandas, numpy, pyspark, scala 등)
    • 실시간 처리
      • 신규 데이터 즉시 반영
      • kafka, etc.

 

  • LLMOps & 운영 전략
    • Prompt 이력 관리
      • 어떤 Prompt 가 효과적이었는지 버전 관리
    • LLMOps 관련 기술
      • LangChain, Ollama, Lansmith, Langfuse 등
    • 가드레일(Guardrails)
      • Human Alignment
      • 유해 발언, 차별적 내용 필터

 

LLM 챗봇 설계시 고려 사항

 

  • 주요 포인트
    • 다양한 이해관계자 정의 및 커뮤니케이션
    • 서비스 유형 (사내용 vs 고객용) 별 고려사항
    • 프로젝트 성공 기준 (Metrics), 시나리오별 리스크 관리
    • Prompt Engineering & RAG 등 주요 기법
    • Chain / Agent / Multi-Agent 구조
    • 아키텍처 및 모델 (Private vs Pulic) 선택 전략
    • Embedding vs Generation 모델 분류
    • 데이터 / 스토리지 전략 & LLMOps 운영 방안
    • 개인 정보 및 보안 이슈
  • 다음 단계
    • 우선순위 결정 : 프로젝트의 목표와 규모에 맞춰 가장 중요한 사항부터 적용
    • 프로토타입/PoC 수행 : 작은 범위에서 시범 적용 후 개선점 도출
    • 확장 계획 수립 : 데이터, 인프라, 보안 정책을 종합적으로 확장
    • 지속적 모니터링 : LLMOps 기반으로 Prompt 이력, 성능, 보안 업데이트
728x90