이앤에스 글로벌

본문 바로가기


검색

    생성형 AI에서 RAG란 무엇일까?
  • 12-27 
  • TECH

    e8431b59f4a157c0471c2f9afdb7a3b0_1735283648_5834.png
     

    RAG는 LLM의 어떤 한계를 개선하는가?

    안녕하세요, 저번 시간에는 LLM에 관련해서 살펴보았는데요, 이번 시간에는 LLM의 단점을 보완하는 RAG에 대해서 설명드리려고 합니다. RAG(Retrieval-Augmented Generation)는 LLM의 단점인 '사실 관계 오류 가능성'과 '맥락 이해 한계'를 개선하기 위한 기술입니다. 이는 LLM에 외부 지식 베이스를 결합해 생성 능력과 사실 기반 응답의 신뢰성을 강화하는 방식을 사용합니다.



    RAG의 주요 개선점

    1. 외부 지식 활용

    - 대규모 구조화된 지식 베이스(예: Wikipedia)와 연결하여, 주어진 질문에 적합한 정보를 검색 및 추출합니다.


    2. 증거 기반 생성

    - 검색된 정보를 기반으로 보다 신뢰할 수 있는 답변을 생성하며, 답변의 출처를 명시해 신뢰도를 높입니다.


    3. 맥락 이해력 강화

    - 외부 정보를 활용해 질문의 배경 및 맥락을 파악하고, 단순히 패턴 매칭에 의존하지 않는 추론 기반 답변을 제공합니다.


    이와 같은 접근을 통해 RAG는 LLM의 언어 생성 능력을 유지하면서도, 외부 지식을 결합해 보다 정확하고 설명 가능한 답변을 제시합니다. 질의응답, 정보 검색, 팩트체크 등 다양한 응용 분야에서 이 기술이 활발히 연구되고 있습니다.



    RAG의 기본 개념과 작동 원리

    RAG는 LLM이 최신 정보나 특정 도메인 지식을 포함하기 어려운 한계를 보완하기 위해 고안되었습니다. '지식 검색'과 '언어 생성'을 결합해 질문에 필요한 정보를 외부에서 검색해 활용하는 것이 핵심입니다. 아래는 RAG의 주요 구성 요소입니다.


    1. 질의 인코더 (Query Encoder)

    - 질문을 이해하기 위해 텍스트를 벡터로 변환합니다.


    2. 지식 검색기 (Knowledge Retriever)

    - 질문에 기반해 외부 지식 베이스에서 관련 정보를 검색합니다.


    3. 지식 증강 생성기 (Knowledge-Augmented Generator)

    - 검색된 정보를 기반으로 보다 풍부하고 사실에 가까운 답변을 생성합니다.


    동작 과정

    1. 사용자가 질문을 입력하면, 질의 인코더가 이를 벡터 형태로 변환합니다.

    2. 지식 검색기가 외부 지식 베이스에서 관련 정보를 추출합니다.

    3. 추출된 정보는 생성 모델에 전달되어 답변으로 생성됩니다.


    이로써 RAG는 LLM의 강력한 생성 능력과 외부 지식의 활용을 결합하여 최신 정보 및 전문적 도메인 지식 기반의 답변을 생성할 수 있습니다.




    RAG가 필요한 경우

    1. 최신 정보 접근

    - LLM은 학습 이후 새롭게 등장한 정보(예: 최근 뉴스, 업데이트된 법률)에 접근할 수 없습니다.

    - RAG는 실시간 데이터베이스와 연동하여 최신 정보를 검색하고 이를 답변에 활용할 수 있습니다.


    2. 특정 도메인 지식

    예를 들어, 의료, 법률, 엔지니어링처럼 전문 지식이 필요한 영역에서는 LLM의 사전 학습 범위를 벗어난 질문에 답하기 어렵습니다.

    - RAG는 외부 지식베이스를 검색하여 도메인 특화된 정보로 답변을 보강합니다.


    3. 신뢰성과 근거 제공

    - LLM의 응답은 설득력은 있지만 근거가 없는 경우가 많습니다. 이는 비즈니스 및 학술적 응용에서 문제가 될 수 있습니다.

    - RAG는 출처를 명시하고, 검색된 정보로 신뢰성을 높일 수 있습니다.


    4. 효율적인 메모리 사용

    - 대규모 데이터를 모두 모델에 포함시키는 것은 비효율적입니다. RAG는 필요한 순간에만 데이터를 검색해 사용함으로써 모델 크기를 줄이고 계산 효율을 높일 수 있습니다.



    RAG 상용 서비스 사례

    현재 RAG 기술을 활용하는 대표적인 서비스는 다음과 같습니다.


    1. Microsoft Bing Search

    Bing에 RAG 기반 대화형 AI를 적용, 검색 질의에 맞는 웹 페이지 정보를 활용한 자연어 응답을 제공합니다.


    2. Anthropic’s Constitutional AI (CAI)

    대화 중 외부 지식을 활용하며, 답변의 출처를 명시해 신뢰도를 높인 시스템입니다.


    3. Perplexity AI

    검색된 정보를 투명하게 제공하며, 응답 생성에 활용합니다.



    한계와 과제

    RAG의 성능은 연결된 지식 베이스의 품질과 범위에 의존하므로, 고품질의 지식 데이터 구축이 필수적입니다. 또한 프라이버시 보호, 책임 문제 등 윤리적 과제를 함께 해결해야 안전하고 신뢰할 수 있는 기술로 자리잡을 수 있습니다.





개인정보취급방침닫기
본 ‘이앤에스글로벌’(이하 ‘회사’)는 고객님의 개인정보 보호를 매우 중요시하며, 회사에서 제공하는 서비스를 언제나 안심하고 사용할 수 있도록 최선을 다하고 있습니다. ‘개인정보 보호법 제 30조’에 따른 개인정보 처리방침을 통하여 귀하께서 제공하는 개인정보가 어떠한 용도 및 방식으로 이용되고 있으며, 개인정보 보호를 위해 어떠한 조치를 취하고 있는지 알려드립니다.

회사는 개인정보취급방침을 개정하는 경우 웹사이트 공지사항(또는 개별공지)을 통하여 공지할 것입니다.

제 1조 개인정보의 수집 항목 및 목적
회사에서는 사이버 신문고 서비스 제공을 위해 필요한 최소한의 개인정보를 수집합니다.
(1) 개인정보 수집 항목 : 성명, 이메일(e-mail) 주소
(2) 개인정보 수집 및 이용 목적 : 필요 시 제보 내용 추가 확인, 접수 확인 안내, 신고 포상 등 업무처리
(3) 개인정보 제공을 원하지 않을 경우 ‘익명’으로 제보할 수 있으나, 제보 접수 확인 및 신고포상 등 업무 처리에 제약이 있을 수 있습니다.

제 2조 개인정보 처리 및 보유기간
회사 내 사이버신문고를 통해 수집된 개인정보는 제보 건에 대한 종결처리가 완료된 후 1년간 보관하는 것을 원칙으로 하나, 신고포상 해당 건 등 별도의 보관이 필요한 경우는 예외로 합니다.

제 3조 개인정보 위탁 및 제3자 제공에 관한 사항
회사는 개인정보를 “개인정보의 수집 목적”에서 고지한 범위 내에서 이용하며, 정보주체의 사전 동의가 있는 경우 제보 처리를 위해 다음과 같이 관련 회사에 제공할 수 있습니다.

(1) 개인정보의 제3자 제공
① 제공받는 자 : 세방㈜, 세방전지㈜, 세방리튬배터리㈜, 세방익스프레스㈜, 세방메탈트레이딩㈜ [추가]
② 제공받는 개인정보 : 성명, 이메일(e-mail) 주소
③ 보유 및 이용기간 : 개인정보 처리 및 보유기간 내용과 같음

제 4조 정보주체의 권리·의무 및 그 행사방법에 관한 사항
(1) 정보주체는 사이버신문고에 대해 언제든지 다음 각 호의 개인정보 보호 관련 권리를 행사할 수 있습니다.
① 개인정보 열람요구
② 오류 등이 있을 경우 정정
③ 삭제요구
④ 처리정지 요구
(2) 제1항에 따른 권리 행사는 회사에 대해 서면, 전화, 이메일(e-mail), Fax 등을 통하여 하실 수 있으며 회사는 이에 대해 지체 없이 조치하겠습니다.
(3) 정보주체가 개인정보의 오류 등에 대한 정정 또는 삭제를 요구한 경우에는 회사는 정정 또는 삭제를 완료할 때까지 당해 개인정보를 이용하거나 제공하지 않습니다.
(4) 제1항에 따른 권리 행사는 정보주체의 법정대리인이나 위임을 받은 자 등 대리인을 통하여 하실 수 있습니다. 이 경우 개인정보 보호법 시행규칙 별지 제11호 서식에 따른 위임장을 제출하셔야 합니다.
(5) 정보주체는 개인정보 보호법 등 관계법령을 위반하여 회사가 처리하고 있는 정보주체 본인이나 타인의 개인정보 및 사생활을 침해하여서는 아니 됩니다.

제 5조 개인정보의 기술적·관리적 보호조치에 관한 사항
회사는 개인정보를 처리함에 있어 개인정보가 분실, 도난, 누출, 변조 또는 훼손되지 않도록 안전성 확보를 위하여 다음과 같은 기술적·관리적 대책을 강구하고 있습니다.
(1) 기술적 조치
제보자의 모든 개인정보는 암호화되어 저장 및 관리하고 있으며, 제보자의 개인정보가 유출되거나 훼손되는 것을 막기 위하여 최선을 다하고 있습니다. 또한, 안전한 암호 알고리즘을 이용하여 네트워크상 개인정보를 안전하게 전송하는 보안장치(SSL 등)를 적용하고 있습니다.
(2) 물리적 조치
침입차단시스템을 이용하여 외부로부터의 무단 접근을 통제하고 있으며, 기타 시스템적으로 안전성을 확보하기 위하여 필요한 기술적 장치를 갖추려고 노력하고 있습니다.
(3) 개인정보처리자의 최소화 운영 및 교육
회사의 개인정보 처리자는 업무 담당자에 한정하여 운영하고, 이를 위한 별도의 패스워드를 부여하고 있습니다. 또한 개인정보 보호의 인식 제고를 위하여 정기적인 교육을 수행하고 있습니다.

제 6조 개인정보 파기에 관한 사항
회사는 원칙적으로 보유기간 경과, 처리목적 달성 등 개인정보가 불필요하게 되었을 때에는 지체 없이 해당 개인정보를 파기합니다.
(1) 파기 절차
회사는 파기사유가 발생한 개인정보를 개인정보 보호책임자의 책임 하에 파기업무를 수행합니다.
(2) 파기 방법
회사에서 처리하는 개인정보파일은 전자적 파일 형태로 기록되기 때문에 재생할 수 없은 기술적 방법을 사용하여 파기합니다.

제 7조 개인정보처리방침 변경에 관한 사항
이 개인정보 처리방침은 2022년 11월 30일부터 적용합니다.

제 8조 개인정보 보호책임자에 관한 사항
회사는 개인정보를 보호하고 개인정보와 관련한 불만을 처리하기 위하여
아래와 같이 개인정보 보호 담당자를 지정하고 있습니다.

(1)개인정보보호 책임자
- 부서명: DT전략팀
- 성명 : 강광수
- 연락처 : (02) 3469-0429
(2)개인정보보호 담당자
- 부서명: DT전략팀
- 성명 : 강한별
- 연락처: (02)3469-0422