본인은 대학원에서 LLM 및 RAG를 연구중인 대학원생이다. 산업계에서는 RAG를 다양한 라이브러리와 함께 응용하는 engineering의 느낌이 강하겠지만, 평소 본인은 RAG를 research 레벨로 접한터라, RAG를 langchain 같은 라이브러리를 사용하여 구현하지는 못했다. (연구나 실험 단계에선 langchain을 사용하기보단, pytorch로 밑바닥부터 구현하기 때문이다.)
그러던 중 RAG 관련한 여러 유튜브 영상을 보다보니, RAG를 응용하여 서비스를 개발하는 것에도 관심을 갖게 되었고, 이 책을 접했다.
이 책은 langchain을 메인으로 사용하여 RAG 서비스를 개발하는 법을 소개하는 책이다. langchain 이외에도 간단한 AI 기반 웹 서비스 제작을 돕는 streamlit, Python에서 PDF 문서를 불러올 수 있는 pypdf 등, 그때그때마다 필요한 라이브러리들을 소개하고 사용한다. RAG의 구성 요소 중 하나인 벡터 데이터베이스로는 FAISS와 chroma를 사용한 예제를 모두 포함하고 있다.
이 책의 가장 큰 장점을 두가지 꼽아본다면, 첫번째는 AI나 Python 개발에 대한 지식이 전혀 없어도 실습이 가능하다는 점이다. 처음 개발을 하다보면, 개발환경 설치 때문에 초보자들이 포기하길 마련인데, 이 책에서는 LLM/RAG에 대한 기초 개념와 개발환경 설치도 세세하게 설명되어 있기 때문에 초보자들도 잘 따라올 수 있다. 두번째 장점은 8 종류의 서비스를 만드는 법을 설명하고, 코드를 GitHub에 제공한다는 것이다. (GitHub: 링크)
굳이 단점을 꼽아보자면, RAG 실습 중 언어모델 부분은 모두 OpenAI의 GPT API를 통해 진행된다. 학생이나 입문자들은 GPT API 비용에 돈을 사용하는 것이 부담이 될 수 있을 듯 하다. 이런 경우에는 GPT 대신 HuggingFace에서 제공하는 오픈소스 LLM을 사용하면 좋을 듯 하다. (Llama-3, Gemma 등) 다만, 책 본문에서도 HuggingFace 기본 환경 설정을 하는 법과 임베딩 모델을 불러와 사용하는 예제가 있기 때문에, 입문자들도 어렵지 않게 혼자 응용할 수 있을 것이다.
실습 코드 Repository:
https://github.com/gilbutITbook/080413
도서 링크:
"본 리뷰는 한빛미디어 <나는 리뷰어다> 활동을 통해 책을 제공받아 작성된 서평입니다."
'Etc. > Books' 카테고리의 다른 글
[책 리뷰] 심리계좌 - 돈에 대한 여러 착각들 (0) | 2022.12.31 |
---|---|
[책 리뷰] 인공지능 100점을 위한 파이썬 수학 (임성국 지음) (0) | 2022.11.18 |
[책 리뷰] 텐서플로2와 머신러닝으로 시작하는 자연어 처리 (0) | 2022.10.18 |
[책 리뷰] MySQL로 배우는 데이터베이스 개론과 실습 (박우창, 남송휘, 이현룡 지음) (0) | 2022.09.05 |
[책 리뷰] 할 수 있다! 코딩 (Rob Percival 지음) (0) | 2022.08.13 |