본인은 대학원에서 LLM 및 RAG를 연구중인 대학원생이다. 산업계에서는 RAG를 다양한 라이브러리와 함께 응용하는 engineering의 느낌이 강하겠지만, 평소 본인은 RAG를 research 레벨로 접한터라, RAG를 langchain 같은 라이브러리를 사용하여 구현하지는 못했다. (연구나 실험 단계에선 langchain을 사용하기보단, pytorch로 밑바닥부터 구현하기 때문이다.) 그러던 중 RAG 관련한 여러 유튜브 영상을 보다보니, RAG를 응용하여 서비스를 개발하는 것에도 관심을 갖게 되었고, 이 책을 접했다. 이 책은 langchain을 메인으로 사용하여 RAG 서비스를 개발하는 법을 소개하는 책이다. langchain 이외에도 간단한 AI 기반 웹 서비스 제작을 돕는 streamlit..
Etc.
2023년의 회고 (부제1 : 회고 이렇게 쓰면 되나요? 부제2 : 1년짜리 일기) 2022년 회고는 틀에 맞춰 작성했었는데, 이번에는 그냥 기억에 남는 것들만 마음대로 작성해보려고 한다. 1. 응애 나 아기 4학년 1-1) PyTorch 옹알이 23년 초 겨울방학에 김성훈 교수님의 PyTorch 강의를 들으며, 처음으로 PyTorch를 익혔다. 그 전까진 Tensorflow만 사용했었는데, 왜 연구자들이 PyTorch를 선호하는지 느낄 수 있었다. (이제는 Tensorflow보다 PyTorch를 더 익숙해진 몸이 되어버렸는데, 최근에는 PyTorch Lightning을 배워야겠다는 생각이 든다.) 1-2) NLP 논문 리뷰 마찬가지로 23년 초 겨울방학에는 교내 연구실에서 자연어처리 관련 기초 논문들을..
어느 교수님의 연구실로 진학해야 할까요? 이번 글에서는 대학원 연구실을 선정하는 방법에 대해 소개한다. 목차 0. 연구분야 선정 1. 학교 선정 2. 연구분야와 관련된 과 선정 (대학원 모집 기준) 3. 연구실 후보 선정 4. 연구실 홈페이지 둘러보며 후보 좁히기 5. 후보 간 마음 속 순서 정하기 6. 컨택 메일 보내기 0. 연구분야 선정 (ex1> 인공지능, 자연어처리) (ex2> 의료 소프트웨어, 의료 인공지능) 1. 학교 선정 (ex1, ex2> 고려대학교) 2. 연구분야와 관련된 과 선정 (대학원 모집 기준) (ex1> 정보대학 인공지능학과, 정보대학 컴퓨터학과 인공지능응용전공, 공과대학 산업경영공 산업인공지능전공, 정경대학 통계학과 Applied Data Analytics 전공 등) (ex2>..
대학원을 준비하면서 궁금했던 것들이 많아서 인터넷으로 정보들을 많이 찾아봤었는데, 이제는 내가 직접 글로 남겨보려고 한다. 누군가에겐 당연한 내용일 수 있지만, 그래도 귀중한 경험들이니만큼 주변인들에게 공유하고 싶었다. 그리고 각 섹션마다 관련된 꿀팁들을 꾹꾹 눌러담았다. 다만, 아래 내용들은 필자의 경험과 주변인들의 경험을 토대로 작성된 것이며, 아래 내용들은 절대 정답이 아니다. 다른 케이스들도 분명히 있을 것이라는 것을 유의하고 봐주었으면 한다. 목차0. 본인 소개1. [컨택 시기] 언제 컨택하는게 좋나요?2. [컨택 메일 및 공인영어] 컨택 메일 어떻게 쓰나요?, 컨택할 때 영어 성적 중요한가요?3. [컨택 없이 지원] 연구실 별이 아닌 학부 단위로 선발하는 대학원도 있나요? 컨택 안하면 비인..
1. 대학교 학부 공부 🏫 2022년에는 요런 과목들을 수강하였다. (교양과목 제외) 2022년 1학기 확률변수론 시스템 프로그래밍 알고리즘 설계 2022년 2학기 오퍼레이팅 시스템 컴퓨터 네트워크 데이터베이스 설계 정보보호론 신호 및 시스템 공업수학 2 1학기에는 교양과목을 포함하여 16학점을 수강하였지만, 2학기에는 풀전공에 가까운 19학점을 수강했다. 그러다보니 2학기에는 수업을 들으며 다른 활동들을 하는게 조금 벅찼던 것 같다. 하지만, 2학기에는 전공 과목들을 많이 수강하면서 부족한 CS 지식들을 메꿀 수 있었다. 또한, 1학기 때는 전부 비대면 수업이었지만, 2학기에는 대면 수업으로 전환되면서, 등교를 자주 했다. 덕분에 공부량이 늘고, 공부습관이 잡힌 듯 하다. 2022년에는 학교에서 수강한..
지금 글을 쓰는 2023년을 기준으로, 작년 이맘때쯤 (3학년 2학기) "2022 카카오 채용연계형 겨울 Tech 인턴십"에 지원했었다. 직무는 자연어처리 경험을 잘 살릴 수 있는 "광고추천팀 Machine Learning"으로 지원했었다. 일정은 아래와 같았다. (대외활동 이외의 커리어 측면에서) 내 생애 처음으로 이력서와 자기소개서를 작성하여 회사에 지원을 해봤던 경험이다. 처음이라 최대한 완벽하게 준비하려고 노력했었고, 많은 주변인들에게 자기소개서 검토도 부탁했었다. 서류 전형 지원서는 크게 프로젝트 수행이력, 자기소개, 기타(경력사항, 포트폴리오, 학력 정보)로 나눌 수 있었다. 프로젝트 수행이력 각 프로젝트마다 '주 사용 기술'을 적고, 1400자 정도의 '프로젝트 수행 역할'을 기술하는 식이다..
프로그래밍 소모임 내 단톡방에서 "2022 SK텔레콤 T-WorX for Developers 챌린지" 공고를 보고 지원했다. 자기소개서 작성 없이, 바로 코딩 테스트를 응시할 수 있는 프로세스가 특징이었다. 2022 SK텔레콤 T-WorX for Developers 챌린지 career.programmers.co.kr 프로세스 특징 상 코테 실력이 가장 중요할 것이라고 생각을 했지만, 정작 3학년 1학기의 나는 코딩 테스트를 준비한 적이 하나도 없었다. 붙을 것이라는 기대보단, "코딩 테스트가 어떤건지 한번 경험해보자"라는 마음으로 나를 실전에 던졌다. 의미가 있을지는 모르겠지만, "ML(머신러닝)/DS(데이터 사이언티스트)" 직무에 지원했었다. 그리고 당연하게도 결과는 불합격이었다. 당연한 결과였고, 코..
"JUNCTION ASIA 2022"은 유럽 최대 해커톤 'JUNCTION'의 아시아 버전이며, 'JUNCTION'은 "대학생 중심 기술 해커톤으로서 혁신적 아이디어를 가진 글로벌 대학생들과 청(소)년 인재들이 한자리에 모여 아이디어를 공유하고 발전시켜 세상에 없는 새로운 신기술을 도출해나가는 장"이라고 한다. 개발자로서, 공부하며 기른 실력으로 해커톤에 참가하고 싶다는 막연한 로망이 있었다. 하지만 팀에 도움이 될까 망설이기도 했고, 지난 2년간 코로나-19로 행사들이 줄줄이 축소·취소되면서 해커톤에 대한 꿈을 잠시 접어두었었다. 그러던 중, "JUNCTION ASIA 2022"이 부산에서 열린다는 것을 알게 되었고, 이번에는 기회를 놓치지 않고자 지원했었다. 여름에 부산을 가보고 싶었던 것도 큰 이유..
네이버 소프트웨어야놀자 대학생 멘토 프로그램은 "대학생들이 직접 멘토가 되어, 지역의 초/중학생에게 SW 지식을 나누는 교육 봉사 프로그램"이다. 소프트웨어 : 소프트웨어야 놀자 소프트웨어의 기초부터 응용까지, 누구나 시작할 수 있습니다. www.playsw.or.kr 해당 프로그램을 알게 되고, 교내 마음이 맞는 사람들끼리 모여 회의를 하고, 지원서와 수업 계획서를 작성하여 제출하였다. 나도 코딩 학원에서 엔트리로 아이들을 가르친 경험이 있었고, 비슷한 경험을 가진 다른 팀원들도 많았기에 당연히 합격하게 될 줄 알았는데, 불합격 통보를 받고 아쉬웠다. 하지만 지원서를 준비하면서 만나게 된 팀원들이 비슷한 분야에 관심이 있는 사람들이다보니, 빠르게 친해질 수 있었다. 그 중에 두 명은 교내의 다른 동아리..
최근 코스피가 3000을 돌파하며, 주식 열풍이 불고 있다. 본인은 주식을 남들따라 하지 않겠노라 몇 년 전에 다짐하였다. 하지만 언제까지 손놓고만 볼 수 없지 않겠는가? 심리 계좌 www.aladin.co.kr/shop/wproduct.aspx?ItemId=21653587 심리계좌 가장 현실적이면서 구체적인 돈 관리 시스템으로 안내하는 책. 심리계좌 때문에 생기는 돈에 관한 다섯 가지 착각을 다양한 예를 들어 설명하고, 그런 문제들을 해결하는 구체적이고 지속 가능 www.aladin.co.kr 이 책은 재테크를 시작하기 전에 꼭 읽어야하는 응용서적이다. '개념서적'이라는 단어를 쓰려고 했지만 이론들을 알려주기보단 '실천사항'들을 소개한다. 2012년에 지어진 책이지만, 진리는 변하지 않는 것처럼, 재테..
이번 달에 리뷰할 책은 "인공지능 100점을 위한 파이썬 수학 - 고등학교 수학으로 이해하는 인공지능"이다. 인공지능을 공부하다보면, 활성함수, 그래디언트 등 고등학교 수학 시간에 배우지 않은 생소한 수학적 용어들을 접하게 된다. 사실 이러한 개념들은 용어만 생소할 뿐, 고등학교 수학 범위 내에서 충분히 이해 가능한 개념이라는 것을 이 책을 통해 깨닫게 되면서, 그 후의 딥러닝에 사용되는 수학적 지식을 배울 때도 같은 마인드로 접근하며 거부감 없이 배우고 있다. 이 책에서는 수학적 개념만 소개하는 것이 아닌, 그 개념을 파이썬과 numpy 패키지를 통해 직접 구현해보며 개념의 이해를 돕는다. 또한, 이렇게 직접 구현해보면서 터득한 노하우는 추후 PyTorch 같은 딥러닝 프레임워크들을 사용할 때 많은 도..
텐서플로2와 머신러닝으로 시작하는 자연어 처리 (로지스틱 회귀부터 BERT와 GPT2까지) 이 책은 GitHub에서 이 책의 실습 자료 레포지토리를 먼저 보고 알게 되었다. 레포지토리에는 책에 수록된 예제들이 모아져 있었는데, NLP의 기초부터 '텍스트 분류', '텍스트 유사도 측정', '챗봇 개발', '사전 학습 모델'의 '미세 조정' 등, NLP로 할 수 있는 (거의 모든) 태스크들이 예제로 구성되어 있었다. 물론, 예제만 참고하더라도 자료는 충분하겠지만, 꼼꼼한 설명까지 함께 보고 싶어서 이 책을 읽게 되었다. 실제로 이 책으로 '사전 학습 모델' 중 하나인 'BERT'를 '미세 조정'하는 방법에 대해 자세히 공부할 수 있었다. 보통의 다른 책들은 'BERT'를 '미세 조정'하더라도, 영어 데이터를..
이번 달에 리뷰할 책은 "MySQL로 배우는 데이터베이스 개론과 실습"이다. 이 책은 학교에서 '데이터베이스 설계' 과목을 수강할 때, 참고서로 사용했었다. 이 책의 장점은 이론 뿐만 아니라 실습까지 함께 공부할 수 있도록 많은 자료가 포함되어 있다는 것이다. '데이터베이스 시스템의 개념', 'SQL', '데이터 모델링과 정규화', '트랜잭션과 동시성 제어 같은 데이터베이스 관리' 등의 파트로 단계별로 구성되어 있어서, 현재 자신이 어느 단계까지 배웠는지를 명확히 알 수 있다. 또한, "워크북 실무 실습" 파트에서는 다양한 "데이터베이스 프로젝트"의 예시들을 코드와 함께 제공하고 있으므로, 직접 실습해보면서 익힌다면 MySQL 뿐만 아니라 데이터베이스의 작동 원리 같은 근본적 개념도 함께 가져갈 수 있을..
이 게시물은 남창주 교수님께서 작성하신 과학적 글쓰기 팁 원문을 내용을 해치지 않는 선에서 오타를 수정하고, 가독성을 위해 단락을 수정한 게시물입니다. Changjoo's website - 과학적 글쓰기 팁 (In English; 영문버전) 연구자의 길을 걸으면서 필연적으로 수반되는 고통 중 하나는 바로 글쓰기입니다. 글을 쓴다는 행위 자체가 쉬운 것이 아닌데 연구에 관해서 써야하고, 그것도 모국어가 아 sites.google.com 원문의 출처는 남창주 교수님께 있음을 알려드리며, 좋은 글을 공유해주신 남창주 교수님께 감사의 말씀을 드립니다. 과학적 글쓰기 팁 (In English; 영문버전) Changjoo's website - Writing tips (In Korean; 한글버전) As a nonn..
이번 달에 리뷰할 책은 Rob Percival의 "할 수 있다! 코딩"이다. 책 표지에 "처음 시작하는 첫 번째 코딩 입문서"라고 소개하고 있다. 웹개발이나 앱개발 분야로 한정짓는다면 맞는 말 같다. 이 책의 목차는 아래와 같다. PART 01 왜 지금 코딩을 배워야 하는가 01 코딩으로 할 수 있는 일 02 코딩이란 무엇인가 PART 02 코딩에 쓰이는 언어 03 HTML 04 CSS 05 자바스크립트 06 파이썬 PART 03 실전! 코딩 07 웹사이트 개발 08 아이폰과 아이패드를 위한 앱 개발 09 안드로이드를 위한 앱 개발 10 디버깅 PART 04 코딩으로 커리어 경쟁력 갖기 11 코딩으로 커리어 쌓기 12 코딩과 창업 13 코딩 개발자가 되는 길 'PART 03'을 제외한 나머지 내용들은 코..