만들면서 배우는 생성 AI - 트랜스포머부터 GPT, DALL·E 2, 스테이블 디퓨전, 플라밍고까지
『미술관에 GAN 딥러닝 실전 프로젝트』 두 번째 이야기
세상을 변화시킨 생성 AI의 과거와 현재, 미래까지
명쾌하고 설득력 있게 생성 AI를 설명하는 데이비드 포스터가 돌아왔습니다. 이 책의 초판인 『미술관에 GAN 딥러닝 실전 프로젝트』는 GAN을 집중적으로 설명했지만, 초판 출간 이후 생성 AI 분야가 크게 발전했습니다. 세상을 놀라게 한 생성 AI의 눈부신 발전을 담아내기 위해 2판을 새롭게 업데이트했습니다. 기존 내용을 최신 기술 정보로 수정하고, 트랜스포머 설명을 더 상세하게 보완하고, 멀티모달 모델 내용을 새롭게 추가했습니다. 업그레이드된 2판은 GAN에만 국한된 내용을 소개하지 않기에 『만들면서 배우는 생성 AI』라는 새로운 이름으로 찾아왔습니다.
본격적인 설명에 앞서 흥미를 자극하는 이야기와 실용적인 예시, 활용법까지 최신 기술로 무장한 이 책은 여러분을 생성 AI의 전문가로 업그레이드해줄 것입니다. 컴퓨터로 창작하는 가장 진보한 기술을 활용하는 법을 터득해보세요. 생성 AI를 접한 경험이 없더라도 괜찮습니다. 처음부터 따라 하며 차근차근 기술을 습득할 수 있게 친절히 안내합니다. 여러분에게 필요한 건 파이썬 코딩 경험, 그뿐입니다. 생성 모델의 기본 원리부터 파악한 후 파이썬과 케라스로 직접 코딩하며 생성 AI를 배워보세요.
2판에서 달라진 점
1장은 다양한 생성 모델을 소개하고 이들의 연관성을 나타내는 분류 체계를 담았습니다.
2장은 그림을 개선했으며 주요 개념을 더 자세하게 설명합니다.
3장은 새로운 예제와 설명을 담았습니다.
4장은 조건부 GAN 구조를 설명합니다.
5장은 이미지를 위한 자기회귀 모델(예: PixelCNN)을 설명합니다.
6장은 완전히 새로운 장으로, RealNVP 모델을 설명합니다.
7장 역시 새로운 장이며, 랑주뱅 역학 및 대조 발산과 같은 기법에 초점을 맞춥니다.
8장은 오늘날 많은 최신 애플리케이션의 기반이 되는 잡음 제거 확산 모델을 위해 새로 작성한 장입니다.
9장은 초판의 마지막 장 내용을 확장한 것으로, 다양한 StyleGAN 모델 구조와 VQ-GAN에 관한 새로운 내용을 심층적으로 다룹니다.
10장은 트랜스포머 아키텍처를 자세히 살펴보는 새로운 장입니다.
11장은 초판의 LSTM 모델을 대신하여 최신 트랜스포머 아키텍처를 다룹니다.
12장은 그림과 설명을 업데이트했으며 이 접근 방식이 오늘날의 최신 강화 학습에 어떻게 영향을 미치는지 소개합니다.
13장은 새로운 장으로 DALLꞏE 2, Imagen, 스테이블 디퓨전, 플라밍고와 같은 인상적인 모델이 어떻게 작동하는지 자세히 설명합니다.
14장은 초판 이후 생성 AI의 놀라운 발전 현황을 반영하고 앞으로 나아갈 방향에 관한 더욱 완벽하고 상세한 시각을 제공합니다.
대상 독자
생성형 AI의 작동 방식을 이해하고, 직접 사용해보고 싶은 학부생 및 개발자
최신 딥러닝 기술에 관심 있는 머신러닝 엔지니어, 데이터 과학자 및 연구원
주요 내용
VAE로 사진 속 얼굴 표정 바꾸기
자체 데이터셋을 학습한 GAN으로 이미지 생성하기
확산 모델로 새로운 꽃 종류 만들기
텍스트 생성을 위한 자체 GPT 훈련하기
대규모 언어 모델인 챗GPT 훈련 방법 알아보기
StyleGAN2, ViT VQ-GAN과 같은 최신 아키텍처 조사하기
트랜스포머와 MuseGAN을 사용해 다성 음악 작곡하기
월드 모델이 강화 학습 과제를 해결하는 방법 이해하기
DALLꞏE 2, Imagen, 스테이블 디퓨전과 같은 멀티모달 모델 알아보기