본문 바로가기
엄지작가/책 한 번 만들어 보려고

AI전자책 만들기 - 2. 이미지 생성프로그램의 세계

by 은지용 2023. 10. 10.

 
 
1. 생성형 AI 경험
2. 이미지 생성프로그램의 세계
3. 내가 쓴 글로 전자책 만들어보기
4. 아마존 킨들에 책 올리기 
5. 시장조사가 필요해?
 
 
이미지 생성 프로그램 소문은 많이 들었다.
 
언젠가 영화 해리포터 배우들이 발렌시아가 모델로 나선 영상을 보면서 많이 웃었던 적이 있다. 발렌시아가란 브랜드가 거의 10등신의 모델들이 세상 심각한 표정을 하고, 각 잡는 분위기라. 해그리드처럼 동물 사랑하는 덩치 큰 울보나 론 처럼 실수투성이 빨강머리하고는 도무지 어울리지 않는 브랜드다. 그런데 이들이 완전 발렌시아가 모델로 빙의해서 경직된 런웨이를 선보이는 모습이 너무 웃겼다. 그것이 생성형 AI 프로그램들이 만들어낸 가짜 이미지란 사실을 알게 된 순간 전혀 웃기지 않았다. 좀 무서웠다. 
 




그 때 누군가에게 받았던 제작 노하우 유튜브를, 이제 다시 보니까, 이제야 다시 보인다.

https://youtu.be/_DPsEsxqsFI


 
챗 지피티에 해리포터 등장인물 10인의 이름과 특징을 알려달라고 한 후, 발렌시아가 스타일로 설정해달라고 하면. 이미지 생성 프로그램에서 쓸 수 있는 키워드를 좌라락 정리해 뽑아준다.

이 키워드로 이미지제작 생성형 AI (Midjourney)에게서 각 캐릭터별 사진을 얻고. 실제 배우들의 목소리와 원하는 대사를 적은 스크립트를 목소리 생성형 AI 프로그램 (ElevenLabs)에 넣어 원하는 음성을 얻고. 아까의 사진과 음성을 동영상 생성형 AI 프로그램(D-ID)에 입력해서 만들었단다…

강의 선생님은 대표적인 이미지 프로그램 달리(DALL'E)나 미드저니(Midjourney), 또는 스테이블 디퓨전(Stable Diffusion)에서 변환할 명령어/프롬프트까지 챗 지피티에게 알려달라 하면 된다 하셨는데. 챗 지피티는 나에게 미주알 고주알 다 알려주진 않았다. 하나마나한 원론적인 얘기만 해줬다. 쳇.
 
그냥 문제의 생성형 이미지 AI들과 만나 이것 저것 시도해보았다.
 
 
* 이미지 크리에이터 (달리)
 
나에게 제일 쉬운 것은 빌게이츠를 통하는 루트였다. 마이크로소프트사의 검색포털 Bing  (www.bing.com)에 들어가 image creator를 검색하면. 앞서 말한 프로그램 중 하나인 달리(DALL'E)가 제공하는 그림 생성 창이 뜬다. 물론 마이크로소프트에 가입해야 한다. 
 
전 수업 때 챗 지피티가 써준 까마귀와 허수아비의 모험으로 그림을 만든다 생각했고. 제목은 Crowy and Scarecrow's Oz Odyssey로 골랐다. (강의 제목에 'AI동화책' 이란 말이 들어갔던 사실을 기억하자.) 4컷 만화, 스누피 같은 심심한 그림 스타일이 좋아서 'cartoon style'로 입력했는데 이 제목을 기반으로 그림을 그려달라고 하니 너무 유치해보였다.
 

 
너무 어린 아이들보단 좀 큰 애들이 낫겠다 싶어서. 단서 조항으로, 프롬프트에, for teenagers 덧붙이고. 스누피 카툰 스타일로 해달라했더니 진짜 스누피가 등장. 스누피 저작권료 감당은 어려울 것 같은데...
 


 
색깔 난무하는게 싫어서 black crow pecil cartoon 비슷한 말을 마구 집어넣었다. 엇. 좀 취향에 맞는 그림이 나왔다. 저기 한 군데만 색깔 넣었으면 좋겠지만. 그만두기로 한다. 되게 하고 싶은건 아니었거든.

달만 색칠하면 좋겠다. 더이상 AI한테 부탁하느니 내가 하는게 빠를 듯...


 
이미지 크리에이터에서 생성한 이미지가 마음에 들면, 그림 오른쪽 클릭해서 용량 충분한 파일로 다운 받아놓아야 한다. 계정에 저장이 따로 안된다. 나는 화면 캡쳐만 했다. 선생님은 이렇게 하면 추후 책 제작 때 해상도가 너무 떨어진다며 하지 말라 하셨지만. 나는 '과연 정말 쓰겠어?', '내가 정말 이 이야기를 완성할까?' 싶은 마음으로 그냥 화면 캡쳐만 했다.
 
 
* 미드저니
 
미드저니로 가봤다. 여행 한 중간이라는 midjourney 사이트로 이동했건만, 가입하려하니 discord 홈페이지가 뜬다. 코드가 안맞는 것 같다. 다시 해도 똑같다. 알고보니 디스코드가 더 큰 개념의 채팅 프로그램 회사이고, 그 안에 이미지 생성 프로그램 미드저니가 포함되어 있는 것. 나무위키는 게임하는 사람들이 떠들면서 게임할 때 이 프로그램을 많이 쓴다고 한다.

 
실제 프로그램을 가동시키는 것도 채팅방에서 떠드는 기분이다.
(하긴 생성형 AI라는 것들이 다 채팅하는 느낌이긴 하다... 나는 채팅했는데 본인들은 generating 생성중이라고 하더라... )
 
미드저니는 유료가입해야 한다. 베이직 요금제, 월 결제 8불짜리 질렀다. 무료로 25장까지 해준다더니, 잘 안 된다. 한 장도 안만들어졌다. 채팅에 참여하는 사람이 너무 많으면 체험객들은 찬밥신세. 결국 강의 중간에 유료 가입했다. 다음달 해지하면 되지 하는 마음이었지만, 사람 마음 참 간사해서, 이제 그냥 쓰고 싶다. 남편 카드였다.
 
처음 참여하면 newbies라는 임의의 채팅창에 배정된다. 사실 채팅창이란 용어는 불분명하다. 여기선 서버라는 이름을 쓰는 것도 같고. 잘 모르겠다. 해당 방에 사람들이 많다. 내가 만든(?)그림 뿐 아니라, 같은 창에 배정된 다른 이들의 그림도 보게된다. 정신없다. 
 
나만의 서버를 만들라고 한다. 무슨 말인고 하니 미드저니봇과의 프라이빗한 채팅창을 만들란 말이다. 현대카드 앱에서 상담하기를 눌러 상담봇과 채팅창에서 둘이 대화하듯, 카톡 단톡방에서 방장봇에게 환영인사 받듯, 카톡창에서 누군가와 수다떨듯. 
 
그 창에 드디어 /imagine 프롬프트를 써서 챗 지피티가 표지 사진으로 알려준 이미지를 넣어줬다.

물론 영어여야 한다. 이매진 이후 스페이스바가 꼭 들어가야 한다. 결과물을 보고 흠칫 놀라고, 오 좀 차원이 다른데 싶었다. 그림은 나쁘지 않았다.

/imagine keyword, keyword, keyword
/imagine crwoy perched on the scarecrow’s shoulder, ready for an adventure, Oz odyssey, cartoon
 

3사분면 그림을 좀 더 변형했으면 좋겠어서, V3을 눌렀다. 그랬더니 아래 그림이 나왔다. 한번에 4장씩 나온다. 명령어가 너무 길어지면 배째-한다. 적당히만.




이런 저런 그림들을 만들어보기 시작했다. 꽤 재미있었다. 초록지붕 집 빨간머리 앤의 식탁 이미지도 주문해봤다. 미드저니보다 엄지들이 실제로 차린 상이 더 좋아보이는 건 내 눈에 콩깍지인가. 실제 사진을 제공해서 이미지 합성도 가능할 것 같은데.

미드저니의 저 작은 채팅창에 한정된 글자로 내가 원하는 것을 효율적으로 전달하는게 - 아직은 어렵다.
 


 
 
제일 큰 문제는 그림을 저장하는 것. 이미지를 다운 받을 수가 없다. 링크 주소를 가져와야 한다.

그런데 어디로 가져와야 하나. 그게 헷갈렸다. MS 워드파일에 이미지 링크입력 창이 있었는데, 결국 그건 성공 못했다. 나는 모르겠다. 누구 아는 사람 가르쳐주면 좋겠다. 이걸 못해서 그냥 이미지크레이터로 작성해서 전자책 만들기 했다는... 물론 유튜브 검색하면 나오겠지만.
 
그 정도로 많은 시간을 들이는 것은 어쩐지 내키지 않는다.
 






—————————미드저니 파라미터
- - quality 3 (보통 1로 설정되어있슴)
- - chaos 50 (완전 다른 이미지 원할 때 0-100)
- - ar 2:3 (화면비율 지정. 보통 1:1)
- - no flower (빼고 싶은 요소 지정. 꽃노. 파랑노)
- - stop 50 (생성정도)
V1 : 1사분면이미지 변형
U1 : 1사분면 이미지 업스케일링
업스케일링 이후 vary region + remix mode : 제거 요소 지정