스테이블 디퓨전은 그림을 그려주는 AI (인공지능) 프로그램입니다. 인공지능 그림 프로그램은 AI가 명령어만 입력하면 그림을 그려주는 것 때문에 이제는 창작의 영역까지도 AI에게 위협을 받는 것이 놀랍기도 하고 걱정스럽기도 한데요. 스테이블 디퓨전 말고도 그림을 그려주는 다양한 인공지능 프로그램들이 있습니다. DALL-E, Novel Ai, Deepai, Midjourney 등이 익숙한 이름들일 것 같습니다. 이 밖에도 그림을 그려주는 인공지능 서비스들이 많지만 오늘 소개해드리는 스테이블 디퓨전과의 비교를 위해서 간단히 소개만 하고 스테이블 디퓨전을 사용하는 방법 위주로 알려드리겠습니다.
*4월 22일 업데이트
코랩 무료 버전은 구글에서 스테이블 디퓨전 사용을 제제하기 시작했습니다. 서버에 부담이 큰 상황이라는 것이겠죠. 유료버전인 코랩 프로를 쓰거나 다른 서버로 이주하는 사용자들이 늘어나고 있습니다.
코랩 프로는 9.99달러인데요. 그래도 이 비용을 내고 사용하는 것이 낫다는 분들도 적지 않습니다.
무료플랜으로는 계정 정지까지도 감행한다고 하니 주의하시기 바랍니다.
이글의 구성
- 그림 그려주는 인공지능 프로그램
- DALL-E
- Novel Ai
- DeepAi
- Midjourney
- Stable Diffusion
- 코랩(Colab)
- Stable Diffusion 사용법(간략) /무설치 / 코랩(Colab)
* 스테이블 디퓨전에 모델을 설치하는 방법은 이 포스팅을 참고해주세요.
스테이블 디퓨전 무설치 / colab / 모델 사용하기(코랩가능)
그림 그려주는 인공지능 프로그램
텍스트나 이미지를 입력하면 알아서 그림을 만들어내는 프로그램들을 몇가지 소개합니다.
DALL-E
DALL-E는 애니메이션 월E와 살바도르 달리에서 이름을 따왔다고 합니다. 요즘 ChatGPT로 유명한 Openai에서 만들었습니다. Stable Diffusion (스테이블디퓨전)이 먼저 나왔지만 그림그려주는 AI를 대중에 폭발적으로 알린 것은 달리라고 할 수 있습니다.
현재는 DALL-E-2 버전이 사용가능하고 위 사이트에서 체험할 수 있습니다.
달리 웹사이트에서 상단의 입력창에 명령어를 입력하거나 이미지를 업로드해서 그림을 생성하도록 할 수 있습니다. 아래와 같이 a Very cute Girl by miyajaki hayao, Anime Girl, Detail, High Quality, Best Quality 라고 입력했더니 몇가지 그림을 뽑아 주었는데요. 상당히 빠른 속도로 그림을 생성해줍니다. 같은 명령어여도 매번 다른 그림을 만들어줍니다.
달리에서는 아래와 같이 동일한 명령어로 새로운 그림을 생성했습니다.
이번에는 비슷한 명령어로 산위의 나무를 그려달라고 해봤습니다.
간단히 위와 같이 달리에서는 무료체험이 가능하니 체험해보시는 걸 추천드립니다.
달리는 폭력적, 성적, 정치적 이미지는 생성하지 못하도록 제한이 되어 있고, 실존 인물에 대해서도 일부 텍스트는 제한되어 있다고 합니다. 예를 들어 Trump President를 입력하니 아래와 같이 허용되지 않는다는 문구를 내보내면서 이미지를 생성해주지 않네요.
체험을 자유롭게 해볼 수는 있지만 크레딧이 있어야 합니다. 처음엔 50크레딧이 주어지고 이미지 생성, 수정할 때마다 1Credit을 사용하게 됩니다. 매월 15 크레딧이 무료로 주어집니다. 유료 사용도 가능합니다. 현재 시점엔 15달러에 115 Credit을 구매할 수 있도록 되어 있습니다.
NovelAi
노블Ai는 스테이블디퓨전을 기반으로 개발된 인공지능 이미지 제너레이터입니다. NovelAi 제너레이터는 '달리'보다 애니메이션 캐릭터 - 특히 일본풍의 캐릭터 생성에 특화되어 있습니다. stable diffusion 기반으로 만들어진 프로그램에 학습시킨 이미지들이 단부루(Danbooru)라는 커뮤니티(데이터베이스)에서 그림, 사진을 크롤링해서 학습했기 때문입니다. 단부루 사이트가 국내에선 직접 접속하기 어려울 정도로 좀 지나친 성적인 이미지와 불펌자료들이 많습니다. 한편 고퀄리티의 이미지가 많지만 저퀄리티의 이미지가 섞여 있기도 한 이러한 데이터 베이스를 활용했고, 다양한 이미지들이 있지만 주로 2D의 일본풍 이미지들이 많아서 생성할 수 있는 이미지들이 일본 애니멘이션 스타일에 특화되어 있다고할 수 있습니다. 물론 노벨AI로 생성할 수 있는 이미지가 단순하게 2D 그림만 만들 수 있는 것은 아니고 3D, 거의 완벽한 사진 이미지도 가능합니다. 대단히 높은 퀄리티의 이미지도 만들어 낼 수 있고 사진이미지는 합성처럼 보이는 것도 있지만 실사와 같은 고퀄리티의 이미지도 가능해, 이젠 사진작가도 직업적인 위협을 받는다는 농담(?)이 있을 정도입니다.
Novel Ai는 소설기능과 이미지 생성 기능으로 나눌 수 있는데요. 텍스트를 입력하면 AI가 소설을 완성해주는(?) 기능은 무료로 사용할 수 있지만 이미지 제너레이터 기능은 유료 구독을 해야합니다. 달리(Dall-E)의 크레딧과 같은 개념의 Anlas가 그림을 생성할 때마다 소진됩니다.
이미지 제너레이터 페이지에선 보이지만 위와 같이 보이지만 구매가 되지 않습니다. 구매를 하려면, Tier Pricing에서 선택해야 합니다.
저는 구매하지는 않았습니다. 제가 관심을 갖고 있는 것은 스테이블 디퓨전이라 확인만 해봤습니다.
개인적으로는 인공지능으로 만드는 그림에 대한 저작권 논란을 일으키는 대표적인 경우가 아닌가 생각됩니다. 이렇게 생각하는 이유는 위에 말씀드린 단부루 사이트의 저작권 문제도 있지만 인공지능이 학습한 데이터 모델이라는 것 결국은 누군가의 그림이기 때문인데요. 이에 대해서는 스테이블 디퓨전에서 좀 더 말씀드리겠습니다.
DeepAi
Deepai는 비교적 쉬운 체험이 가능한 인공지능 그림 그리기 사이트가 아닐까 싶습니다.
아래와 같이 Prompt를 입력하고 Choose a style 에서 어떤 분위기의 이미지가 만들어지기를 원하는지 선택하면 유사한 느낌의 그림을 만들어줍니다.
옵션에서는 이미지의 가로세로 비율을 선택할 수 있습니다.
Midjourney
개인적으로는 달리(DALL-E)보다 Midjourney 때문에 인공지능이 만드는 그림에 관심을 갖게 되었습니다. 그림의 분위기는 달리와 비슷하다는 것이 일반적인 의견인데요. 미드저니가 사람들에게 강한 인상을 남긴 것은 아래 그림 때문이었던 것으로 생각합니다. "스페이스 오페라 극장"이라는 이 작품은 콜로라도 주립박물관 디지털 아트 대회에 출품해 우승을 하게 되면서 세상을 발칵 뒤집어 놓습니다. 상금은 300달러였다고 하는데 이 작품을 사람이 직접 만든 것이 아니고 앞서 보셨던 다른 인공지능 사이트나 프로그램에서 그림을 만드는 과정처럼 오직 텍스트만 입력하고 그중에서 나온 그림을 선택하는 것만 사람이 한 것이죠. 이 때문에 이것을 만든 것이 사람이라고 할 수 있느냐에 대한 논쟁이 발생했습니다.
저작권 관련해서도 소송이 있지만 어쨌든 상당히 분위기 있는 회화적인 그림 뿐만 아니라 유명 작가의 그림 분위기를 묘사해 내놓는 능력이 탁월하다고 알려져 있습니다. 다만 인공지능 그림들이 유난히 손을 제대로 못그리는 경향이 있는데 특히 미드저니가 손묘사가 제대로 되지 않는 것으로 보입니다. 개인적으로는 노벨 ai 그림이나 스테이블 디퓨전의 그림들이 손묘사가 이상한 경우가 적지 않아서 아직은 ai가 사람의 손을 제대로 인식하지 못하는 것으로 보입니다. 하지만 이 또한 버전업과 학습을 거듭하면서 개선될 부분일 것입니다.
미드저니는 사이트에 접속하면 아래와 같은 화면이 나오는데요. 회원가입을 하려고 하면 디스코드 사이트로 넘어갑니다.
디스코드에서 회원가입, 초대 수락 과정을 거치면 이용할 수 있는데요. Midjourney는 Midjourney 홈페이지에서 이미지를 생성하는 것이 아니고 디스코드 서버에서 이미지를 생성하기 때문에 이런 과정을 거치는 것 같습니다. 아래 디스코드에 접속하시면 수많은 유저들이 미드저니를 통해 생성한 이미지들을 확인하실 수 있습니다. 놀랍도록 고퀄리티입니다.
Stable Diffusion
스테이블 디퓨전은 뮌헨대학교 Machine Vision & Learning Group 연구실에서 개발한 딥러닝 인공지능 모델입니다. 스테이블 디퓨전이 주목받는 이유는 오픈소스로 공개가 되어 있고 일반인들도 누구나 설치나 무설치로 사용할 수 있기 때문입니다.
스테이블 디퓨전을 테스트해볼 수 있는 방법은 여러가지가 있습니다. 직접 설치를 하는 방법, 구글 코랩이라는 서버를 이용해서 사용하는 방법, 그리고 위의 스테이블 디퓨전 웹이라는 이미지 생성 테스트를 해볼 수 있는 사이트를 이용할 수도 있습니다.
huggingface ControlNet 무설치 테스트 바로가기
허깅페이스라는 곳에서 많은 개발자들이 api를 이용해 테스트를 해볼 수 있도록 올려놓은 곳에서 테스트를 해볼 수도 있습니다.
직접 PC에 설치를 하면 다양한 이미지를 제약 없이 생성하고 다양한 모델(데이터베이스)을 통해 이미지들을 만들어보고 고퀄리티의 이미지도 생성해볼 수 있겠지만 고성능의 그래픽카드가 필요하다는 단점이 있습니다. 그래서 우선은 스테이블 디퓨전 홈페이지에서 테스트해보시는 것을 권해드립니다.
스테이블 디퓨전은 현재 2.X 버전이 최신이며 최근 ControlNet이라는 모델이 추가되어 이전에 비해 더 높은 퀄리티의 이미지들을 생성할 수 있게 되었는데요. 프롬프트로 텍스트를 입력하는 것 뿐만 아니라 이미지를 입력할 수도 있고 다양한 옵션 조정이 가능해졌습니다.
다만 모든 인공지능 이미지 제너레이터들과 같이 여러 사이트에서 보여주는 멋진 그림이 반드시 나온다는 보장은 없습니다.
아래는 위 Huggingface 사이트에서 스테이블 디퓨전 > controlnet을 이용해 생성한 이미지입니다. 포즈를 생성하고, 포즈를 통해 몇가지 프롬프트 명령어로 오른쪽과 같은 이미지가 만들어졌습니다.
Segmentation탭에서는 아래와 같은 이미지가 만들어졌습니다.
Colab
스테이블 디퓨전을 설치할 수 없는 환경이라면 구글에서 제공하는 일종의 무료개발 서버를 활용할 수 있습니다. 코랩(Colab)이라고 하는데요. 코랩에 복사할 수 있는 소스를 제공하는 곳들로부터 스테이블디퓨전을 복사하고 내 구글드라이브를 통해 접근할 수 있다고 생각하시면 될 것 같습니다. 원래 코랩의 주소는 아래와 같습니다.
Stable Diffusion 사용법(간략) / 무설치 / 코랩 Colab
정확히는 내 PC에 설치하지 않는다는 것 뿐, 코랩에 설치하는 것입니다. 다만 어렵게 설치파일을 구해서 일일이 하나씩 설치하는 것이 아니라 이미 설치과정을 간단하게 만들어놓은 것을 내 구글드라이브에 복제하여 설치하는 방법입니다. 코랩이 완전 무료는 아니고 어느정도 사용에 제한이 있고 너무 높은 사양으로 이미지를 생성하려고 하면 에러가 나기도 합니다.
과정은 아래와 같습니다.
1. 스테이블 디퓨전 ipynb 링크 페이지로 이동
아래와 같은 화면이 나오면 상단의 Drive로 복사를 클릭합니다.
Drive로 복사를 하면 아래와 같이 '사본'이 생기면서 내 드라이브에 스테이블디퓨전을 설치할 수 있게 됩니다. 사실 드라이브에 설치된다기 보다는 내게 할당된 코랩에 설치된다고 보는 편이 맞습니다.
자신의 구글 드라이브에 보면 Colab Notebooks에 스테이블 디퓨전 사본이 있는 것을 확인할 수 있고 언제든 다시 실행시킬 수 있습니다.
2. Run This cell 동그란 실행버튼(설치)을 누릅니다. 경고메시지가 나올 수 있는데 무시하고 실행하시면 됩니다.
설치가 완료되면 동그란 실행버튼 왼쪽 옆으로 녹색의 체크표시가 나타나면서 설치가 완료되었음을 알려줍니다.
3. Run the App을 눌러서 실행시킵니다.
가끔 하염없이 돌아갈 때가 있는데요.
그럴 때는 그냥 화면을 새로 고침하시고 다시 들어가면 정상적으로 실행될 수 있습니다.
실행이 되면 ~gradio.live 라는 파란색으로 링크 주소가 하나 나타납니다. 링크를 누르면 스테이블 디퓨전이 브라우저에서 실행됩니다. 또는 같은 창에서 바로 아래쪽으로 스테이블 디퓨전 인터페이스가 나타나기도 합니다.
아래는 코랩에서 실행된 스테이블 디퓨전 인터페이스입니다.
버전마다 인터페이스는 조금씩 차이가 있습니다. 왼쪽 상단 Enter prompt에 명령어를 입력하면 되고 오른쪽 작은 창에 Negative Prompt에는 이미지가 왜곡되고 이상할 때 나오지 말아야할 명령어를 입력합니다. 가령 아주 고퀄리티 명령어를 줬는데도 (Reality, Very high quality) 이상한 이미지가 나온다면 bad detail 같은 키워드를 넣어주면 됩니다.
숲속에 토끼가 있는 이미지를 스테이블 디퓨전으로 생성해봤습니다.
이미작 2개 생성되도록 Number of images를 2로 변경해서 같은 명령어로 generate했는데요. 아래와 같이 한마리는 다리를 감춘 것인지 앞다리가 안보이고 왼쪽의 토끼는 귀가 3개네요.
마치며,
코랩에 스테이블디퓨전을 설치해서 간단히 사용방법도 알아봤습니다. 코랩에 설치한다고 해서 아주 자유로운 것은 아니기 때문에 환경이 충분히 받쳐준다면 직접 자신의 PC에 설치해서 사용하는 것이 여러가지 모델들도 설치해서 이미지를 생성할 수 있기 때문에 훨씬 좋습니다. 다만 그래픽카드 성능이 좋아야하기 때문에 일반적인 노트북이나 그래픽카드 사양이 낮으면 제대로 사용할 수가 없어서 코랩을 이용하거나 위의 테스트 사이트들을 활용해보는 것이 좋습니다.
다음 포스팅에선 코랩에 여러가지 모델들도 같이 설치하는 방법을 알아보겠습니다.
스테이블 디퓨전 무설치 / colab / 모델 사용하기(코랩가능)
고맙습니다.
'IT > Dev' 카테고리의 다른 글
뉴모피즘(New Morphism) 계산기 디자인 해봤습니다. (XD 디자인 소스) (0) | 2023.04.19 |
---|---|
colab 인공지능 그림 ai 스테이블 디퓨전 설치 / 모델 사용하기(코랩가능) (0) | 2023.03.06 |
크롬 ChatGPT 확장 프로그램 모음 이거 설치하면 편해요! (2) | 2023.02.27 |
어도비 xd lottiefiles 애니메이션 이미지로 디자인하기 (0) | 2023.01.27 |
Asana 아사나 협업 도구로 괜찮은 선택 가격 노션 슬랙 간단 비교 (2) | 2023.01.25 |