Flux.1, imageFX 손가락, 텍스트 잘 나오는 ai 이미지 생성기( feat. 미드저니)

현재 고퀄리티 이미지를 잘 뽑아주는 ai 이미지 생성기라면 Midjourney를 빼놓을 수 없죠. 그래서 ai이미지 생성기가 나오면 미드저니와 비교를 하게 되는데요. 화질로서 최고 수준이라는 Flux를 비교하다가 구굴에서 만든 Imagen3가 엄청난 고퀄리티의 이미지를 뽑아내는 것을 보고 깜짝놀랐습니다.

 

 

Black Forest Labs 라는 곳에서 Flux.1 이라는 이미지 생성 프로그램을 선보였는데요. 가장 큰 특징으로 인물의 손가락이며 전반적인 퀄리티가 매우 우수하다는 평가를 받고 있습니다. Flux.1은 pro, dev, schnell이라는 3가지 모델로 나와 있습니다. pro가 가장 고성능이지만 실제로 사용하기는 쉽지 않은 것 같구요. dev와 schnell은 허깅페이스나 fla같은 곳을 통해서 사용해볼 수 있습니다.

 

 

 

imageFX는 구글이 만든 이미지 생성 ai 서비스입니다. 아직까지는 무료로 aitestkitchen 을 통해서 사용해볼 수 있는데요. 구글 딥마인드가 만든 imagen2를 기반으로 하고 있어서 명령어에 대한 이해가 높은 것으로 알려져 있습니다.

 

구글 aitestkitchen

 

 

https://aitestkitchen.withgoogle.com/ko

 

위의 구글  aitestkitchen에 접속해서 아래로 스크롤하면 ImageFx 가 있고 테스트 가능합니다. 위의 링크를 통해서 접속할 수도 있고 아래 이미지를 클릭해서 접속하셔도 됩니다.

 

https://aitestkitchen.withgoogle.com/ko/tools/image-fx

 

 

Fux.1 dev 테스트

https://huggingface.co/spaces/black-forest-labs/FLUX.1-dev

 

FLUX.1 [dev] - a Hugging Face Space by black-forest-labs

Running on Zero

huggingface.co

 

위 허깅페이스를 통해서 Flux.1 dev를 사용해볼 수 있습니다. 참고로 flux.1 은 앞서 말씀드린 것처럼 flux.1 pro, dev, schnell의 3가지 모델이 있습니다.  이 모델들이 유명해진 이유가 아래 그래프 때문인데요. Flux.1 3가지 모델이 모두 미드저니보다 성능이 뛰어나다는 것이죠. 심지어 스테이블디퓨전3울트라보다도 뛰어난 성능이라고 하는데, 일각에선 sd3가 미드저니보다 못하다는 의견도 의견도 있긴 합니다. 그래도 어쨌든 현존하는 가장 뛰어난 이미지 퀄리티는 미드저니라고 할 수 있는데요. 가장 작은 모델인 Flux.1 schnell 조차도 미드저니를 앞선다고 하니 관심이 갈 수 밖에 없는 듯합니다.

 

 

허깅페이스 Flux.1 dev에 접속하면 아래와 같은 화면을 만나게 되고, 간단히 프롬프트를 입력해서 테스트로 이미지를 생성해 볼 수 있습니다. 이미지 생성은 dev 모델은 30초 가량 소요되는 것 같구요. schnell은 10초 안팎으로 빠른 것 같습니다. 

 

아래는 Flux.1 dev 로 생성해본 이미지입니다. 손가락이 상당히 자연스럽고 티셔츠에 텍스트도 깨지지 않고 잘 표현되는 것을 확인할 수 있습니다. 

 

very best quality photography realistic korean woman, wearing t-shirt printed ' Believe in yourself ' handwriting text, full body, blue jeans, waving a hand

 

이미지 프롬프트는 위와 같습니다. 왼쪽은 dev,  오른쪽은 schnell입니다. 참고로 Schnell은 손가락이나 텍스트가 잘 못되는 경우가 조금씩 발생하기 때문에 몇번 반복해서 생성해야할 수 있습니다. 그렇지만 속도는 상당히 빠릅니다.

 

그리고 미드저니에 있는 프롬프트로 고양이와 빵 이미지도 생성해봤는데요. 결과물은 아래와 같습니다. 왼쪽이 Flux.1 dev  오른쪽이 미드저니의 이미지입니다.

 

 

18h Ultra-realistic 8K photograph, a tiny kitten with disheveled fur sitting on a human index finger, the finger is positioned sideways with clear detail of the skin’s texture. The kitten’s messy hair adds character to the scene, background is slightly out of focus, natural light gently highlights the subjects, shot with a Leica Q2, strong color contrast and sharp clarity

 

손가락의 디테일면에서는 Flux.1 dev가 훨씬 사실적으로 보이고, 미드저니는 특유의 색감과 고양이 털의 디테일이 엄청난 것 같습니다.

 

빵의 느낌은 양쪽 모두 먹음직 스러운데요. 같은 프롬프트지만 미드저니의 프롬프트가 좀 더 프롬프트에 충실하지 않나 하는 생각이 드네요. 퀄리티는 둘다 대단하구요.

Soft brioche à tête with a golden crust, served warm with sweet butter food photography

 

안타깝게도 현재 Flux.1 dev 는 연구 목적으로만 사용가능하고 상업적 사용은 안됩니다. 프로는 사용이 가능하다고 하는데 테스트를 해볼 수 없고 사용해보려면 유료로 사용해볼 수 밖에 없습니다.

 

Replicate라는 사이트틀 통해서 Flux.1 pro를 사용해보실 수 있습니다.

 

https://replicate.com/black-forest-labs/flux-pro

 

black-forest-labs/flux-pro – Run with an API on Replicate

Pricing This model is priced by how many images are generated. Check out our docs for more information about how per-image pricing works on Replicate. Readme FLUX.1 [pro] is the best of FLUX.1, offering state-of-the-art performance image generation with to

replicate.com

 

 

구글 imageFX

구글의 imageFX의 퀄리티도 상당히 훌륭합니다. 구글의 imageFX 는  구글 딥마인드의 imagen3기술을 사용합니다. 사용은 앞서 말씀드린 imageFX 사이트에서 해보실 수 있습니다.

생성한 이미지들을 라이브러리에서 관리할 수 있구요. 프롬프트도 이미지를 통해 재사용이 가능합니다.

 

https://aitestkitchen.withgoogle.com/ko/tools/image-fx

 

 

 

이미지는 어떤 데이터를 가지고 학습을 했는지, 약간 아이돌이나 연예인 같은 분위기로 생성이 됩니다. 그리고 포토그래피,  realistic을 프롬프트로 넣었지만 다소 회화적으로 나오는 경우들이 종종 있어서 체리피킹을 하게 되는 것 같습니다. 생성 속도는 20~30초 안팎으로 생성 가능한 것 같습니다.

 

 

위에 이미지를 보시면 imageFX도 글자를 잘 표현해주는 것 같습니다. 어떤 면에서는 Flux.1 dev 와 비슷하거나 더 프롬프트에 충실한 것 같다는 생각도 들거든요. 손가락 표현도 잘 되구요.

 

 

imageFX는 일일 이미지 생성 횟수가 제한이 있습니다. 꽤 많이 생성이 가능하지만 어느순간 갑자기 안되기도 하고 간혹 프롬프트를 넣어도 이미지를 생성 못하는 경우도 있긴 합니다. 그래도 어느정도 퀄리티있는 이미지를 얻을 수 있기 때문에 여러가지 테스트를 해보고 적절한 프롬프트로 필요한 이미지를 생성하는데는 큰 문제 없을 것으로 보입니다.

 

 

그리고 imageFX는 위와같이 프롬프트의 일부가 이미지를 생성하면서 셀렉트 박스가 같이 만들어지는데요. 예를 들어 dramatic lighting을 클릭해보면 flat lighting, even lighting, bright lighting등 다른 옵션으로 이미지를 생성할 수 있도록 제안해줍니다. 이런 부분은 사용자 입장에서 다른 분위기를 만들어 보고자 할 때 빠른 선택이 가능해서 도움이 될 것 같아요.

 

 

 

빵도 생성해봤는데요.

앞서 사용한 프롬프트를 이용했습니다. 퀄리티가 엄청나죠?

 

 

마치며,

오늘은 텍스트와 손가락 등을 오류없이 잘 생성해준다는 Flux.1을 살펴보면서 구글에서 만든 imageFX도 간단히 비교하고 살펴봤습니다. 플럭스는 유료로 프로를 사용해보지 못해서 비교를 할 수 없지만 사이트에서 소개하는 퀄리티는 미드저니 보다 어떤 면에서는 훨씬 뛰어납니다.  imageFX 는 구글의 imagen2를 기반으로 하는 만큼 만만찮은 성능을 보여주는데요. 아직은 상대적으로 flux1이나 미드저니에 비해서는 다소 퀄리티가 떨어지는 경우가 있는 것 같습니다. 

 

한편으로 포토샵에서도 이미지를 생성해봤는데요. 포토샵이 다른 모델들에 비해서 속도가 빠른 편이지만 아직은 어도비에서 좀 더 이미지 퀄리티를 높이는 작업을 해줬으면 하는 면이 있습니다. 일부러  ai가 생성한 듯한 분위기를 유지하는 것인지는 모르겠지만 이미지도 초기 스테이블디퓨전의 이미지 퀄리티로 나오는 경우가 많습니다. 다만 포토샵의 경우는 이미지를 편집하면서 필요한 부분을 자동생성하거나 이미지를 손상 없이 지울 때와 같이 편집기능으로서 사용할 때 위력을 발휘하는 것 같습니다.

 

어도비 파이어플라이로 3D 유리 텍스트 만들기(feat. 일러스트레이터)

포토샵 remove tool (제거도구) 도장툴 대신 사용하기

 

 

 

참고가 되셨음 좋겠네요.

 

고맙습니다.

 

반응형

댓글

Designed by JB FACTORY