본문 바로가기
스테이블디퓨전

스테이블디퓨전 stable diffusion 기본 사용법 - txt2img

by AI_study 2023. 3. 13.
반응형

txt2img는 쓰인 단어를 그림으로 바꿀 수 있는 stable diffusion기본 기능이다. 배경이나, 그리고 싶은 객채 또는 캐릭터와 같이 보고 싶은 것에 대한 설명을 작성하기만 하면 도구가 작성한 내용을 기반으로 이미지를 만들 수 있다.

stable diffusiont-txt2img 기본사용법

stable diffusiont-txt2img 사용법은 아주 간단합니다 Prompt에 원하는 키워드를 넣고 Negative prompt에는 나오지 않기를 원하는 키워드를 넣고 Generate를 누르면 된다. 사물을 묘사하는데 어려움이 있다면 구글 번역이나 또 다른 번역 기을 사용합니다.

stable diffusiont-txt2img 옵션

sampling method은 샘플링 타입에 따라 이미지를 생성한다. sampler들 간의 차이는 크지 않습니다. 하지만 미묘한 차이를 위해서 sampling method를 바꿀 수 있고 주로 dpm++SDE Karras를 사용합니다.
sampling steps는 수치가 높을수록 더 높은 퀄리티의 사진을 만들 수 있습니다. sampling steps는 보통 20~25 정도를 사용한다. 25 이상은 조금 다른 이미지를 만들어낼 수 있지만 더 나은 퀄리티를 보장하지는 않는다. 이 수치가 높을수록 이미지를 생성해 내는데 시간이 더 걸립니다.

Restore faces  얼굴이나 눈이 이상하게 나왔을 때 해당 부분을 다시 그릴 수 있는 옵션입니다.
Tiling 이미지를 타일링화 합니다.
Hires fix 이미지 업스케일러. 예를 들어 512x512를 1024x1024로 해상도를 높여서 업스케일을 해주는 기능입니다.

width and height 이미지의 해상도입니다. 높을수록 자원을 더 많이 사며. 많이 사용하는 포맷은 512x512와 768x768 px이 있습니다.
batch count 한 번의 배치에 생성이 되는 이미지의 개수를 이야기한다. 순차적으로 실행되기 때문에 속도나 그래픽카드 메모리에 영향을 끼치지는 않습니다.
batch size 한 번의 몇 개의 배치를 병렬로 처리할지를 설정하는 옵션. 높을수록 속도가 빨라지지만 그래픽카드 메모리를 더 많이 사용합니다.

CFG scale 이미지 생성에 얼마나 자유도 (freedom)을 주느냐를 이야기한다. cfg가 높으면 프롬프트와 다른 결과가 나올 확률이 크다. 처음 값은 7로 세팅되어 있다. 높을수록 자유 분방한 녀석이 되어갑니다.
seed 이미지 생성에 영향을 미치는 숫자입니다. 동일한 프롬프트 및 설정에서 동일한 시드를 사용하면 동일한 이미지가 생성된다. 그러나 시드를 -1로 설정하면 매번 고유한 이미지가 생성된다. 따라서 비슷한 이미지를 만들고 싶다면 같은 시드를 사용하되, 새로운 것을 원한다면 시드를 변경하거나 -1로 설정하면 됩니다.

Prompt, Negative prompt 예제

밑의 civitaitk사이트 경로로 들어가 Prompt와 Negative prompt 등등을 참고해서 세팅 후 Generate을 눌러 이미지를 생성한 결과입니다

Makima (Chainsaw Man) LoRA 

 

Civitai | Share your models

 

civitai.com

checkpoint는 koreanstyle25 D_koreanstyle25 DBaked.safetensors를 믹스한 모델을 사용하였습니다. checkpoint관련 내용은 밑에 링크를 참고하시기 바랍니다.

이상 stable diffusion 기본 사용법 - txt2img 에 대해 알아보았습니다. 그럼 stable diffusion의 필수 학습요소인checkpoint/vae/lora 에 대해 알아보겠습니다.

Ai그림 그리기 stable diffusion-Checkpoint

Ai그림 그리기 stable diffusion-Vae

Ai그림 그리기 stable diffusion-Lora

 

 

 

반응형

댓글