ComfyUI에서 Qwen Image Edit 사용하기: 8월 19일 업데이트 후 첫 사용기
8월 19일 저녁, 퇴근 후 루틴처럼 ComfyUI를 켜려는데 업데이트 알림이 떴다.
"또 무슨 업데이트일까?" 하며 가볍게 생각했는데, 이번엔 Qwen Image Edit 지원이 추가된 것이었다. Qwen Image Edit 모델이 공개된 이후 언제 ComfyUI에서 지원하나 생각했는데 정말 빠르게 적용해줬다. Alibaba에서 공개한 이 혁신적인 이미지 편집 모델을 드디어 ComfyUI에서 사용할 수 있게 된 것이다. 그래서, 어제 새벽 1시까지 테스트해보느라 지금 많이 피곤하긴 하다.
혹시 여러분도 "이미지 편집 AI가 또 하나 나왔구나" 하며 무심히 넘기려고 하셨나? 잠깐만.
이번엔 정말 다르다. Flux Kontext와 비교해도 더 나은 것 같고, 요즘 핫한 나노 바나나보다는 좀 못할지 몰라도, 확실히 실제 이미지 편집 등에 있어 매우 유용한 모델이라고 생각한다.
내가 직접 RTX 5070Ti 16GB 환경에서 Q4부터 Q8까지 모든 GGUF 모델을 테스트해본 결과, 기존 이미지 편집 도구들과는 차원이 다른 성능을 보여줬다.
Qwen Image Edit, 왜 특별한가?
Qwen Image Edit는 단순한 이미지 생성이 아닌, 기존 이미지를 정교하게 편집하는데 특화된 모델이다. "곰 캐릭터를 화가로 바꿔줘"라고 하면, 곰 캐릭터의 기본 특징은 그대로 유지하면서 화가 컨셉만 완벽하게 적용해준다.
8월 19일 ComfyUI 업데이트로 추가된 전용 노드들 덕분에, 이제 복잡한 설정 없이도 바로 사용할 수 있게 되었다. 특히 GGUF 포맷을 지원해서 일반 사용자들도 부담 없이 로컬에서 돌릴 수 있다는 점이 가장 큰 매력일 것이다.
내 테스트 환경: RTX 5070Ti로 도전해보다
내 PC 사양부터 공개하겠다:
- GPU: RTX 5070Ti 16GB
- RAM: 64GB
- ComfyUI: 8월 19일 최신 업데이트 버전
"16GB 그래픽카드면 충분할까?" 하는 걱정이 앞섰는데, 결론부터 말하면 Q8 GGUF 모델도 무리 없이 돌아간다. 물론 Q4나 Q5에 비해서는 VRAM을 더 많이 사용하지만, 16GB면 사용 가능한 수준이다.
ComfyUI 워크플로우 구성의 핵심
제공된 JSON 워크플로우를 기반으로 제 환경에 맞게 수정했다. 핵심 노드 구성은 다음과 같다:
- UnetLoaderGGUF: Qwen_Image_Edit-Q8_0.gguf 로드
- CLIPLoaderGGUF: Qwen2.5-VL-7B-Instruct-Q8_0.gguf 로드
- TextEncodeQwenImageEdit: 프롬프트 입력과 이미지 연결(ComfyUI 0.3.50으로 업데이트 필요)
- KSampler: 이미지 생성 (Steps: 8, CFG: 1.5, 이건 Qwen Image Lightning 8steps lora를 사용했기 때문)
가장 중요한 건 TextEncodeQwenImageEdit 노드를 두 개 사용한다는 점입니다. 하나는 포지티브 프롬프트용, 다른 하나는 네거티브 프롬프트용으로 설정해야 한다.
GGUF 모델별 성능 비교: Q4 vs Q5 vs Q8
이제 가장 궁금한 부분, 실제 성능 비교 결과를 공유하겠다.
Q4 GGUF (약 12.7GB)
- 장점: 빠른 로딩, 적은 VRAM 사용량
- 단점: 디테일 표현력 부족, 가끔 프롬프트 무시
- 체감 품질: 70점
예를 들어, 동일한 "베어를 우주인으로 변신" 프롬프트로 테스트했을 때, Q4는 우주인 복장은 만들지 못하고, 다른 포즈를 만들어냈다.
Q5 GGUF (약 14.5GB)
- 장점: Q4보다 개선된 품질, 여전히 빠름
- 단점: 복잡한 프롬프트에서 일부 요소 누락
- 체감 품질: 80점
Q4보다는 나아졌지만, 여전히 아쉬운 부분들이 보였다. 가끔 프롬프트를 제대로 반영하지 못했다. 예를 들어, 오른손 왼손 등을 캐릭터의 입장이 아니라 화면을 보는 상태에서 선택했다.
Q8 GGUF (약 21.2GB)
- 장점: 거의 완벽한 프롬프트 이해, 높은 디테일
- 단점: 상대적으로 느린 로딩, 높은 VRAM 사용량
- 체감 품질: 95점
Q8이 진짜였다. 같은 프롬프트로도 드레스의 주름, 우아한 포즈, 팔의 자연스러운 동작까지 모든 요소를 완벽하게 표현해냈다. 큰 기대를 안했는데, 프롬프트 내용을 거의 모두 잘 반영했다.
베어 캐릭터 변신 프로젝트: 8가지 직업 도전기
일단 Hugging Face에서 제공한 베어 이미지를 사용해서 8가지 직업으로 변신시켜봤다. 실제 설치한 ComfyUI Qwen Image Edit 사용기가 동일하게 작동하는지 파악할 수 있다고 봤기 때문이다.
적용한 프롬프트와 실제 생성된 이미지(Q8 결과)
1. 화가 베어
프롬프트: "Add a colorful art board and paintbrush in the bear's hands. position the bear standing in front of the art board as if painting."
2. 요리사 베어
프롬프트: "Add a silver spatula in the bear's right hand. place a few vegetables like carrot, onion, green pepper. and spice bottles near the bear's left side. keep the white background unchanged"
3. 기타리스트 베어
프롬프트: "Add a brown acoustic guitar in the bear's arms. positioned horizontally across its lap, with fingers gently plucking the strings: keep the bear's posture seated on the ground. facing forward. wearing the same white T-shirt with Qwen's logo"
4. 마술사 베어
프롬프트: "This bear is wearing a tuxedo, a magician's hat, and holding a magic wand, performing a magic trick gesture."
5. 농구선수 베어
프롬프트: "This bear is wearing sportswear, holding a basketball, and bending one leg."
6. 정원사 베어
프롬프트: "Add a straw hat on the bear's head. hold a watering can in right hand and a small shovel in left hand. standing in front of a small plant being watered or planted."
7. 우주인 베어
프롬프트: "This bear is wearing a spacesuit and pointing towards the distance."
8. 댄서 베어
프롬프트: "This bear is wearing an elaborate dance dress, with arms spread open, performing an elegant dancing pose"
생각보다 어려웠던 변신
정원사 베어가 의외로 까다로웠다.
"in right hand, in its left hand" 표현을 정확히 이해하지 못하는 것 같아, 단순하게 표현하니 원하는 이미지를 잘 생성했다.
실전 팁: ComfyUI에서 더 나은 결과 얻기
어제 하루 Qwen Image Edit를 사용하면서 터득한 노하우들을 공유한다:
- SLAYER를 LOVER로 바꾸기 :
- 사진을 라인 이미지 또는 유화 이미지로 바꾸기 :
- 옆 얼굴을 앞 얼굴로 바꾸기 :
1. 프롬프트 작성 팁
- 이해하기 쉬운 단어를 사용하면 더 잘 표현한다
- 색상과 재질을 명시하면 훨씬 자연스럽다 ("silver spatula", "brown acoustic guitar")
- 배경 유지를 원한다면 "keep the white background unchanged" 추가
2. 최적 설정값 (Q8 기준)
- Steps: 8 (더 높여도 큰 차이 없음, Qwen Image Lightning 8steps Lora 사용)
- CFG Scale: 1.5 (너무 높으면 부자연스러워짐)
- Sampler: euler 추천
3. VRAM 최적화
RTX 5070Ti 16GB 기준으로 Q8 사용 시 약 13-15GB 사용한다. 여유롭게 사용하려면 다른 프로그램들을 종료하고 사용하자.
아직 아쉬운 점들
완벽해 보이는 Qwen Image Edit도 한계는 있다:
- 원본 이미지 크기가 작으면 프롬프트 적용이 어렵다 (이미지 크기를 적정 크기로 업스케일 필요)
- 객체 편집에 더 특화되어 있다고 생각한다.
마무리: 여러분 차례다
8월 19일 ComfyUI 업데이트 이후 하루 사용해본 Qwen Image Edit 사용기를 마무리하겠다.
솔직히 말해서, 이정도 품질의 이미지 편집을 로컬에서 무료로 할 수 있다는 게 신기하다.
특히 Q8 GGUF 모델의 완성도는 정말 놀랍다. 16GB 그래픽카드만 있다면 누구나 시도해볼 수 있는 접근성도 큰 장점이라고 생각한다.
여러분도 한번 도전해보자.
다음 글에서는 Qwen Image Edit를 활용한 실제 프로젝트 사례들을 더 자세히 다뤄볼 예정이다.
기대해 주시길!
관련 링크:
- Qwen Image Edit 공식 페이지: https://huggingface.co/Qwen/Qwen-Image-Edit
- ComfyUI 다운로드: https://github.com/comfyanonymous/ComfyUI
댓글 쓰기