취미 기록용 블로그

ComfyUI 옵션중 –novram, –highvram 실성능 차이

780m은 시스템 메모리에서 vram을 할당 받아 쓰는 구조입니다.

그래서 굳이 vram을 16GB로 잡는거 보다 기본값인 3GB로 잡고 28GB를 가용메모리로 쓰는게 더 좋지 않을까 하는 생각에 테스트를 해봤습니다.

1girl, solo,
ayanami rei, neon genesis evangelion, anno hideaki,
red eyes, hair between eyes, blue hair, short hair, medium breasts,
white dress shirt,
upper body, from side,

general,
masterpiece, best quality, good quality, newest, highres, absurdres

Negative prompt:
lowres, worst quality, bad quality, bad anatomy, sketch, jpeg artifacts, signature, watermark, old, oldest,
bad hands, mutated hands, (public hair:1.2), Westerners, big Areola, watermark, navel, halo, (nipples:1.2),
panties, muscular,

Steps: 25
Sampler: euler_ancestral
Schedule type: normal
CFG scale: 5.0
Size: 1024×1024
Model hash: cb576b9fc51850a7d9a4bceb2ca3cf9ea40a528a70eaf854ef9ea97d27b95694
Model: waiSHUFFLENOOB_vPred20
Denoising strength: 1.0
Clip skip: 2

사용한 조건은 위와 같습니다.

1. vram 16GB (–highvram 옵션 사용)

1번 : 시작 직후 생성할때 모델 로딩하는 구간이 있어서 96.7초가 나왔고

2번 : 로딩이 완료된 이후에는 동일조건 (시드만 변경) 생성시 70.07초가 걸리는걸 볼 수 있습니다.

3번 : 프롬프트에 smile 하나 더 추가 했는데 텍스트 인코더를 다시 돌리기 때문인지 약 2초 가량 시간이 추가 됬습니다.

GPU 사용량은 100%를 찍고 실제 vram 사용량은 9~11GB 사이 였습니다.

2. vram 3GB (–novram 옵션 사용)

예상과 달리 생성속도에 상당히 큰 차이가 났습니다.

1번 : 시작 직후 모델 로딩 하고 생성하는데 217.82초로 vram 할당 대비 약 2.25배 시간이 더 걸렸고

2번 : 로딩이 완료된 이후에는 동일조건 (시드만 변경) 생성시 108.84초로 vram 할당 대비 약 1.5배 느려졌습니다.

3번 : 역시 마찬가지로 smile 프롬프트 하나 더 추가 했는데 2번대비 30초나 느리네요.

실제 램 먹는건 비슷하게 먹는데 문제는 GPU 로드율이 100% 안찍어서 그런거 같습니다.

암튼… 느리니 역시 그냥 vram 16GB 할당해서 써야 겠네요.


Comments

답글 남기기

이메일 주소는 공개되지 않습니다. (이름과 이메일은 안써도 됩니다)

이 사이트는 Akismet을 사용하여 스팸을 줄입니다. 댓글 데이터가 어떻게 처리되는지 알아보세요.