
780m은 시스템 메모리에서 vram을 할당 받아 쓰는 구조입니다.
그래서 굳이 vram을 16GB로 잡는거 보다 기본값인 3GB로 잡고 28GB를 가용메모리로 쓰는게 더 좋지 않을까 하는 생각에 테스트를 해봤습니다.
1girl, solo,
ayanami rei, neon genesis evangelion, anno hideaki,
red eyes, hair between eyes, blue hair, short hair, medium breasts,
white dress shirt,
upper body, from side,general,
masterpiece, best quality, good quality, newest, highres, absurdresNegative prompt:
lowres, worst quality, bad quality, bad anatomy, sketch, jpeg artifacts, signature, watermark, old, oldest,
bad hands, mutated hands, (public hair:1.2), Westerners, big Areola, watermark, navel, halo, (nipples:1.2),
panties, muscular,Steps: 25
Sampler: euler_ancestral
Schedule type: normal
CFG scale: 5.0
Size: 1024×1024
Model hash: cb576b9fc51850a7d9a4bceb2ca3cf9ea40a528a70eaf854ef9ea97d27b95694
Model: waiSHUFFLENOOB_vPred20
Denoising strength: 1.0
Clip skip: 2
사용한 조건은 위와 같습니다.
1. vram 16GB (–highvram 옵션 사용)

1번 : 시작 직후 생성할때 모델 로딩하는 구간이 있어서 96.7초가 나왔고
2번 : 로딩이 완료된 이후에는 동일조건 (시드만 변경) 생성시 70.07초가 걸리는걸 볼 수 있습니다.
3번 : 프롬프트에 smile 하나 더 추가 했는데 텍스트 인코더를 다시 돌리기 때문인지 약 2초 가량 시간이 추가 됬습니다.

GPU 사용량은 100%를 찍고 실제 vram 사용량은 9~11GB 사이 였습니다.
2. vram 3GB (–novram 옵션 사용)

예상과 달리 생성속도에 상당히 큰 차이가 났습니다.
1번 : 시작 직후 모델 로딩 하고 생성하는데 217.82초로 vram 할당 대비 약 2.25배 시간이 더 걸렸고
2번 : 로딩이 완료된 이후에는 동일조건 (시드만 변경) 생성시 108.84초로 vram 할당 대비 약 1.5배 느려졌습니다.
3번 : 역시 마찬가지로 smile 프롬프트 하나 더 추가 했는데 2번대비 30초나 느리네요.

실제 램 먹는건 비슷하게 먹는데 문제는 GPU 로드율이 100% 안찍어서 그런거 같습니다.
암튼… 느리니 역시 그냥 vram 16GB 할당해서 써야 겠네요.
답글 남기기