AI 이미지 생성 gtx1650 vs 780m

5년전에 조립했던 부모님 PC가 다시 제 손으로 돌아왔습니다.

gtx1650이면 780m 보다 얼마나 더 빨리 이미지 생성이 가능 할까 라는 생각에 빈SSD에 윈도우를 새로 깔고 돌려봤습니다.

네 287초(약 4분 47초)가 나왔습니다…

그 워크 플로 그대로 780m으로 가서 돌려봤더니 127초 (2분 7초)가 나왔습니다.

아니 아니 780m이 1650 보다 두배나 빠르다고??? 뭔가 이상한데??? ComfyUI 버그인가??? 그래서 webui, forge, 깔아보고 돌려봤는데 맞습니다. 워크플로랑 100% 동일조건은 아니지만 대충 4분대가 나옵니다.

한참 삽질하다가 두배나 느려지는 원인으로 추정되는 것을 찾긴 했습니다.

780m은 모델 가중치 데이터 타입이 fp16으로 돌아가는데

gtx1650은 fp32로 돌아갑니다.

인터넷 검색해서 어디선가 본걸론 저게 낮을 수록 정밀도는 떨어지지만 속도와 vram 사용량은 줄어든다고 합니다.

하지만 이미지 생성용으론 크게 차이가 없어서 학습용으론 32를 쓰지만 생성용으론 최대한 낮은걸 쓴다고 합니다. 앞에 float8_e4m3fn 이라고 뜬건 제가 옵션으로 fp8 설정한거 때문입니다. (근데 16, 32로 나오는거 보면 780m도 fp16이 최대인듯, 이번에 출시하는 rtx5000번대는 fp4 까지 지원한다고 합니다)

딥락갤 게임 돌려보면 780m 보다 gtx1650이 대충 체감으론 20~30% 정도 더 안정적으로 프레임 뽑아줘서 게임 하기엔 더 좋습니다.

암튼.. 돌아온 1650 가지고 이미지 생성기 굴리는데 쓸려고 했던 계획이 박살났네요. 그냥 780m이나 빡세게 굴려야 겠습니다.

애니마진 4.0이 나왔길래 돌려봤습니다. noobai 나오고 애니마진도 끝이구나 했는데 아니였습니다.

cocoIllustriousNoobai_v55_[92d1b10847] 모델을 사용해서 뽑은 프리렌.

이 모델이 로라 잘 먹는다고 해서 써보는데 솔직히 비슷한거 같습니다. (내가 썼던 로라가 잘 만들어진걸지도)

나구리 스타일 이라는 그림체 로라를 사용하니 위 프리렌 그림체가 이렇게 변합니다.

익스플로전을 날리는 메구밍과.. 그녀를 막으러 미래(?)에서 온 메구밍

블루아카이브 모모이.

내가 이 게임을 하는건 아닌데 그냥 귀여워서 뽑아봄.

뽑는김에 한 세트로 뽑는다고 트리거 프롬만 바꿔서 뽑았는데…

CIVITAI에 업로드 했다가 블럭 당했음.

내가 이 겜을 안해서 모르겠는데 얘네들 원래 대충 이렇게 생긴거 아니였어????

암튼 세트로 뽑은거 civitai엔 못올리니 여기에나 올려야지.

아.. 그러고 보니 똑같은 이미지 뽑을때 1650이랑 780m이랑 vram 사용량 차이가 있습니다.

780m이 두배 더 먹는데요. 이거 왜 그럴까 곰곰히 생각해보고 내린 결론은 zluda가 nvidia cuda 를 에뮬레이팅 해서 처리하는데 이미지 생성툴은 nvidia가 붙은거라 생각하고 vram 필요한 만큼 잡아먹고 zluda는 그거 처리 하는데 그만큼 더 먹어서 두배가 되는거라 생각 됩니다.

그거 보니 4060 8기가 사도 이미지 뽑는덴 충분할거 같다는 생각이 들긴 합니다.

암튼… 뭐 그렇다고요.


Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다