AI算法画蜜斯姐AMD显卡比顶级CPU快30倍!AMD Radeon显卡Stable Diffusion AI画图体验测试_显卡_显存
如果要自己在本地支配基于DirectML的Stable Diffusion话,比较便捷的基于CUDA的WEB UI支配要相对繁芜一些,不过现在网上已经有比较成熟的整合包供玩家适用,玩家们只须要***相应的整合包,就能一键实现在本地的傻瓜式安装支配,可以为大家节省相称多的韶光。
▲我们选择用于测试的这个整合包安装完毕之后,自动进入AMD GPU加速打算模式,在本地开启http://127.0.0.1:7860即可打开本地Stable Diffusion的AI画图界面。
▲在本地WEB UI界面上可以自由设置干系的AI艺术图天生参数,点击“天生”即可开始画图。详细请参考线上干系教程,在此我们不赘述。
那么,基于DirectML的Stable Diffusion支配分支能不能实现对AMD显卡的硬件打算加速支持呢?它的效率到底如何?在此前A卡玩家常常只能在Linux系统下运行Stable Diffusion,通过ROCM(Radeon Open Compute)仿照CUDA加速,如今在Windows系统下直接实现A卡的AI加速打算,能否达到我们的预期目标呢?为此,我们选择了AMD Radeon RX 5000系、RX 6000系以及RX 7000系的数款显卡,进行了一番详细的体验。
体验平台
显卡:AMD Radeon RX 5500XT(8GB)、RX 5700(8GB)、RX 6500XT 4GB、RX 6600(8GB)、RX 6700XT(12GB)、RX 6750XT(12GB)、RX 6800(16GB)、RX 6900XT(16GB)、RX 7900 XT(20GB)、RX 7900 XTX(24GB)
CPU:英特尔酷睿i9-13900K
主板:英特尔Z790
内存:DDR5 6000 16GB×2
SSD:AORUS NVMe PCIe SSD 2TB
操作系统:Windows 11 Pro 22H2
驱动程序:AMD Software Adrenalin Edition 23.4.3
通过测试,我们想知道:
AMD Radeon 5000系、6000系和7000系之间,在Stable Diffusion的AI画图算力上有多大差别?
比较传统的CPU AI打算加速,AMD GPU加速性能到底如何?
▲我们所采取的网络开源共享的支配方案可以精确实现AMD显卡的硬件加速打算,可以看到在图片天生的过程中GPU的占用率一贯保持在100%。
模型为Novel AI Final-runed(CKPT)
测试一:AI天生时尚美女在第一部分的测试中,我们通过关键词天生一个大眼的时尚美女小姐姐,还要有一定的照片感。关键词设置如下(部分引用自网络开源共享关键词):
lora:koreanDollLikeness_v15:0.6> , best quality, ultra high res, (photorealistic:1.4), 1woman, sleeveless white button shirt, black skirt, black choker, cute, (Kpop idol), (aegyo sal:1), (platinum blonde hair:1), ((puffy eyes)), looking at viewer, full body, facing front,fashion,premium
分辨率设置:512×512
采样步进:20
提示词勾引系数:7
天生批次-每批数量:1-1、4-1
在测试中由于绝大部分显卡都拥有8GB以上的显存,因此我们在运行参数上基本设置了正常的高显存默认模式,只有4GB显存版的RX 6500XT运行时采取了添加了--lowvram的低显存运行模式(否则就无法运行)。从整体测试结果来看,AMD从Radeon RX 5000系到RX 7000系的显卡险些都很好地实现了Stable Diffusion运用的AI打算加速性能,尤其是Radeon RX 7000系显卡性能比较RX 6000系显卡有了巨大的提升。比如RX 6900XT在该设置与模型算法下的图片天生率约为8.87张/秒,而RX 7900 XT则可以达到15.76张/秒,性能提升靠近100%。
而比较CPU来说,全系AMD显卡都霸占非常明显的上风,RX 7900 XT的性能达到了酷睿i9-13900K的30倍旁边,纵然前两代的入门级显卡RX 5500XT,性能上也险些靠近酷睿i9-13900K的5倍。
唯一有点非常的是RX 6500XT,按照核心规格来看,它该当是要强于RX 5500XT的,不过由于显存配置仅为4GB,因此在测试中开启了低显存运行模式之后,其图片上天生速率受到了极大影响,远低于GPU加速的正常表现,仅能达到略高于CPU打算的水准。
测试二:AI天生较为繁芜的水边别墅风景照在接下来的测试中,我们用一系列相对繁芜的关键词来天生一座位于水边的别墅,同时还伴有阳光、波纹、倒影等效果哀求。关键词如下:
‘beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k,’
分辨率设置:512×512
采样步进:50
提示词勾引系数:7.5
天生批次-每批数量:1-1、2-1、4-1
这部分的测试结果与前一测试基本保持了同等性。仍旧是RX 7000系显卡在性能上独占鳌头,相对付RX 6000系显卡的对位提升在100%旁边,与CPU的打算性能比较,GPU加速打算的性能提升仍旧非常显著,RX 7900 XT的性能达到了酷睿i9-13900K的30倍旁边,入门级显卡RX 5500XT,性能上也险些靠近酷睿i9-13900K的5倍。
4GB显存配置RX 6500XT由于仅能在低显存模式下运行,因此图片上天生速率还是受到了极大影响,远低于GPU加速的正常表现,大致与酷睿i9-13900K相称。
写在末了这是一次大略但却比较有趣的测试,通过这次体验,我们认为有几点参考见地可以总结给玩家们参考:
1.当前AMD显卡已经可以通过开源的支配方案实现在Windows系统下的Stable Diffusion AI打算加速,而且网上也有许多的傻瓜式整合包,感兴趣的玩家完备可以一试;
2.从测试结果来看,AMD显卡在Stable Diffusion的AI图片天生打算中能够发挥出远胜于CPU打算的性能增幅,利用GPU加速打算能带来事倍功半的效果;
3.从测试情形来看,测试中当渲染分辨率设置超过512时(如768×768),就会涌现爆显存的情形,这与支配方案和模型有一定关系,但也反响了在正常模式下运行时,8GB显存险些是Stable Diffusion的硬性入门哀求。如果显存低于8GB,纵然在512×512分辨率下渲染,也会涌现显存不敷的情形,此时就不得不采取--lowvram的低显存运行方案,但会极大地拖累打算速率,如测试中的RX 6500XT 4GB。以是要想畅玩Stable Diffusion,我们建议显卡的显存为8GB或更高为佳;
4.从整体结果来看,我们认为AMD GPU还有极大的算法优化空间,凭不可靠履历判断,从RX 7900 XTX到酷睿i9-13900K的性能差距还不敷够大。这和我们支配的算法方案以及模型都有一定关系,也希望各社区的程序员们能开拓出更多更精良的针对AMD显卡的打算加速方案。
不管如何,AMD显卡对Stable Diffusion的硬件加速打算性能已经得到了展现,效果也比较明显,对AMD显卡用户来说毫无疑问是利好的福音,剩下的便是玩家与AMD须要坚持的连续优化之路了。
本文系作者个人观点,不代表本站立场,转载请注明出处!