切换到宽版
  • 466阅读
  • 1回复

[数码讨论]消费级显卡轻松跑AI,英伟达RTX领跑AI PC竞争[8P] [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
106009
金币
130
道行
19523
原创
29307
奖券
17205
斑龄
189
道券
10126
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 19943(小时)
注册时间: 2007-11-29
最后登录: 2024-11-10
— 本帖被 兵马大元帅 执行加亮操作(2024-05-16) —

AI PC的竞争,越来越火热了!
就连数据中心收入占比达到四分之三的英伟达,也用消费级的AI PC显卡领跑这场战斗。
换言之,老黄在做工业级“核弹”的同时,在RTX这样的消费级产品中,也要全力发展AI运算。

而且规模还不小,据介绍,RTX AI PC目前已成为拥有超过1亿用户和500款AI应用和游戏的生态。
在RTX AI PC的一场技术品鉴会中,量子位也体验到了英伟达AI算力在消费级显卡上的应用。
更高效地利用算力,需要软硬件配合
古语有云,“工欲善其事,必先利其器”,对于AI创作者而言,选择高性能的运算设备是无比重要的。
当然了,也并不是说就要直接上专业卡,对于单纯的创作来说,消费级的显卡已经足够。
吐司是一家大型在线生图的AI模型社区,提供了包括超16w+的模型 在内的AI 模型资源。
最近,吐司使用第三方测试软件UL Procyon AI基准,完整测试了英伟达RTX 40系列多款型号的显卡和笔记本电脑的生图能力。

相比于集成显卡,在同时开启两个厂商加速框架的情况下,笔记本版的4090在运行SD 1.5的UL Benchmark时,性能超出了27倍。

但做AI运算,单靠硬件性能是不够的,软件程序需要针对硬件特征做专门的优化,才能更高效地利用硬件资源,用相同的配置实现更高的推理速度。
比如英伟达的Tensor RT(简称TRT)加速框架,就起到了让模型更好适配显卡中的Tensor Core,从而实现更高运算性能的作用。
同样在吐司的测试当中,对于RTX 40系列的各种显卡,开启TRT前后,无论是运行SD1.5还是SDXL,每分钟生成图片的数量均有显著提升,其中4090D的SD 1.5生成速度达到了每秒54.55张图。

而如果改用StreamDiffusion,同时忽略硬盘读写带来的降速,在4090D上开启TRT,最快可达到每秒128张图。

在实际环境中,这个速度会被硬盘拖慢,最终的速度大约是每秒八张,但TRT依然是当下最快的Stable Diffusion加速方式。

不过需要说明的是,对于内容生成而言,单纯速度快并不等于直接的生产力提升。
那么,这样的速度优势又该如何利用起来呢?
速度不能直接变成生产力,还要与工作特点结合
要想把生成速度变为生产力,关键不仅在于技术,更在于与行业工作特点的充分结合。
比如在建筑行业,即致AI就基于扩散模型和蒸馏技术,通过RTX 4090 D GPU的加速,实现了秒级的AI实时绘画,实时将手绘草稿绘制成建筑效果图。

艾哎集瑟科技联合创始人、前沿建筑设计师言萧表示:
作为一名经常使用AI工具的建筑师,我对RTX平台的加速优势深有体会。
它极大提高了AI图形生成软件,特别是Stable Diffusion等工具的性能,在建筑设计的方案概念阶段尤为重要。
这种技术进步不仅提升了设计效率,也为建筑师提供更广阔的创作空间。
数字艺术家、策展人土豆人tudou_man是许多知名品牌的合作艺术家。他以将新锐的艺术方式,与AIGC技术极其自然的交融在一起,创作出了许多经典作品。
比如他用AI创造的麦当劳“传家宝”系列作品就曾在网络上刷屏,还获得了官方的转发。

他本人表示,RTX 40系列AI PC平台带来的运算加持,让人震惊之余,RTX平台为数字艺术家提供高效的AI算力加速。
AbleSlide联合创始人Blender艺术家AI创作者、Blender 艺术家、AI创作者Simon阿文,参与了今年春晚中AI视频的创作。
他还用AI创作了《花中维纳斯》系列作品,展现了一场视觉交响曲,通过AI的力量,静态图像被转化为一种动态体验,用自然的镜头见证了维纳斯的重生。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
99896
金币
1065636
道行
1950
原创
2145
奖券
2040
斑龄
27
道券
536
获奖
0
座驾
设备
摄影级
在线时间: 23729(小时)
注册时间: 2008-10-01
最后登录: 2024-11-10
只看该作者 沙发  发表于: 05-01
英伟达(NVIDIA)的RTX系列显卡因其在图形处理和实时 ray tracing 技术方面的先进性能而闻名,同时它们也在AI和深度学习领域表现出了强大的能力。消费级显卡,如NVIDIA GeForce RTX 20系列和30系列,都配备了专门的张量核心,这些核心可以加速AI模型的训练和推理过程。

随着AI技术的不断发展,越来越多的用户开始在个人计算机上进行AI相关的实验和项目。这就要求个人计算机的硬件配置能够满足AI计算的需求。英伟达的RTX显卡不仅在图形处理方面表现出色,而且其强大的计算能力也使得它成为AI PC的一个理想选择。

除了硬件性能外,英伟达还提供了一系列软件工具和库,如CUDA和TensorFlow,这些工具和库可以充分利用GPU的并行处理能力,进一步提高AI计算的效率。因此,英伟达的RTX显卡在AI PC的竞争中处于领跑地位。

然而,值得注意的是,尽管消费级显卡可以轻松运行许多AI应用程序,但对于一些非常大规模的深度学习模型来说,可能还是需要更专业的显卡,如NVIDIA的Tesla或Quadro系列。这些专业显卡通常拥有更多的内存和更高的计算能力,适合于数据中心和专业工作站环境。

总的来说,英伟达的RTX显卡在消费级市场中为AI应用提供了强大的支持,预示着未来个人计算机在AI领域的竞争力将持续增强。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个