显卡是个人计算机基础的组成部分之一,将计算机系统需要的显示信息进行转换驱动显示器,并向显示器提供逐行或隔行扫描信号,控制显示器的正确显示,是连接显示器和个人计算机主板的重要组件,是“人机”的重要设备之一,其内置的并行计算能力现阶段也用于深度学习等运算。 内容 最近,我正在考虑将哪种图形卡用于AI培训。我不想太麻烦,但我也希望拥有强大的计算能力。 是否坚持使用游戏笔记本,台式计算机或云计算平台?我在Internet上检查了一些信息,并对其进行了整理,以方便将来进行比较和查询,以及为有需要的朋友提供一些便利。 对于图形卡的深度学习训练功能,我们不仅要关注其具有多少CUDA内核,还要关注其频率,视频内存,视频内存位宽等。更客观的指标是看一下它的单精度性能(FP3 2)性能有多少Tflops。 触发器的理论峰值: 单精度理论峰值= GPU芯片数* GPU Boost频率*内核数*单个时钟周期内可以处理的浮点计算的数量。 单精度理论峰值= FP32内核* GPU Boost Clock * 2。 笔记本图形卡: 人工智能大咖啡的性能比较: 云服务器显卡比较: 这是特定云服务器平台使用的图形卡参数的比较。 在NVIDIA网站上,您可以看到上述图形卡仍在许多云平台中使用。 MX450对抗GTX1650: 网页给出的索引显示,超频MX450的FP32计算能力已超过GTX1650。 GTX1650:128位宽,192GB / s带宽,896个流处理器,频率1350?1486MHZ,4G显存; MX450:64位宽和80GB / s带宽(支持PCIE 4. 0),896个流处理器,频率1395?1575MHz,2G视频内存; 实际上,MX450视频内存减少了一半。尽管流处理器的数量还不错,但是图形卡的位宽减少了一半,而视频内存的带宽也减少了一半。在某些情况下仍然存在差距。 新一代移动图形卡的性能比较: GeForce MX 450:896 * 1. 575GHz * 2 = 2. 8 TFlops GeForce RTX 3060:3840 * 1. 70GHz * 2 = 1 3. 1 TFlops GeForce RTX 3070:5120 * 1. 62GHz * 2 = 1 6. 6 TFlops GeForce RTX 3080:6144 * 1. 71GHz * 2 = 2 1. 0 TFlops RTX30系列台式机图形性能比较: GeForce RTX 3060:3584 * 1. 78GHz * 2 = 1 2. 8 TFlops GeForce RTX 3060Ti:4864 * 1. 67GHz * 2 = 1 6. 2 TFlops GeForce RTX 3070:5888 * 1. 73GHz * 2 = 2 0. 4 TFlops GeForce RTX 3080:8704 * 1. 71GHz * 2 = 2 9. 8 TFlops GeForce RTX 3090:10496 * 1. 7GHz * 2 = 3 5. 7 TFlops JD上报价的显卡基本上没有货,因此借用两张图片并记录价格。 许多商店都有商品,但价格相对较高。某商店技嘉/技嘉RTX3080 10G游戏显卡RTX3080 GAMING OC-10GD Magic Eagle,报价:¥ 1409 9. 00。 每个人都是自由的,坐在长凳上,经常看一下,慢慢地等待,有一天你可以买一个合适的! 摘要: 俗话说,买新的显卡而不是旧的显卡。新的架构更加高效,并且具有更多的计算能力。如您所见,MX450已经能够选出GTX1650。新的RTX30系列移动版本还可以与原始的Daniel Tesla V100和P40竞争。 在选择时,除了要选择哪张显卡外,它还具有多少个独立的视频内存,这还取决于显卡可以运行的最大频率。一些笔记本电脑会限制频率以控制散热问题,而某些游戏制造商将使用台式机图形卡来提高性能。这种游戏本的性能更强,但通常体积更大。 从我的角度来看,为了便于携带,可以使用全功能的RTX3060和较低频率的RTX3070。性能没有太大差异。如果频率很高,则散热是个问题,而且体积会更大。对于台式计算机,RTX3080更好。适当地,RTX3090的性能并没有增加太多,但是价格却要高得多。 徐老2021/3 / 17
|
温馨提示:喜欢本站的话,请收藏一下本站!