您好,欢迎访问利联科技官网!    24小时服务热线:400-161-0880    我们有最适合您的产品和最好的服务。登录  /  注册  /  旧平台入口

无锡BGP服务器的全新升级性能

 

相比其他的服务器,无锡BGP服务器使用TU104核心,搭载136亿个晶体管,共40个SM(stream multiprocessor),每个SM单

元中有64个CUDA Core和8个混合精度的矩阵运算单元Tensor Core,共2560个CUDA core和320个Tensor core,提供8.1 

TFLOPS的单精度性能和65 TFLOPS的混合精度(FP16/FP32)性能。此外,无锡BGP服务器中还集成了Turing架构首次引入的

RT Core,可实现高效的光线追踪(Ray Tracing)功能,在图形图像渲染方面有着广泛的应用。


无锡BGP服务器基于Turing架构,提供了更加强大的训练和推理能力,在原有对FP32和FP16支持的基础上,Turing架构中的

Tensor Core新增了对INT8和INT4的支持,并探索性地推出了INT1精度模式。通过对多种精度模式的支持,BGP服务器能够

有效缩短在线预测和离线训练时长。


作为全面升级的新一代服务器,无锡BGP服务器采用了最新的Turing架构,单卡提供8.1 TFLOPS的单精浮点计算能力和65 

TFLOPS的混合精度(FP16/FP32)矩阵计算能力。相比于其他产品,其整体性能有了较大的提升,在给定场景下,无锡BGP服

务器的推理性能提升超过350%。


及时响应是无锡BGP服务器提升用户参与度的关键,随着模型准确性和复杂性的提高,快速交付正确答案所需的计算能力也在

呈指数级提升。T4拥有先进的实时推理性能,在会话式人工智能、推荐系统和可视化搜索等场景的处理上,可提供低延时、

高吞吐量的计算能力,进而实时满足更多的处理请求。



无锡BGP服务器针对深度学习应用场景,进行了全方位的优化。首先,无锡BGP服务器能够为训练和推理场景中的矩阵运算

提供极大的加速,被广泛用于各种深度学习的场景中。Turing Tensor Core相对于先前的Volta版,强化了推理的功能,支

持了INT8和INT4两种精度模式,算力分别高达130TOPS和260TOPS。其次,无锡BGP服务器继承了Volta架构中首次引入

的Multi-Process Service(MPS)功能,优化了对batch较小时推理的性能,减少启动延迟,从而能够支持更多的并发请求。


作为国内领先的IDC综合服务提供商,利联科技提供包含无锡BGP服务器在内的多种服务器租用,立志成为客户最信任的IDC

综合服务提供商和互联网安全专家,详情可咨询网站客服。


您可能还会对下面的文章感兴趣: