2000亿参数大模型直接在办公桌上跑
原标题:老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了
文章来源:量子位
内容字数:6246字
NVIDIA CES 2024 重磅发布:RTX 50系列GPU、全球最小个人AI超级计算机Project DIGITS等
1. **开头:** 在刚刚结束的CES 2024上,NVIDIA CEO黄仁勋以一身全新皮衣亮相,带来了一系列令人瞩目的新品发布,涵盖GPU、AI超级计算机以及AI模型服务等多个领域,再次展现了其在AI领域的领导地位。
1. RTX 50系列GPU强势登场
NVIDIA发布了基于Blackwell架构的最新GPU——RTX 50系列,包括RTX 5090、RTX 5080、RTX 5070 Ti和RTX 5070。该系列GPU拥有高达920亿个晶体管,性能大幅提升,在AI运算、光线追踪和着色器性能方面均有显著进步。价格方面,RTX 5090售价1999美元,RTX 5080售价999美元,RTX 5070 Ti售价749美元,RTX 5070售价549美元。
2. NVLink 72互联技术再升级
Blackwell架构的关键互联技术NVLink 72也同步发布,其72个Blackwell GPU具备1.4 ExaFLOPS TE FP4计算能力,晶体管数量达到惊人的130万亿个。该技术拥有极高的带宽和连接能力,为大型AI计算提供了强有力的支持。
3. 全球最小个人AI超级计算机:Project DIGITS
NVIDIA发布了全球最小个人AI超级计算机——Project DIGITS,它能够在桌面系统上运行2000亿参数的大模型,两台联合使用则可运行4050亿参数的大模型。Project DIGITS搭载了全新的Grace Blackwell超级芯片(GB10),拥有128GB统一相干内存和高达4TB的NVMe存储,并将于今年5月份开始提供,起售价为3000美元。其关键在于GB10芯片,该芯片由NVIDIA和联发科共同研发,结合了NVIDIA Blackwell GPU和高性能NVIDIA Grace CPU,在FP4精度下可提供高达1千万亿次浮点运算的AI性能。
4. 开源商用世界基础模型:Cosmos
NVIDIA开源了允许商用的世界基础模型Cosmos。Cosmos包含用于生成物理世界合成数据的模型,以及用于加速视频处理的管道。该模型在2000万小时的驾驶和机器人视频数据上训练而成,主要用于加速自动驾驶和下一代机器人训练研发。Cosmos提供Nano、Super和Ultra三种不同规模的模型,以满足不同用户的需求。目前,包括丰田、Uber、小鹏、比亚迪等多家公司已成为Cosmos的首批试用者。
5. 全新AI模型服务:NIM微服务和AI蓝图
NVIDIA发布了两个新的AI模型服务:NIM微服务和AI蓝图。NIM微服务允许用户轻松访问和部署最新的生成式AI模型,并已推出Llama Nemotron和Cosmos Nemotron两个大模型,分别专注于大型语言模型和视觉语言模型。AI蓝图则基于NIM微服务构建,提供预配置参考工作流程,例如PDF转播客、3D引导生成式AI等。
6. **结尾:** NVIDIA在本次CES上推出的系列产品,展现了其在GPU、AI超级计算机和AI模型服务领域的全面实力,也预示着AI技术将进一步融入到各个行业和应用中,为各行各业带来变革性的影响。 NVIDIA股价在发布会之前也创下历史新高,进一步印证了市场对其技术的认可。
联系作者
文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破