“DeepSeek效应”仍在持续
原标题:让英伟达暴跌17%,特朗普“敲响警钟”,DeepSeek趁热打铁又上新模型!
文章来源:大数据文摘
内容字数:7184字
DeepSeek:搅动AI格局的中国力量
近日,中国AI公司DeepSeek及其大型语言模型R1和视觉模型Janus Pro 7B的发布,在全球AI领域引发巨大震动。其开源共享和极具性价比的优势,让DeepSeek迅速成为焦点,甚至导致部分美国科技股大幅下跌,其中英伟达市值一日蒸发近6000亿美元。
R1与Janus Pro 7B:技术突破与开源策略
R1大型语言模型:凭借开源共享和高性价比,R1对美国AI的领先地位构成挑战,引发投资者重新评估AI竞争格局。
Janus Pro 7B视觉模型:作为DeepSeek进军多模态领域的关键一步,Janus Pro 7B是一个全新的自回归框架,兼具理解与生成能力。它采用单一、统一的Transformer架构,通过视觉编码解耦克服了以往方法的局限,在图像生成、视觉问答和图像字幕等任务中表现出色。其高效性降低了企业部署高级视觉AI的门槛。
技术优势:Janus Pro 7B在性能上与一些规模巨大、资源密集型模型相当甚至更优,同时消耗的计算资源更少。虽然图像分辨率限制在384×384,但图像质量高,细节丰富。
开源策略:R1和Janus Pro 7B的开源性质进一步放大了DeepSeek的颠覆性影响,降低了开发者使用高级AI的门槛,加剧了美国AI公司的竞争压力。
苹果M系列芯片的意外受益
DeepSeek的模型在苹果M系列芯片上的出色运行效果,意外地成为苹果在AI赛道上的一个亮点。苹果M2 Ultra和即将推出的M4 Ultra芯片,凭借其统一内存和UltraFusion技术,在性价比上优于NVIDIA H100和AMD MI300X等高端GPU,为开发者提供了运行DeepSeek模型的更经济的选择,也让“居家AGI”成为可能。 多个苹果设备集群运行大型模型的案例,进一步印证了这一优势。
美国回应:警钟与辩论
DeepSeek的崛起引发了美国和科技界的关注。美国总统特朗普认为DeepSeek的成功应该给美国科技公司敲响警钟。 关于美国对高性能半导体出口中国的管制措施的有效性,以及美国AI未来发展方向的讨论也日益激烈。 一些人认为管制依然有效,因为DeepSeek的成功仍然依赖于先进芯片,而另一些人则认为需要进一步加强监管。
总结
DeepSeek的崛起标志着中国AI力量的快速崛起,其开源策略和高性价比优势对全球AI格局产生了深远影响。 这不仅促使美国AI公司重新审视自身策略,也为全球AI发展带来了新的可能性。 未来,DeepSeek能否持续保持创新势头,以及美国AI公司如何应对这一挑战,都将是值得关注的焦点。
联系作者
文章来源:大数据文摘
作者微信:
作者简介:普及数据思维,传播数据文化