一家隐形AI巨头的大模型之路。
原标题:DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿
文章来源:Founder Park
内容字数:23366字
DeepSeek:中国大模型领域的“异类”
本文讲述了DeepSeek这家中国AI公司,如何在激烈的市场竞争中另辟蹊径,以其独特的开源路线和对原创创新的坚持,迅速崛起并获得国际关注的故事。
价格战的意外参与者
DeepSeek V2的发布意外引发了中国大模型领域的价格战,并非DeepSeek有意为之,而是其基于成本的合理定价策略,触发了大厂的跟进。DeepSeek强调其降价并非为了抢占用户,而是为了推动AI普惠化,以及其在模型结构创新上降低了成本。
原创创新,而非简单模仿
DeepSeek选择从模型结构入手进行创新,而非简单复制Llama模型,这与国内大部分公司选择快速商业化的路径截然不同。DeepSeek认为,中国AI应逐步成为全球创新的贡献者,而非仅仅是应用的跟随者,而这种选择在中国语境下显得尤为“奢侈”。
护城河在于团队和文化
DeepSeek选择开源其模型,其护城河并非依靠闭源技术,而是其在团队建设和企业文化上的积累。通过开源、发表论文,DeepSeek积累了宝贵的经验和人才,并形成了独特的创新文化,吸引了更多人才加入。
量化基金的AGI探索
DeepSeek母公司幻方是一家量化基金,其研发大模型并非为了直接服务于金融业务,而是为了探索通用人工智能(AGI)。DeepSeek专注于AGI基础研究,暂不考虑商业化应用,并拥有充足的研发预算支持其长期投入。
万卡储备源于对AI能力边界的探索
DeepSeek早在2021年就储备了万张A100显卡,这并非基于商业逻辑的预判,而是源于团队对AI能力边界的好奇心驱使。DeepSeek认为对算力的渴求是研究人员的本能,而大规模实验才能推动技术突破。
本土人才成就DeepSeek V2
DeepSeek V2模型的研发团队全部由中国本土人才组成,这体现了DeepSeek对培养本土人才的信心。团队的创新也源于自下而上的探索,而非自上而下的指令,这与DeepSeek灵活的组织架构密不可分。
长期主义与开源的坚持
DeepSeek坚持开源路线,并专注于基础模型研究,暂不考虑闭源或商业化应用。他们认为,建立强大的技术生态比短期利益更重要,并希望更多人能够低成本地使用大模型技术。
好奇心驱动的疯狂
DeepSeek的成功源于团队对AI技术的好奇心和对创新的热情。这种“疯狂”的投入和坚持,并非单纯的商业行为,而是对技术理想的追求。DeepSeek相信,只有持续的投入和探索,才能推动AGI的实现。
总而言之,DeepSeek的故事展现了中国AI领域一种另类的发展模式,即坚持原创创新,不盲目追求商业化,以长期主义的视角投入基础研究,最终在国际舞台上获得认可。这对于中国AI行业的发展,具有重要的启示意义。
联系作者
文章来源:Founder Park
作者微信:
作者简介:来自极客公园,专注与科技创业者聊「真问题」。