全面打破GPT-4垄断、DeepSeek打下训练成本…2024年大模型领域进展全复盘


2024年,我们居然进步这么大。

全面打破GPT-4垄断、DeepSeek打下训练成本…2024年大模型领域进展全复盘

原标题:全面打破GPT-4垄断、DeepSeek打下训练成本…2024年大模型领域进展全复盘
文章来源:机器之心
内容字数:24709字

2024年大型语言模型发展回顾:Simon Willison年度总结

本文总结了英国研究员Simon Willison对2024年大型语言模型LLM)发展趋势的精彩见解。文章指出,2024年是生成式AI大发展的一年,其发展速度之快令人惊叹。

1. GPT-4垄断的终结与多家模型崛起

2023年,GPT-4占据领先地位。但2024年,这一局面被彻底打破。多个公司和机构的模型在Chatbot Arena排行榜上超越了GPT-4,例如Google的Gemini系列AnthropicClaude系列等。这标志着LLM领域的竞争日益激烈。

2. 模型小型化与价格下降

令人瞩目的是,一些GPT-4级别的模型已经可以在笔记本电脑上运行,例如Qwen2.5-Coder-32B和Meta的Llama 3.3 70B。同时,由于竞争和效率提升,大模型服务的运行成本大幅下降,这极大地降低了使用门槛。

3. 多模态模型的兴起

多模态LLM成为2024年的另一大趋势。几乎所有主要的模型供应商都推出了支持图像、音频和视频输入的模型。语音和实时摄像头模式也从科幻小说变成了现实,极大地扩展了LLM的应用场景。

4. 一键生成应用的普及

通过简单的提示词即可生成完整的交互式应用程序,这在2024年变得非常普遍。Anthropic的Claude Artifacts、GitHub Spark等工具都体现了这一趋势,使得LLM的应用更加便捷。

5. 最佳模型的短暂免费时代与AI智能体的未来

在2024年的几个月里,顶级模型曾短暂地免费向公众开放,但这似乎已经成为过去。关于AI智能体,作者认为其定义模糊,实用性还有待提高,其发展可能依赖于通用人工智能的实现。

6. 评估的重要性与Apple Intelligence的不足

作者强调了自动化评估系统的重要性,这对于模型的快速迭代和优化至关重要。同时,作者也指出Apple Intelligence的表现令人失望,而苹果的MLX库却非常出色,为在非NVIDIA平台上运行LLM提供了便利。

7. 推理模型的崛起与中国模型的突破

新兴的“推理”模型,例如OpenAI的o1和o3,以及谷歌、阿里巴巴等公司的类似模型,代表着LLM架构处理复杂问题能力的提升。DeepSeek v3作为目前最大的公开授权模型之一,其低廉的训练成本也令人印象深刻。

8. 环境影响的双面性

模型效率的提高降低了单个提示的能源消耗,但大型数据中心的建设仍然对环境造成巨大影响。这需要在技术进步和环境保护之间寻求平衡。

9. 合成训练数据的有效性

合成训练数据在LLM训练中发挥着越来越重要的作用,它可以有效地引导模型学习,并降低训练成本。

10. LLM易用性挑战与知识鸿沟

尽管LLM功能强大,但其使用门槛仍然很高,需要用户具备一定的专业知识。同时,公众对LLM的了解程度也存在巨大的差异,这需要更多努力来弥合知识鸿沟。

11. 对LLM的批评与展望

作者鼓励对LLM进行批判性思考,并强调需要在负责任地使用LLM的同时,最大限度地发挥其正面作用,避免其负面应用。

总而言之,2024年LLM领域取得了令人瞩目的进展,但同时也面临着诸多挑战。未来,如何在技术进步、环境保护和社会公平之间寻求平衡,将是LLM发展的重要课题。


联系作者

文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台

暂无评论

暂无评论...