大模型的现状与未来挑战
近日,Business Insider采访了12位人工智能领域的专家,探讨了当前大模型的发展瓶颈及未来的可能方向。尽管业内一些领导者如OpenAI的CEO Altman坚称技术仍在进步,但不少观察人士却认为,随着技术成熟,模型的效能提升已显乏力,面临诸多新挑战。
数据与计算能力的瓶颈
研究人员指出,在大模型的预训练阶段,获取计算能力和训练数据是两大关键障碍。英伟达作为主要的GPU供应商,面临着高需求下的供给挑战。此外,随着可用的公共数据逐渐枯竭,研究公司Epoch AI预测到2028年可用文本数据可能会被完全耗尽。
多模态与私有数据的探索
当公共数据面临瓶颈时,专家们建议利用多模态数据(如视觉与音频数据的结合)和私有数据。越来越多的公司与出版商签订协议,以获取受版权保护的信息资源,发掘私人数据的潜力,成为提升模型能力的新路径。
合成数据的潜力与局限
提升模型训练数据的质量成为研究热点。专家们认为,合成数据可能是一个有效的工具,但并非解决所有问题的灵丹妙药。有效的应用需要人类的监督,以确保合成数据的相关性及有效性。
推理模型的新方向
除了训练数据的提升,构建高效的推理模型也成为行业关注的重点。通过延长模型响应时间以进行更复杂的推理,可能成为新的发展方向。OpenAI的新推理模型o1表明,推理能力的提高或许比单纯扩大模型规模更为重要。
行业未来预期与投资者的耐心考验
专家们普遍认为,未来行业的进步可能会放缓,但这并不意味着技术的瓶颈。投资者和客户是否愿意耐心等待行业的渐进式发展,将在很大程度上影响未来的投资和技术创新。
总的来说,虽然大模型的快速发展似乎已遇到瓶颈,但通过多模态数据、私有数据和推理模型等新策略,行业仍然有潜力在不同方向上取得突破。
联系作者
文章来源:新智元
作者微信:
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。