推理能力 | 86AIGC导航

原标题：震惊AI界！DeepSeek-R1：纯RL打造推理王者，AI自主学习里程碑「技术报告解读」文章来源：人工智能学家内容字数：9733字DeepSeek-R1：强化学习引领大语言模型推理能力本文总……

2个月前

谷歌DeepMind洞见逆向的力量原标题：人会逆向思维，LLM也可以？DeepMind研究表明还能提升推理能力文章来源：机器之心内容字数：4805字逆向思维在大型语言模型中的应用根据北卡罗来……

3个月前

为了使大型语言模型（LLMs）能够进行反向思考，我们提出了逆向增强思考（REVTHINK），一个由数据增强和学习目标组成的框架。在REVTHINK中，通过从教师模型收集结构化的正向-逆向推……

4个月前

为了使大型语言模型（LLMs）能够进行反向思考，我们提出了逆向增强思考（REVTHINK），一个由数据增强和学习目标组成的框架。在REVTHINK中，通过从教师模型收集结构化的正向-逆向推……

4个月前

AICAT ─ 全球3000+优质AI工具盘点，热门AI教程推荐