用大模型吃瓜更智能了！阿里通义实验室提出新时间线总结框架，全面提升新闻总结效率

开放域和封闭域TLS都更高效了

原标题：用大模型吃瓜更智能了！阿里通义实验室提出新时间线总结框架，全面提升新闻总结效率
 文章来源：量子位
内容字数：8181字

阿里巴巴通义实验室与上海交通大学的研究人员提出了一种基于Agent的新闻时间线摘要新框架——CHRONOS，旨在帮助用户更方便地梳理复杂新闻的时间线。该框架模拟人类信息检索过程，通过迭代多轮自我提问，结合检索增强生成技术，从互联网上检索相关信息，生成时间顺序的新闻摘要。

时间线总结（TLS）任务旨在从大量文本中提取关键并按时间顺序排列。开放域TLS（从互联网检索信息）比封闭域TLS（从预定义文章中提取）更具挑战性，因为它需要强大的信息检索和筛选能力，以及在没有全局视图的情况下识别和建立之间联系的能力。

CHRONOS框架通过迭代提问进行相关检索，生成准确、全面的时间线摘要，有效解决了开放域和封闭域TLS任务。其核心模块包括：

为了优化提问过程，CHRONOS引入了“时序信息量”（CI）的概念，衡量模型提出的问题检索与参考时间线对齐的能力，从而选择更有价值的问题进行迭代。

研究团队构建了一个名为Open-TLS的新数据集，包含由专业记者撰写的关于近期新闻的时间线，涵盖、经济、社会、体育和科学技术等多个领域，为开放域TLS任务提供更全面的基准。

实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B进行，结果显示CHRONOS在开放域和封闭域TLS任务中均优于基线方法，在一些指标上达到SOTA效果。尤其在开放域，CHRONOS显著提高了总结质量和日期对齐准确性。在效率方面，CHRONOS也优于需要处理所有文章的基线方法。

通过苹果产品发布时间线的案例研究，展示了CHRONOS准确提取关键和日期的能力，并指出了一些需要改进的地方，例如对某些的遗漏或日期幻觉。

CHRONOS框架通过结合大型语言模型的迭代自我提问和检索增强生成技术，为时间线总结任务提供了一种新颖有效的解决方案。其模拟人类信息检索过程，通过不断提问和回答来深入理解，最终生成全面且连贯的时间线摘要。未来研究方向包括探索该迭代提问的检索生成方法在通用任务上的泛化能力。

文章来源：量子位
作者微信：
作者简介：追踪人工智能新趋势，关注科技行业新突破

暂无评论...