用大模型吃瓜更智能了!阿里通义实验室提出新时间线总结框架,全面提升新闻总结效率

AI快讯 2个月前 atcat
0 0

开放域和封闭域TLS都更高效

用大模型吃瓜更智能了!阿里通义实验室提出新时间线总结框架,全面提升新闻总结效率

原标题:用大模型吃瓜更智能了!阿里通义实验室提出新时间线总结框架全面提升新闻总结效率
文章来源:量子
内容字数:8181字

阿里巴巴和上海交大提出CHRONOS框架:AI帮你梳理新闻时间线

阿里巴巴通义实验室与上海交通大学的研究人员提出了一种基于Agent的新闻时间线摘要新框架——CHRONOS,旨在帮助用户更方便地梳理复杂新闻的时间线。该框架模拟人类信息检索过程,通过迭代多轮自我提问,结合检索增强生成技术,从互联网上检索相关信息,生成时间顺序的新闻摘要。

1. 开放域时间线总结的挑战

时间线总结(TLS)任务旨在从大量文本中提取关键并按时间顺序排列。开放域TLS(从互联网检索信息)比封闭域TLS(从预定义文章中提取)更具挑战性,因为它需要强大的信息检索和筛选能力,以及在没有全局视图的情况下识别和建立之间联系的能力。

2. CHRONOS框架:迭代检索,精准总结

CHRONOS框架通过迭代提问进行相关检索,生成准确、全面的时间线摘要,有效解决了开放域和封闭域TLS任务。其核心模块包括:

  1. 自我提问 (Self-Questioning):初始阶段使用目标新闻标题进行搜索,收集初步信息,然后迭代提问,检索更多相关新闻。
  2. 问题改写 (Question Rewriting):将复杂问题分解为更具体、更易检索的子问题,提高搜索效率。
  3. 时间线生成 (Timeline Generation):合并每一轮检索生成的时间线,总结重要。

为了优化提问过程,CHRONOS引入了“时序信息量”(CI)的概念,衡量模型提出的问题检索与参考时间线对齐的能力,从而选择更有价值的问题进行迭代。

3. 全新数据集Open-TLS

研究团队构建了一个名为Open-TLS的新数据集,包含由专业记者撰写的关于近期新闻的时间线,涵盖、经济、社会、体育和科学技术等多个领域,为开放域TLS任务提供更全面的基准。

4. 实验结果与分析

实验基于GPT-3.5-Turbo、GPT-4和Qwen2.5-72B进行,结果显示CHRONOS在开放域和封闭域TLS任务中均优于基线方法,在一些指标上达到SOTA效果。尤其在开放域,CHRONOS显著提高了总结质量和日期对齐准确性。在效率方面,CHRONOS也优于需要处理所有文章的基线方法。

5. 案例研究:苹果产品发布时间线

通过苹果产品发布时间线的案例研究,展示了CHRONOS准确提取关键和日期的能力,并指出了一些需要改进的地方,例如对某些的遗漏或日期幻觉。

6. 结论

CHRONOS框架通过结合大型语言模型的迭代自我提问和检索增强生成技术,为时间线总结任务提供了一种新颖有效的解决方案。其模拟人类信息检索过程,通过不断提问和回答来深入理解,最终生成全面且连贯的时间线摘要。 未来研究方向包括探索该迭代提问的检索生成方法在通用任务上的泛化能力。


联系作者

文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破

暂无评论

暂无评论...