Qwen 2.5 更新：推理速度猛增 4.3 倍，或将终结 RAG 时代

讯知在线 • 2024年11月20日上午3:44 • 财经 • 6 views

Qwen 2.5 更新：推理速度猛增 4.3 倍，或将终结 RAG 时代

国产大语言模型 Qwen 2.5 系列近期更新了 Qwen 2.5-Turbo，在支持超长上下文和性价比方面取得了重大进展。

超长上下文支持

Qwen 2.5-Turbo 扩展了上下文长度，从之前的 128k 扩展到 1M，相当于 100 万个英文单词或 150 万个汉字。这个长度相当于 10 部长篇小说、150 小时语音记录或 30000 行代码。

更快的推理速度

基于稀疏注意力机制，Qwen 2.5-Turbo 处理百万上下文时的首字返回时间从 4.9 分钟降低到了 68 秒，实现了 4.3 倍的加速。

高性价比

Qwen 2.5-Turbo 的定价为 0.3 元/1M tokens。这意味着，在相同成本下，Qwen 2.5-Turbo 可以处理的 token 数量是 GPT-4o-mini 的 3.6 倍。

应用场景

Qwen 2.5-Turbo 的超长上下文支持和快速推理速度使其在以下应用场景中具有优势：

* 快速理解长篇文档：Qwen 2.5-Turbo 可以一口气读完 3 本长篇小说（69 万个 token）并总结主要内容。

* 掌握代码库信息：Qwen 2.5-Turbo 可以迅速掌握一个包含 13.3 万个 token 的代码库，并准确输出各种细节。

* 论文分类和摘要：Qwen 2.5-Turbo 可以一口气读完 7 篇论文，并完成论文分类和摘要。

* 长文本任务：Qwen 2.5-Turbo 在 RULER、LV-Eval 和 LongBench-Chat 等基准测试中，在多个维度上超越了 GPT-4o-mini。

对现有模型的影响

Qwen 2.5-Turbo 的超长上下文支持和高性价比或将终结 RAG（Retrieve-Align-Generate）时代的到来。

RAG 是一种基于检索的语言模型，需要先从大规模语料库中检索相关信息，再将检索到的信息与上下文进行对齐，最后生成答案。

Qwen 2.5-Turbo 无需检索，可以直接处理百万级别的上下文，这使得 RAG 模型在长文本任务中的优势不再明显。

开源计划

阿里云通义开源负责人林俊旸表示，目前没有 Qwen 2.5-Turbo 的开源计划，但正在努力中。

原创文章，作者：讯知在线，如若转载，请注明出处：http://bbs.xzxci.cn/2024/11/20/19846.shtml

Like (0)

0 0

60岁后女性的力量训练指南：重拾活力，健康老去

Previous 2024年11月20日上午3:41

老挝旺阳旅游惊魂：两名澳大利亚女游客疑似甲醇中毒

Next 2024年11月20日上午3:47

财经

区分天然蜜蜡与二代蜜蜡：颜色变色的奥秘

区分天然蜜蜡与二代蜜蜡：颜色变色的奥秘天然蜜蜡与二代蜜蜡二代蜜蜡是由天然蜜蜡的边角料压制而成。成分相同，但因经过加工，价值低于天然蜜蜡。盘玩后变色二代蜜蜡与天然蜜蜡在盘玩后…

讯知在线
2024年12月2日
财经

郑州邮币卡交易中心位置大揭秘

郑州邮币卡交易中心位置大揭秘随着邮币卡收藏市场的持续升温，不少收藏爱好者涌入其中，但对于初入市场的藏友来说，寻找合适的邮币卡交易中心往往是首要难题。本文将为您全面揭秘郑州的两个主…

讯知在线
2024年12月3日
财经

烟紫色和田玉鉴假辨真之法

烟紫色和田玉鉴假辨真之法烟紫色和田玉，以其独特的色泽和质地备受青睐。然而，市场上假货横行，如何在林林总总的产品中鉴别真伪，成为消费者亟待解决的问题。一、了解烟紫色和田玉的特征 …

讯知在线
2024年11月20日
财经

袁大头值多少钱：历年成交价大揭秘

袁大头值多少钱：历年成交价大揭秘袁大头，作为民国时期的主要流通货币之一，深受收藏爱好者的青睐。其价值因版本、品相、市场行情等因素而异，历年拍卖成交价也呈现出波动趋势。民国3年版…

讯知在线
2024年12月6日
财经

琼瑶的最后嘱托：祝愿人间逍遥自在，活得潇洒自如

在琼瑶生命弥留之际，她留下了最后的嘱托，向人间传达出她对生命的感悟与祝愿。她希望人们不要为她的离去而悲伤，因为她已翩然离去，脱离了世间的枷锁，自由自在。琼瑶表示，死亡是每个人必经…

讯知在线
2024年12月5日
财经

她再向马斯克索薪未果，再次尝到失败滋味

特拉华州衡平法院的法官凯瑟琳·麦考密克再次驳回了埃隆·马斯克在 2018 年被授予的特斯拉薪酬计划。这笔价值高达1010亿美元的巨额报酬，自马斯克获得后就被提起诉讼，并于今年1月被…

讯知在线
2024年12月6日
财经

男子造谣杀人案，公安网安严厉打击

近期，多地出现男子造谣杀人案的相关事件，引起社会广泛关注。在临县，打击网络谣言专项行动开展以来，临县公安局高度重视对本地网络造谣行为的打击整治工作。7 月 28 日，网安大队在网络…

讯知在线
2024年12月13日
财经

李行亮与麦琳在《再见爱人 4》中下期和好，引发网友热议

近日，在真人秀节目《再见爱人 4》中，李行亮和麦琳的情感走向一直备受关注。此前，两人因种种矛盾陷入争执，关系一度紧张，婚姻危机引发热议。李行亮作为知名歌手，工作繁忙难以顾家，而麦琳…

讯知在线
2024年11月28日
财经

吴冠中画作《狮子林》拍得1.508亿元人民币

在2023年北京保利春拍现当代艺术夜场上，吴冠中先生1991年创作的《狮子林》油画作品以1.508亿元人民币（含佣金）的价格拍出，创下吴冠中个人作品拍卖纪录。《狮子林》创作于吴冠…

讯知在线
2024年11月28日
斗鱼短剧赋能青年影视，推动短剧生态繁荣

在福州举办的2024“一带一路”商协会大会青年影视创投论坛上，斗鱼联合人民阅读出品的文旅短剧《我的冠军指导》荣获“年度关注短剧”称号，彰显了斗鱼在赋能青年影视、推动短剧生态繁荣方面…

讯知在线
财经 2024年12月8日

发表回复