首页/号卡资讯

持续开源!中国联通对DeepSeek系列思维链模型进行“自适应慢思考”优化升级

2025-02-25 11:01:55号卡资讯197

日前,DeepSeek团队宣布将在“2月27日至3月3日”陆续开源5个代码库,这与中国联通一直秉持的开源普惠理念不谋而合。继中国联通于1月开源元景“自适应慢思考”思维链大模型后,又针对DeepSeek系列模型进行了“自适应慢思考”优化升级,现已开源,开源地址详见文末。这也是目前业界首个对DeepSeek系列思维链模型做“自适应慢思考”优化升级的工作。

DeepSeek官宣开源周

“以我为主,为我所用”的开放创新

元景思维链大模型具备多学科、多场景通用推理能力,且能在确保慢思考能力不打折的情况下,做到针对不同任务和难度的自适应慢思考,大幅降低了资源消耗,实现了大模型“慢思考”能力高性价比落地应用。

元景思维链大模型接入DeepSeek-R1并非简单的“拿来主义”,而是“从其善,优其不善”,对DeepSeek-R1版本进行了调整,最大程度规避了其面对简单问题“过度思考”的现象,使模型具备了“自适应”能力。即在面向难度较高问题时使用慢思考模式生成长思维链,面向简单问题时则倾向于生成简洁的思维链,迅速准确的输出相关答案。这样避免了答案的冗余、资源的浪费以及减少用户等待时间,提升用户体验。

调整步骤完整分享

难度自适应微调:为实现模型推理的难度自适应,中国联通利用DeepSeek-R1满血版模型采样生成数据,通过复杂度量化模块构造长度偏好数据集,对于简单问题从采样答案中挑选长度较短的答案,对困难问题挑选长度较长的答案,使得答案长度与当前问题复杂度相匹配。在此基础上对DeepSeek-R1进行微调,使得微调后的模型具备对不同难度题目的自适应慢思考能力。具体改造流程如下图所示。

自适应慢思考的DeepSeek-R1满血版模型训练流程图

二次蒸馏:针对DeepSeek-R1的系列蒸馏模型,由于其使用的蒸馏数据来自训练满血版R1时使用的训练数据,而非由性能更好的R1满血版自身生成的数据,这会导致得到的蒸馏模型未能充分学习R1满血版的能力,蒸馏效果大打折扣。为解决这个问题,中国联通使用了二次蒸馏的策略,即利用DeepSeek-R1满血版将已积累的高质量数据转化为包括深度思考过程的长思维链格式数据,在DeepSeek-R1蒸馏系列模型基础上再进行一次微调,使模型具备更强的推理能力。

难度自适应强化学习:在对模型进行二次蒸馏后,中国联通进一步借鉴DeepSeek-R1的构建思路,在GRPO算法基础上提出了一种难度自适应强化学习算法DA-GRPO(Difficulty Adaptive GRPO),对二次蒸馏模型进行难度自适应的强化学习训练,进一步提升其推理效果。除了使用传统的基于规则的正确性奖励、格式奖励、语言一致性奖励外,DA-GRPO还基于每个问题的复杂程度和生成答案的长度对奖励得分进行校准。具体而言,如果模型对一个简单问题输出较长的答案,则对奖励分数进行相应的惩罚。同时,若模型对困难的问题输出较长的答案,则给予其更高的奖励分数,以鼓励其进行更充分的思考。这样,通过提高样本答案奖励得分的区分度,使模型具备根据问题难度输出相应长度答案的能力,在保证推理准确率的前提下显著减少了答案冗余和资源消耗,从而实现对不同难度问题的自适应慢思考。

自适应慢思考的DeepSeek-R1蒸馏版模型训练流程图

推理计算量节省约30%!实测效果对比一览

中国联通以DeepSeek-R1-distill-32B模型为例,对上述方法的效果进行了验证。通过在数学任务测评集(MATH500)上对比以及具体实验可以看到,经过难度自适应改造后的模型在不同难度等级问题上生成的回答长度较原版均明显下降,并且对于最高难度(Level 5)输出的回答长度降幅最大,体现了模型对不同难度等级问题具备自适应慢思考能力。经过测评,这种创新的自适应慢思考方法,平均可节省约30%的推理计算量,冗余输出大幅减少,用户体验得到有效提升。

回答长度对比:原版DeepSeek-R1-distill-32B(浅蓝)vs自适应版(深蓝)

除了通过对DeepSeek-R1模型进行自适应慢思考优化升级外,中国联通还在紧锣密鼓推进对DeepSeek-R1系列模型的能力边界量化和安全价值观增强等相关工作的探索。未来,中国联通将持续与以DeepSeek为代表的先进开源模型深度融合,不断升级元景基础模型能力和MaaS平台功能,贯彻开源普惠理念,推进算力普惠、模型普惠、应用普惠,以先进数智水平赋能社会千行百业。

目前,自适应慢思考版的DeepSeek-R1-distill-32B已在GitHub、魔搭、始智等社区全面开源,地址如下:

GitHub:https://github.com/UnicomAI/Unichat-DeepSeek-R1-distill-32B

魔搭:https://www.modelscope.cn/UnicomAI/Unichat-DeepSeek-R1-distill-32B

始智:https://wisemodel.cn/models/UnicomLLM/Unichat-DeepSeek-R1-distill-32B

相关推荐

  • 2025年流量卡大揭秘:哪款最便宜又好用?看完这篇不踩坑!号卡资讯

    2025年流量卡大揭秘:哪款最便宜又好用?看完这篇不踩坑!

    “流量卡哪个最划算?”“19元套餐真的靠谱吗?”“怎么选才不会掉坑?”如果你正在为这些问题纠结,这篇2025年最新流量卡深度测评一定能帮到你!我们结合实测数据、用户反馈和运营商政策,从套餐资费、信号稳定性、办理流程到避坑指南,一次性说清所有关键问题,帮你找到最适合自己的“流量神器”!一、2025年流量卡市场真......

    2025-12-02 17:30:55 41
  • 联通19元永久套餐全解析:省钱攻略还是文字陷阱?2025年最新实测报告号卡资讯

    联通19元永久套餐全解析:省钱攻略还是文字陷阱?2025年最新实测报告

    “19元用5G流量,还永久不涨价?”最近刷短视频总被这样的广告轰炸,评论区里有人狂喜“终于实现流量自由”,也有人吐槽“刷抖音3天扣光55GB通用流量”。这款被全网热议的联通19元永久套餐,究竟是通信行业的“真香定律”,还是精心设计的文字陷阱?作为深度测评过20+流量卡的数码博主,我用2周时间实测了3个不同版本套餐,......

    2025-12-02 17:26:06 34
  • 广电19元无限流量卡深度测评:是性价比神卡还是营销套路?号卡资讯

    广电19元无限流量卡深度测评:是性价比神卡还是营销套路?

    “每月19元,流量随便用!”2025年,广电推出的19元无限流量卡在社交平台刷屏,成为学生党、租房族、备用机用户的“心头好”。但面对“低价”“无限”等关键词,不少人心里打鼓:这卡真的靠谱吗?今天咱们就扒开它的“外衣”,看看是真香还是踩坑。一、套餐资费:19元“无限”背后的真相广电19元套餐的“无限流量”其实是营......

    2025-12-02 17:25:13 26
  • 移联协和卡到底怎么样?一篇帮你搞懂所有门道的干货号卡资讯

    移联协和卡到底怎么样?一篇帮你搞懂所有门道的干货

    办卡关注微信公众号:好卡直通车我们拥有三大运营商的正规授权资质,不定期更新高性价比的运营商流量卡套餐,并提供2025年流量卡避坑指南,帮你找到最合适的流量解决方案。最近是不是总听人提起“移联协和卡”?或者你在网上搜“手机卡推荐”时,它总跳出来?心里肯定在犯嘀咕:这卡到底有啥特别的?是不是骗人的?资费划算......

    2025-10-25 22:11:31 26
  • 联通鸿鹄卡深度解析:2025年流量神卡是否值得入手?号卡资讯

    联通鸿鹄卡深度解析:2025年流量神卡是否值得入手?

    办卡关注微信公众号:妖姐说卡每日更新高性价比的运营商流量卡套餐,安全透明无套路,办流量卡就像在营业厅办理一样放心。朋友们,最近是不是被各种流量卡广告刷屏了?特别是联通推出的“鸿鹄卡”,宣传的月租低、流量多,看得人心痒痒。但这款卡到底怎么样?是不是真有那么划算?今天咱们就抛开官方话术,用大白话把鸿鹄卡......

    2025-10-25 22:10:55 29
  • 电信奇云卡深度解析:29元235G是真香还是套路?号卡资讯

    电信奇云卡深度解析:29元235G是真香还是套路?

    办卡关注微信公众号:妖姐说卡每日更新高性价比的运营商流量卡套餐,安全透明无套路,办流量卡就像在营业厅办理一样放心。最近,电信奇云卡的风刮得是真大!铺天盖地的广告都在喊“29元享235G超大流量”,听起来简直是流量焦虑者的福音。但天上真的会掉馅饼吗?这张卡到底能不能闭眼冲?今天咱们就抛开官方话术,用大白话扒......

    2025-10-25 22:10:05 26
  • 2025年宝藏流量卡:电信冬梅卡19元80G真实体验全解析号卡资讯

    2025年宝藏流量卡:电信冬梅卡19元80G真实体验全解析

    办卡关注微信公众号:好卡直通车我们拥有三大运营商的正规授权资质,不定期更新高性价比的运营商流量卡套餐,并提供2025年流量卡避坑指南,帮你找到最合适的流量解决方案。你是不是也在为每月高昂的手机话费发愁?刷短视频、追剧、导航,流量总是不够用?最近朋友圈刷屏的电信冬梅卡,号称月租19元就能用上80G流量,这听起来......

    2025-10-25 22:08:51 25
  • 联通畅游卡深度解析:29元185G是真香还是套路?看完这篇再决定!号卡资讯

    联通畅游卡深度解析:29元185G是真香还是套路?看完这篇再决定!

    办卡关注微信公众号:好卡直通车我们拥有三大运营商的正规授权资质,不定期更新高性价比的运营商流量卡套餐,并提供2025年流量卡避坑指南,帮你找到最合适的流量解决方案。朋友们,最近是不是总刷到联通畅游卡的广告?“月租29元,185G超大流量”、“全国通用、不限速”……这些诱人的字眼简直让人心动到不行!但别急着下单......

    2025-10-25 22:07:51 29
  • 电信星耀卡:39元月租155G大流量,长期可续的省心之选号卡资讯

    电信星耀卡:39元月租155G大流量,长期可续的省心之选

    办卡关注微信公众号:卡之领地作为三大运营商正规授权代理商,我们持续更新优质流量套餐,不管你是学生党、上班族还是游戏党,让您轻松找到最适合的流量卡套餐。朋友们,是不是总在纠结手机流量不够用,又怕套餐太贵?今天咱们就来聊聊一款最近很火的流量卡——电信星耀卡。它主打的就是每月39元,能享受到高达155G的全国流......

    2025-10-25 22:07:21 26
  • 联通飞跃卡:29元月租竟有180G通用流量+300分钟通话?这篇攻略讲透了!号卡资讯

    联通飞跃卡:29元月租竟有180G通用流量+300分钟通话?这篇攻略讲透了!

    办卡关注微信公众号:好卡直通车我们拥有三大运营商的正规授权资质,不定期更新高性价比的运营商流量卡套餐,并提供2025年流量卡避坑指南,帮你找到最合适的流量解决方案。宝子们,是不是总感觉手机流量不够用?刷会儿视频、玩把游戏,流量套餐就见底了,额外购买流量包又贵得肉疼。别急,今天咱就来聊聊最近火出圈的联通飞......

    2025-10-25 22:06:33 25
  • 2025年深度解析:广电飞酒卡,20元月租的350G流量王是真香还是坑?号卡资讯

    2025年深度解析:广电飞酒卡,20元月租的350G流量王是真香还是坑?

    办卡关注微信公众号:卡之领地作为三大运营商正规授权代理商,我们持续更新优质流量套餐,不管你是学生党、上班族还是游戏党,让您轻松找到最适合的流量卡套餐。朋友们,是不是总感觉手机流量不够用?刷个视频、玩局游戏,流量就像开了闸的洪水,哗哗地流走,月底看着高昂的话费账单直挠头。别急,今天咱们就来聊聊最近在圈......

    2025-10-25 22:05:53 22
  • 浙江电信流量卡深度测评:2025年闭眼入的省钱攻略号卡资讯

    浙江电信流量卡深度测评:2025年闭眼入的省钱攻略

    “刷剧卡成PPT,开热点分分钟欠费?”最近在杭州上班的小王吐槽,自己每月199元的套餐,流量总在月底“失踪”。其实,选对一张高性价比的流量卡,能直接省下一顿火锅钱。今天咱们就扒开浙江电信流量卡的“底裤”,从信号实测到避坑指南,手把手教你挑到“真香卡”。一、2025年浙江电信流量卡“王炸套餐”实测1. 浙江电信专属......

    2025-10-15 16:13:30 23