科技信息资讯,更全更新信息实报!
首页 > 互联网> 正文

腾讯云TencentOS Server AI,助力荣耀打造高性能AI底座

来源:互联网 发布时间:2025-06-09 21:24
浏览:4

随着生成式AI技术的爆发式增长,AI大模型开始渗透至手机领域,一线厂商已经把AI应用集成到各自最新的产品中,并且在以惊人的速度迭代。为了进一步提升大模型部署的效能,荣耀基于应用腾讯云TencentOS Server AI中提供的TACO-LLM加速模块部署DeepSeek-R1等开源大模型,并应用荣耀企业内部等场景,稳定性、可靠性、推理性能均大幅提升。

在推理平台场景中,荣耀侧重关注框架效能、稳定性、运行状态监控及应急预案等特性。使用TACO-LLM进行推理任务后,在DeepSeek-R1 满血版场景下,相对于荣耀原始线上业务性能,TTFT(首Token 延迟)P95 的响应时间最高降低6.25倍,吞吐提升2倍,端到端延迟降低100%。在社区最新版本sglang场景下,TTFT P95的响应时间最高降低12.5倍。

 

 

腾讯云TACO-LLM之所以能够对荣耀业务的性能提升如此明显,主要的得益于多种投机采样技术核心能力:大语言模型的自回归解码属性无法充分利用GPU的算力,计算效率不高,解码成本高昂。而TACO-LLM通过投机采样的方式,从根本上解决了计算密度的问题,让真正部署的大模型实现“并行”解码,从而大幅提高解码效率。

荣耀大数据平台部相关负责人表示:“荣耀使用腾讯云 TACO-LLM 打造高性能的AI底座,部署稳定可靠,提升了性能加速体验。”

TencentOS Server AI加速版中提供的TACO-LLM加速模块,针对企业级AI模型私有化部署挑战,对大语言模型业务进行了专门的内核运行优化,用于提高大语言模型的推理效能,提供兼顾高吞吐和低延时的优化方案,能够“无缝”整合到现有的大模型部署方案中。

 

热门文章

  • 国产科幻机甲游戏《解限机》定档7月2日公测,登顶
    国产科幻机甲游戏《解限机》定档7月2日公测,登顶Steam国产游戏愿望单榜首

    国产科幻机甲游戏《解限机》定档7月2日公测,登顶

    西山居十年磨一剑的科幻机甲对战游戏《解限机》正式定档2025年7月2日全球公测。游戏凭借硬核品质登顶Steam国产游戏愿望单榜首...

  • 西南山城里的618:大容量、大尺寸、新功能家电热
    西南山城里的618:大容量、大尺寸、新功能家电热销

    西南山城里的618:大容量、大尺寸、新功能家电热

    又是一年618,在高线市场消费者已经习惯于次日达甚至当日达的极速购物效率的当下,来自广袤县域乃至乡镇市场消费者也在以独有的方式加

  • 又一个时代的眼泪 运营22年的霏凡论坛宣布关闭
    又一个时代的眼泪 运营22年的霏凡论坛宣布关闭

    又一个时代的眼泪 运营22年的霏凡论坛宣布关闭

    6月14日消息,与现在微博、短视频不同,刷BBS曾经是早期网民的必备技能,20多年前活跃着很多论坛,然而强大如天涯、猫扑、西祠这

  • 亚马逊收购iRobot获英国批准
    亚马逊收购iRobot获英国批准

    亚马逊收购iRobot获英国批准

    经济观察网 记者 冯庆艳亚马逊(AMZN US)对iRobot(IRBT US)的收购案取得了重大进展。当地时间6月16日,这一

  • 知乎C端业务起势,如何平衡用户体验与商业化创收?
    知乎C端业务起势,如何平衡用户体验与商业化创收?

    知乎C端业务起势,如何平衡用户体验与商业化创收?

    《投资者网》侯书青近日,知乎公布了2023年第一季度财报,知乎在这一季实现了上市以来首次经营现金流转正,运营亏损同比收窄,降本增

  • 京东、淘宝天猫、拼多多等竞逐“全网最低价”,这届
    京东、淘宝天猫、拼多多等竞逐“全网最低价”,这届618到底有多“卷”?

    京东、淘宝天猫、拼多多等竞逐“全网最低价”,这届

    图片来源:图虫创意让利,才能跑马圈地。价格话题横亘电商行业发展始终, 近年来各大电商平台打响了补贴以及扶持价格战,商家和平台也一

人工智能

更多 >

物联网

更多 >