應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

華為發(fā)布 AI 推理創(chuàng)新技術(shù) UCM:可實(shí)現(xiàn)高吞吐、低時(shí)延推理體驗(yàn),計(jì)劃 9 月開源

2025-08-13 09:12 IT之家
關(guān)鍵詞:華為UCM

導(dǎo)讀:華為正式發(fā)布 AI 推理創(chuàng)新技術(shù) UCM(推理記憶數(shù)據(jù)管理器)。

  8 月 12 日消息,華為正式發(fā)布 AI 推理創(chuàng)新技術(shù) UCM(推理記憶數(shù)據(jù)管理器)。

  據(jù)了解,作為一款以 KV Cache 為中心的推理加速套件,UCM 融合了多類型緩存加速算法工具,分級(jí)管理推理過程中產(chǎn)生的 KV Cache 記憶數(shù)據(jù),可擴(kuò)大推理上下文窗口,實(shí)現(xiàn)高吞吐、低時(shí)延的推理體驗(yàn),降低每 Token 推理成本。該技術(shù)已率先在中國銀聯(lián)“客戶之聲”“營銷策劃”“辦公助手”三大業(yè)務(wù)場景中,開展智慧金融 AI 推理加速應(yīng)用試點(diǎn),并已取得成果。

  華為計(jì)劃于 2025 年 9 月正式開源 UCM,屆時(shí)將在魔擎社區(qū)首發(fā),后續(xù)逐步貢獻(xiàn)給業(yè)界主流推理引擎社區(qū),并共享給業(yè)內(nèi)所有 Share Everything (共享架構(gòu)) 存儲(chǔ)廠商和生態(tài)伙伴。