日韩在线视频一区_久久不射2019中文字幕_国产91精品久久久久久久_天堂va蜜桃一区二区三区漫画版

注冊
閩南網 > 新聞中心 > 數碼科技 > 正文

華為宣布開源盤古7B稠密和72B混合專家模型

來源:快科技 2025-06-30 10:42 http://www.413629.com/

  華為今日正式宣布開源盤古70億參數的稠密模型、盤古Pro MoE 720億參數的混合專家模型和基于昇騰的模型推理技術。

  華為表示:“此舉是華為踐行昇騰生態戰略的又一關鍵舉措,推動大模型技術的研究與創新發展,加速推進人工智能在千行百業的應用與價值創造。”

  根據華為官網顯示:

  盤古Pro MoE 72B模型權重、基礎推理代碼,已正式上線開源平臺。

  基于昇騰的超大規模MoE模型推理代碼,已正式上線開源平臺。

  盤古7B相關模型權重與推理代碼將于近期上線開源平臺。

  據悉,基于MoGE架構構建的盤古Pro MoE大模型(72B總參數、16B激活參數)在昇騰300I Duo和800I A2可實現更優的專家負載分布與計算效率(321 tokens/s和1528 tokens/s)。

  而在模型能力方面,盤古Pro MoE在最新一期業界權威大模型榜單SuperCLUE上交出了超能打的成績。

  和其他動輒千億以上的大模型相比,如DeepSeek-R1具有671B參數,盤古Pro MoE以72B總參數量達到了59分,千億參數量以內大模型排行并列國內第一。

  并且,16B激活參數量可以媲美其他廠商更大規模的模型。

原標題:華為宣布開源盤古7B稠密和72B混合專家模型
責任編輯:李曉靈
相關閱讀:
新聞 娛樂 福建 泉州 漳州 廈門
猜你喜歡:
熱門評論:
頻道推薦
  • 埃及發現3座距今4000多年的古墓 部分“被重
  • 南方區域電力市場連續結算試運行啟動
  • 各地加速培育地方特色食品產業——發揚飲食
  • 新聞推薦
    @所有人 多項民生禮包加速落地快來查收 三峽大壩變形?專家:又有人在惡意炒作 北京新一波疫情為什么沒出現死亡病例? 戴口罩、一米線 疫情改變了哪些習慣? 呼倫貝爾現幻日奇觀 彩虹光帶環繞太陽
    視覺焦點
    石獅:秋風起,紫菜香 石獅:秋風起,紫菜香
    石獅環灣生態公園內粉黛亂子草盛放 石獅環灣生態公園內粉黛亂子草盛放
    精彩視頻
    【視頻】龍舟競渡情牽兩岸 第二屆閩臺龍舟邀請賽開賽
    【視頻】龍舟競渡情牽兩岸 第二屆閩臺龍舟邀請賽開賽
    兒童斜視不治療會造成哪些影響?
    兒童斜視不治療會造成哪些影響?
    專題推薦
    世遺泉州
    世遺泉州

    挖掘泉州的鄉村之美、名橋之美、名山之美、飲食之美,讓時代記憶在城市更新中重煥榮光

    新質生產力在泉州
    何以中國·向海泉州
     
    48小時點擊排行榜
    泉州市文物保護中心與埃及亞歷山大文物局 泉州市文物保護中心與埃及亞歷山大文物局 藍腳鰹鳥藍色大腳丫的形成主要是因為什么 夏季曬傷后以下哪種處理方法更健康?螞蟻 “隔墻工廠”有新意?惠安這么做→ “木版水印”技藝的代表性傳承地是哪里? 螞蟻莊園今日答案最新:船舶靠港時為什么 螞蟻莊園今天問題正確答案:蝙蝠倒掛著睡