首頁 > Ai資訊 > Ai產品

DeepSeek開源周第二天開源項目：Deepep

映技派于2025-02-25發布在Ai產品

昨天是DeepSeek ai開源周第一天，開源的項目是FlashMLA，不到半小時，Github已經已經300多Star了，短短1小時就超過10W閱讀，非常的火爆，今天是DeepSeek開源周的第二天，DeepSeek開源了第2個項目：Deepep。

DeepSeek開源了第2個項目：Deepep.webp

什么是Deepep？

Deepep是一個用于MOE模型培訓和推理的開源EP通信庫。它基于先進的混合專家架構，充分利用了大規模數據集以提高其預訓練和微調的有效性。DeepEP的設計導向是減少計算負擔與內存使用，使得用戶能夠在常規硬件上有效運行大規模模型。

Deepep的功能特點

MoE架構優化：

DeepEP專為Mixture-of-Experts (MoE) 和專家并行 (EP) 設計，提供高效的all-to-all GPU內核，適用于訓練和推理任務。
支持低精度運算，包括FP8和BF16，提升計算效率，節省顯存。

高性能通信：

提供高吞吐量和低延遲的通信內核，支持NVLink和RDMA網絡。在H800 GPU上測試，最大帶寬可達153 GB/s (NVLink) 和46 GB/s (RDMA)。
針對NVLink到RDMA的非對稱帶寬轉發場景進行了優化，確保高吞吐量表現。

低延遲通信：

提供純RDMA的低延遲內核，特別適合推理解碼階段，延遲低至163微秒。
引入基于hook的通信-計算重疊方法，不占用GPU SM資源，最大化計算效率。

硬件優化：

利用未公開的PTX指令提升Hopper架構的性能。
支持InfiniBand網絡，并理論上兼容RoCE，提供靈活的網絡配置選項。

Deepep的應用場景

大規模模型訓練：

適用于Mixture-of-Experts (MoE) 模型的訓練，提供高效的并行通信支持，顯著提升訓練效率。

推理任務：

特別適合延遲敏感的推理解碼場景，顯著提升效率，降低延遲，提高推理吞吐量。

高性能計算需求：

完美適配現代高性能計算需求，支持多種硬件平臺，包括Hopper GPU架構，未來可能擴展更多設備。

Deepep的使用與集成

易用性：

支持Hopper GPU架構，需要Python 3.8+、CUDA 12.3+和PyTorch 2.1+環境。
安裝時需搭配團隊修改版的NVSHMEM，安裝指南詳細。

集成方式：

開源且易于集成，只需幾行命令即可構建并運行測試。
安裝后導入deep_ep模塊即可直接使用，提供示例代碼和測試腳本。

DeepEP已在GitHub上開源，地址：https://github.com/deepseek-ai/DeepEP

1. DeepSeek開源周第一天開源項目：DeepSeek FlashMLA

Anthropic推出Claude Code：具備代碼搜索、自動修改、測試、GitHub集成等功能

FlashMLA：DeepSeek發布的高效的MLA解碼內核，優化了變長序列的處理服務

DeepSeek R1-0528有哪些功能更新？

DeepSeek R1-0528有哪些功能更新？

2025-05-29

DeepSeek發布DeepSeek-Prover-

DeepSeek發布DeepSeek-Prover-

2025-04-30

馬蜂窩正式推出AI旅行助手“AI小螞”：全量接入De

馬蜂窩正式推出AI旅行助手“AI小螞”：全量接入De

2025-04-29

Awesome-Deepseek-Integrati

Awesome-Deepseek-Integrati

2025-04-22

DeepSite：基于DeepSeek-V3-032

DeepSite：基于DeepSeek-V3-032

2025-04-14

豆包剛上線的深度思考與DeepSeek相比較，哪個更

豆包剛上線的深度思考與DeepSeek相比較，哪個更

2025-03-28

最新工具

unDraw

美國設計師Katerina Limpitsouni創作的開源插畫...

Storyset

一個由知名素材平臺Freepik公司旗下的免費在線自定義矢量插畫...

Jigsaw Planet

一個數百萬免費在線拼圖平臺，用戶能直接通過瀏覽器創建、游玩和分享...

GeoFS

一款免費的網頁版多人飛行模擬器網站，只要瀏覽器就可以運行，不需要...

Avido AI

通過 AI 技術幫用戶生成適合 YouTube 和 TikTok...

表答AI

一款能抓取網頁內容并能情感分析的數據分析產品，并把采集分析過程自...

Recaster AI

通過導入產品圖像或數據，生成定制的SEO內容，支持從Shopif...

ScanPDF

一個能夠讓PDF看起來就像是掃描件一樣的在線免費工具。只需點擊鼠...

SkylineWebCams

在美洲、歐洲、亞洲、非洲及大洋洲59個國家，提供全球五大洲實時高...

Ezgif

一個簡單、免費的在線 GIF 制作工具和基礎動畫圖像編輯工具集，...

用戶登錄

我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院