我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

赤兔Chitu:清華大學團隊開源的高性能大語言模型推理框架

赤兔(Chitu)是什么?

赤兔(Chitu)是由清華大學團隊開源的一個高性能大語言模型推理框架,專注于提升推理效率、降低成本,并支持多種硬件平臺和部署場景。它可以讓DeepSeek推理成本降一半,性能翻番。赤兔(Chitu)的目標是為企業和開發者提供一個高效、靈活且易于部署的推理引擎,加速大語言模型(LLM)在實際應用中的落地。

赤兔Chitu:清華大學團隊開源的高性能大語言模型推理框架.webp

赤兔(Chitu)功能特點

  • 多元算力適配:支持 NVIDIA 最新旗艦到舊款的多系列產品,并為國產芯片提供優化支持。

  • 全場景可伸縮:從純 CPU 部署、單 GPU 部署到大規模集群部署,提供靈活的可擴展解決方案。

  • 長期穩定運行:適用于實際生產環境,能夠穩定承載并發業務流量。

  • 高效推理性能:在 A800 集群測試中,相比部分國外開源框架,GPU 使用量減少 50% 的情況下推理速度提升 3.15 倍。

  • 降低成本:通過優化硬件資源使用,降低了企業部署 ai 模型的門檻和成本。

赤兔(Chitu)應用場景

  • 企業級 AI 應用:需要高性能、低延遲和高吞吐量的推理服務。

  • 大規模集群部署:需要在多 GPU 或多節點環境中高效運行的場景。

  • 資源受限的環境:需要在有限的硬件資源下實現高效推理的場景。

  • 國產芯片適配:需要在國產硬件平臺上運行大語言模型的場景。

赤兔(Chitu)使用方法

1. 源碼安裝

git clone --recursive https://github.com/thu-pacman/chitu && cd chitu
pip install -r requirements-build.txt
pip install -U torch --index-url https://download.pytorch.org/whl/cu124  # 根據 CUDA 版本調整
TORCH_CUDA_ARCH_LIST=8.6 CHITU_SETUP_JOBS=4 MAX_JOBS=4 pip install --no-build-isolation

2.單 GPU 推理

torchrun --nproc_per_node 8 test/single_req_test.py request.max_new_tokens=64 models=DeepSeek-R1 models.ckpt_dir=/data/DeepSeek-R1 infer.pp_size=1 infer.tp_size=8

3.混合并行 (TP+PP)

torchrun --nnodes 2 --nproc_per_node 8 test/single_req_test.py request.max_new_tokens=64 infer.pp_size=2 infer.tp_size=8 models=DeepSeek-R1 models.ckpt_dir=/data/DeepSeek-R1

4.啟動服務

export WORLD_SIZE=8
torchrun --nnodes 1 \
--nproc_per_node 8 \
--master_port=22525 \
example/serve.py \
serve.port=21002 \
infer.stop_with_eos=False \
infer.cache_type=paged \
infer.pp_size=1 \
infer.tp_size=8 \
models=DeepSeek-R1 \
models.ckpt_dir=/data/DeepSeek-R1 \
keep_dtype_in_checkpoint=True \
infer.mla_absorb=absorb-without-precomp \
infer.soft_fp8=True \
infer.do_load=True \
infer.max_reqs=1 \
scheduler.prefill_first.num_tasks=100 \
infer.max_seq_len=4096 \
request.max_new_tokens=100 \
infer.use_cuda_graph=True

5.性能測試

python benchmarks/benchmark_serving.py \
--model "deepseek-r1" \
--iterations 10 \
--seq-len 10 \
--warmup 3 \
--base-url http://localhost:21002

GitHub倉庫:https://github.com/thu-pacman/chitu


收藏
最新工具
DrFonts
DrFonts

一個AI字體生成工具,它能把手寫的PNG圖片,比如紙上的字稿,自...

Coding Adventure
Coding Adventure

一個面向小學三年級到初中學生的游戲化編程學習平臺。學生用真實編程...

Vert.sh
Vert.sh

一款完全免費、開源的文件轉換工具,支持圖片、音頻、文檔的本地處理...

Windrecorder
Windrecorder

捕風記錄儀,一款開源的屏幕錄制與檢索工具,它記錄屏幕內容來實現記...

Custom Cursor
Custom Cursor

一個能讓你擁有個性化光標的網站。Custom Cursor網站有...

橙子8設計
橙子8設計

一站式AI電商圖片制作平臺,專為電商和跨境賣家服務。不用專業設計...

Sandspiel
Sandspiel

一款基于細胞自動機和實時物理的開源像素沙盤游戲,玩家可以在虛擬沙...

印象地圖
印象地圖

這是個可以幫你記住全國省市位置的測試工具。打開網站就能用,選個模...

Sandtris
Sandtris

一款把經典俄羅斯方塊和流沙物理效果結合的休閑游戲。玩家需要利用沙...

Maze Toys
Maze Toys

一個以迷宮游戲為主的網站,提供多種類型的迷宮玩法,包括Mini、...

主站蜘蛛池模板: 山东| 舒兰市| 那坡县| 扎赉特旗| 象州县| 阿城市| 龙州县| 凌海市| 峨眉山市| 普格县| 通山县| 姚安县| 定远县| 永吉县| 扎赉特旗| 东乌| 葵青区| 阜宁县| 平远县| 偃师市| 偏关县| 喀什市| 策勒县| 东至县| 三亚市| 兴文县| 新丰县| 寻乌县| 罗甸县| 临高县| 合江县| 兴业县| 禄丰县| 石阡县| 美姑县| 礼泉县| 博湖县| 昌平区| 土默特左旗| 禄丰县| 金堂县|