
無問芯穹
無問芯穹簡介
無問芯穹致力于提供卓越的AGI算力解決方案,以大模型能效優化工具包為核心,向下聯動多家國產芯片公司,向上通過智算云服務、智算一體機多種方式服務大模型算法企業,協同算力、算法、生態推動行業大模型的高效落地,構建AGI時代的大模型基礎設施。
無問芯穹官網網址:https://www.infini-ai.com
無問芯穹核心產品:
以無穹大模型能效優化工具包為基礎,整合國產芯片算力, 構建統一算力底座,提供包括NVIDIA、AMD、海光、天數等多種加速算力云服務,屏蔽硬件差異,開箱即用。
面向大模型私有化部署場景,整合計算加速卡、自研IP、優化工具包、行業大模型,構建大模型一體機,最大化優化大模型落地ROI。
無問芯穹解決方案:
無問芯穹提供從安裝到使用端到端的培訓服務及模型定制化服務,降低大模型使用門檻,根據您的需求個性化定制解決方案。
1、智算云服務
GPU加速實例
開箱即用,統一加速、性能深度優化、開源兼容
多源國產芯片支持
大模型訓練加速服務
大模型推理加速服務
2、智算一體機
軟硬件深度協同
自研加速卡IP
行業大模型賦能
3、大模型能效優化工具包
自研多后端通用高性能算子庫
模型量化壓縮庫
分布式訓練加速庫
多后端模型推理引擎
4、自研行業大模型
政務大模型
法律大模型
證券大模型
5、大模型應用開發工具鏈
多agent引擎
模型微調服務
RAG工具包
效果評測工具
6、基于大模型的行業智能體應用
投資助手
算法助手
無問芯穹團隊成員:
創始團隊成員來自清華大學電子系及頭部互聯網/AI企業,擁有豐富的產業經驗和成功的創業經歷,技術積累與學術沉淀豐富,已經在人工智能系統優化領域發表高水平學術論文200余篇。
相關成果包括:(1)GPU高效算子庫超越英偉達商用庫,在中端工藝GPU上實現比商用軟件在高端工藝GPU更優的性能;(2)支撐大模型的高效稀疏推理加速架構,提升稀疏神經網絡、圖神經網絡等計算速度1-3個量級。團隊已經實現大語言模型在英偉達GPU上延時降低50%,未來將進一步結合底層算子優化、稀疏加速、硬件特性感知、高效互聯等能力,將整機加速比提升到10倍。