
無(wú)問(wèn)芯穹
無(wú)問(wèn)芯穹簡(jiǎn)介
無(wú)問(wèn)芯穹致力于提供卓越的AGI算力解決方案,以大模型能效優(yōu)化工具包為核心,向下聯(lián)動(dòng)多家國(guó)產(chǎn)芯片公司,向上通過(guò)智算云服務(wù)、智算一體機(jī)多種方式服務(wù)大模型算法企業(yè),協(xié)同算力、算法、生態(tài)推動(dòng)行業(yè)大模型的高效落地,構(gòu)建AGI時(shí)代的大模型基礎(chǔ)設(shè)施。
無(wú)問(wèn)芯穹官網(wǎng)網(wǎng)址:https://www.infini-ai.com
無(wú)問(wèn)芯穹核心產(chǎn)品:
以無(wú)穹大模型能效優(yōu)化工具包為基礎(chǔ),整合國(guó)產(chǎn)芯片算力, 構(gòu)建統(tǒng)一算力底座,提供包括NVIDIA、AMD、海光、天數(shù)等多種加速算力云服務(wù),屏蔽硬件差異,開(kāi)箱即用。
面向大模型私有化部署場(chǎng)景,整合計(jì)算加速卡、自研IP、優(yōu)化工具包、行業(yè)大模型,構(gòu)建大模型一體機(jī),最大化優(yōu)化大模型落地ROI。
無(wú)問(wèn)芯穹解決方案:
無(wú)問(wèn)芯穹提供從安裝到使用端到端的培訓(xùn)服務(wù)及模型定制化服務(wù),降低大模型使用門檻,根據(jù)您的需求個(gè)性化定制解決方案。
1、智算云服務(wù)
GPU加速實(shí)例
開(kāi)箱即用,統(tǒng)一加速、性能深度優(yōu)化、開(kāi)源兼容
多源國(guó)產(chǎn)芯片支持
大模型訓(xùn)練加速服務(wù)
大模型推理加速服務(wù)
2、智算一體機(jī)
軟硬件深度協(xié)同
自研加速卡IP
行業(yè)大模型賦能
3、大模型能效優(yōu)化工具包
自研多后端通用高性能算子庫(kù)
模型量化壓縮庫(kù)
分布式訓(xùn)練加速庫(kù)
多后端模型推理引擎
4、自研行業(yè)大模型
政務(wù)大模型
法律大模型
證券大模型
5、大模型應(yīng)用開(kāi)發(fā)工具鏈
多agent引擎
模型微調(diào)服務(wù)
RAG工具包
效果評(píng)測(cè)工具
6、基于大模型的行業(yè)智能體應(yīng)用
投資助手
算法助手
無(wú)問(wèn)芯穹團(tuán)隊(duì)成員:
創(chuàng)始團(tuán)隊(duì)成員來(lái)自清華大學(xué)電子系及頭部互聯(lián)網(wǎng)/AI企業(yè),擁有豐富的產(chǎn)業(yè)經(jīng)驗(yàn)和成功的創(chuàng)業(yè)經(jīng)歷,技術(shù)積累與學(xué)術(shù)沉淀豐富,已經(jīng)在人工智能系統(tǒng)優(yōu)化領(lǐng)域發(fā)表高水平學(xué)術(shù)論文200余篇。
相關(guān)成果包括:(1)GPU高效算子庫(kù)超越英偉達(dá)商用庫(kù),在中端工藝GPU上實(shí)現(xiàn)比商用軟件在高端工藝GPU更優(yōu)的性能;(2)支撐大模型的高效稀疏推理加速架構(gòu),提升稀疏神經(jīng)網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)等計(jì)算速度1-3個(gè)量級(jí)。團(tuán)隊(duì)已經(jīng)實(shí)現(xiàn)大語(yǔ)言模型在英偉達(dá)GPU上延時(shí)降低50%,未來(lái)將進(jìn)一步結(jié)合底層算子優(yōu)化、稀疏加速、硬件特性感知、高效互聯(lián)等能力,將整機(jī)加速比提升到10倍。