
Kiln AI
Kiln AI簡介
Kiln ai是一個開源的,可以進行大型語言模型(LLM)的微調、合成數據生成和數據集協作的AI工具。它提供直觀的界面,支持Windows、MacOS和Linux系統,用戶可以通過零代碼方式對多種模型進行微調并自動部署。
Kiln AI也支持了deepseek(我本地ollama部署了一個deepseek-r1:14b)進行了小測試,對于像本人這種需要本地蒸餾大語言模型進行開發和研究的人來說,Kiln AI 它簡直就是一款“神器”。
Kiln AI功能特點:
零代碼微調:Kiln AI允許用戶通過簡單的界面進行模型的微調,用戶可以選擇合適的模型,如GPT-4o、Llama系列等,并配置參數進行微調。
數據集構建:Kiln AI支持用戶構建和迭代數據集。用戶可以輸入自己的數據源,工具會幫助提高數據質量和多樣性,從而優化訓練效果。
合成數據生成:該工具可以自動生成合成數據,以支持模型訓練,減少數據標注成本,特別適用于數據稀缺的情況。
團隊協作:基于 Git 的 AI 數據集版本控制。直觀的用戶界面讓您可以輕松地與 QA、PM 和主題專家就結構化數據進行協作。
提示詞生成:自動從您的數據中生成提示,包括思路鏈、小樣本和多樣本等。
廣泛的模型和提供商支持:支持Ollama、OpenAI、OpenRouter、Fireworks、Groq、AWS等。
支持的模型和提供商
支持任何兼容OpenAI的API,包括Ollama、OpenAI、OpenRouter、Fireworks、Groq和AWS。
廣泛的模型庫:支持的模型有GPT、Llama、Claude、Gemini、Mistral、Gemma和Phi。
如何使用Kiln AI進行數據集構建和模型優化?
1. 下載和安裝Kiln AI:
訪問Kiln AI的GitHub頁面,下載適用于您操作系統的安裝包。
按照安裝向導的指示完成安裝過程。
2. 啟動Kiln AI應用程序:
安裝完成后,啟動Kiln AI應用程序。您將看到一個直觀的用戶界面。
3. 創建新任務:
在Kiln AI的UI中,點擊“創建新任務”按鈕。這將引導您進入任務定義和目標設定階段。
輸入任務的名稱、描述以及任何特定的輸入和輸出要求。
4. 生成訓練數據:
使用Kiln AI提供的交互式可視化工具生成訓練數據。您可以通過主題樹、多示例提示和鏈式思考等技術生成高質量的合成數據。
在生成數據時,確保數據的多樣性和準確性。
5. 選擇和微調模型:
在Kiln AI中,您可以選擇多種預訓練模型進行微調,包括Llama、GPT-4o、Mixtral等。
配置微調參數,如訓練集和驗證集的劃分,并啟動微調任務。
6. 部署和使用模型:
微調完成后,Kiln AI會自動部署模型。您可以在UI中直接測試和調用微調后的模型。
如果需要,您還可以通過API將模型集成到其他系統或應用中。
7. 團隊協作和版本控制:
Kiln AI支持基于Git的版本控制,方便團隊成員協作處理數據集和模型。
您可以使用Kiln AI的界面或命令行工具進行版本管理和協作。
GitHub倉庫地址:https://github.com/Kiln-AI/Kiln