PromptBench

一個基于 Pytorch 的 Python 包，用于評估和理解大型語言模型的統一庫。它為研究人員提供了用戶友好的 API，以便對 LLM 進行評估。

#Ai工具箱 #Ai提示指令

PromptBench簡介

PromptBench，這是一個用于評估 LLM 的統一庫。它由研究人員易于使用和擴展的幾個關鍵組件組成：提示構建、提示工程、數據集和模型加載、對抗性提示攻擊、動態評估協議和分析工具。PromptBench 被設計為一個開放、通用和靈活的代碼庫，用于研究目的，可以促進在創建新基準、部署下游應用程序和設計新評估協議方面進行原創研究。。

PromptBench項目地址：https://github.com/microsoft/promptbench

promptbench 目前提供什么？

快速模型性能評估：我們提供用戶友好的界面，允許快速構建模型、加載數據集和評估模型性能。

提示工程：我們實施了幾種快速工程方法。例如：Few-shot Chain-of-Thought [1]、Emotion Prompt [2]、Expert Prompting [3] 等。

評估對抗性提示：promptbench 集成了提示攻擊 [4]，使研究人員能夠模擬模型上的黑盒對抗性提示攻擊并評估其魯棒性（詳見此處）。

動態評估以減輕潛在的測試數據污染：我們集成了動態評估框架 DyVal [5]，該框架以可控的復雜性即時生成評估樣本。

PromptBench安裝方式pip

我們為想要快速開始評估的用戶提供了一個 Python 包提示臺。只需運行：

pip install promptbench

請注意，pip 安裝可能落后于最近的更新。因此，如果您想使用最新功能或基于我們的代碼進行開發，您應該通過 GitHub 安裝。

通過 GitHub 安裝

首先，克隆存儲庫：

git clone git@github.com:microsoft/promptbench.git

然后

cd promptbench

若要安裝所需的包，可以創建 conda 環境：

conda create --name promptbench python=3.9

然后使用 pip 安裝所需的軟件包：

pip install -r requirements.txt

請注意，這只安裝了基本的 python 包。對于提示攻擊，您還需要安裝 TextAttack。

PromptBench用法：

Promptbench 易于使用和擴展。通過以下示例將幫助您熟悉 promptbench 以便快速使用、評估現有數據集和 LLM，或創建自己的數據集和模型。

ChatX.Ai

Bestprompts

與PromptBench相關工具

提示詞優化器

一鍵優化提示詞并支持多輪迭代改進測試的AI提示詞優化工具，能幫助用戶編寫更好的AI提示詞，提升 AI 輸出質量，支持 W...

Quick Prompt

一個專注于提示詞（Prompt）的管理和快速輸入的瀏覽器擴展插件。可以幫助用戶創建、管理和組織自己的提示詞庫，并在任何網...

PromptDodo

一個通過整合Stable Diffusion、DALL-E 和 Midjourney 等 ai 繪圖工具生成AI 圖像的...

PromptFolder

專為大型語言模型 (LLM)和大型模型 (LM) 以及LMOps設計的提示詞優化助手，不管是文字、還是圖片的提示詞，都可...

Learning Prompt

免費的Prompt Engineering教程，現已包含 ChatGPT和Midjourney 教程。

提示精靈小富貴

一個旨在簡化并增強為AI模型創建和優化提示詞（Prompts）過程的開源項目，會幫你寫Prompt提示詞的GPTs應用。

最新工具

提示詞優化器

一鍵優化提示詞并支持多輪迭代改進測試的AI提示詞優化工具，能幫助...

Quick Prompt

一個專注于提示詞（Prompt）的管理和快速輸入的瀏覽器擴展插件...

DescribePic

一個利用人工智能來生成上傳圖片描述的在線工具。DescribeP...

貓目社區

一個優質的AIGC應用平臺，集合了多種先進的AI工具和模型，貓目...

PromptDodo

一個通過整合Stable Diffusion、DALL-E 和 ...

Ai藝術之家

一個提供Midjourney提示詞和靈感的網站，超50,000+...

一設MJ咒語解析

免費的Midjourney以圖生文工具，只需上傳一張圖片，一設M...

AI畫廊

一個專注于人工智能（AI）作品的展示平臺，提供了大量的AI繪畫作...

PromptFolder

專為大型語言模型 (LLM)和大型模型 (LM) 以及LMOps...

Freeflo.AI

一個提供AI圖像提示詞和樣式的綜合提示詞庫平臺。可與包括Midj...

用戶登錄

我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

PromptBench

PromptBench簡介

與PromptBench相關工具

最新工具