我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

PromptBench

PromptBench

一個(gè)基于 Pytorch 的 Python 包,用于評估和理解大型語言模型的統(tǒng)一庫。它為研究人員提供了用戶友好的 API,以便對 LLM 進(jìn)行評估。

#Ai工具箱 #Ai提示指令
收藏

PromptBench簡介

PromptBench,這是一個(gè)用于評估 LLM 的統(tǒng)一庫。它由研究人員易于使用和擴(kuò)展的幾個(gè)關(guān)鍵組件組成:提示構(gòu)建、提示工程、數(shù)據(jù)集和模型加載、對抗性提示攻擊、動態(tài)評估協(xié)議和分析工具。PromptBench 被設(shè)計(jì)為一個(gè)開放、通用和靈活的代碼庫,用于研究目的,可以促進(jìn)在創(chuàng)建新基準(zhǔn)、部署下游應(yīng)用程序和設(shè)計(jì)新評估協(xié)議方面進(jìn)行原創(chuàng)研究。

PromptBench項(xiàng)目地址:https://github.com/microsoft/promptbench

promptbench.jpg

promptbench 目前提供什么?

快速模型性能評估:我們提供用戶友好的界面,允許快速構(gòu)建模型、加載數(shù)據(jù)集和評估模型性能。

提示工程:我們實(shí)施了幾種快速工程方法。例如:Few-shot Chain-of-Thought [1]、Emotion Prompt [2]、Expert Prompting [3] 等。

評估對抗性提示:promptbench 集成了提示攻擊 [4],使研究人員能夠模擬模型上的黑盒對抗性提示攻擊并評估其魯棒性(詳見此處)。

動態(tài)評估以減輕潛在的測試數(shù)據(jù)污染:我們集成了動態(tài)評估框架 DyVal [5],該框架以可控的復(fù)雜性即時(shí)生成評估樣本。

PromptBench安裝方式pip

我們?yōu)橄胍焖匍_始評估的用戶提供了一個(gè) Python 包提示臺。只需運(yùn)行:

pip install promptbench

請注意,pip 安裝可能落后于最近的更新。因此,如果您想使用最新功能或基于我們的代碼進(jìn)行開發(fā),您應(yīng)該通過 GitHub 安裝。

通過 GitHub 安裝

首先,克隆存儲庫:

git clone git@github.com:microsoft/promptbench.git

然后

cd promptbench

若要安裝所需的包,可以創(chuàng)建 conda 環(huán)境:

conda create --name promptbench python=3.9

然后使用 pip 安裝所需的軟件包:

pip install -r requirements.txt

請注意,這只安裝了基本的 python 包。對于提示攻擊,您還需要安裝 TextAttack。

PromptBench用法:

Promptbench 易于使用和擴(kuò)展。通過以下示例將幫助您熟悉 promptbench 以便快速使用、評估現(xiàn)有數(shù)據(jù)集和 LLM,或創(chuàng)建自己的數(shù)據(jù)集和模型。

與PromptBench相關(guān)工具

主站蜘蛛池模板: 密山市| 信宜市| 新蔡县| 九寨沟县| 静宁县| 牡丹江市| 星座| 萨迦县| 和龙市| 绿春县| 台东市| 广水市| 遵义市| 青冈县| 章丘市| 怀柔区| 武清区| 高淳县| 郓城县| 昌邑市| 汉川市| 河南省| 肥城市| 齐齐哈尔市| 金阳县| 武夷山市| 绥化市| 家居| 翁源县| 兰西县| 玛纳斯县| 武平县| 文安县| 固始县| 台安县| 合肥市| 韩城市| 日喀则市| 庄浪县| 手游| 故城县|