我爱我色成人网,欧美日韩国产色,欧美亚视频在线中文字幕免费,亚洲国产影院

OpenAI 發布的 GPT-4o是什么,有什么功能?

OpenAI 發布的 GPT-4o是什么,有什么功能?

Openai 剛剛在太平洋時間 5 月 13 日星期一上午 10 點在發布了 GPT-4o,這是一種新的人工智能模式,集合了文本、圖片、視頻、語音的全能模型。 能實時響應用戶的需求,并通過語音來實時回答你,你可以隨時打斷它。 GPT-4o具有視覺能力,能識別物體并根據視覺做出快速的響應和回答,具有非常強的邏輯推理能力。 它還能夠從用戶的聲音中檢測他們的情緒。 它的速度比 GPT4-turbo 快 2 倍,價格便宜 50%!

GPT-4o是什么?

GPT-4o(“o”代表“omni”)是邁向更自然的人機交互的一步——它接受文本、音頻和圖像的任意組合作為輸入,并生成文本、音頻和圖像的任意組合輸出。它可以在短至 232 毫秒的時間內響應音頻輸入,平均為 320 毫秒,這與人類在對話中的響應時間相似。它在英語文本和代碼上的性能與 GPT-4 Turbo 的性能相匹配,在非英語文本上的性能顯著提高,同時 API 的速度也更快,成本降低了 50%。與現有模型相比,GPT-4o 在視覺和音頻理解方面尤其出色。

在 GPT-4o 之前,您可以使用語音模式與 ChatGPT 對話,平均延遲為 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。為了實現這一目標,語音模式是由三個獨立模型組成的管道:一個簡單模型將音頻轉錄為文本,GPT-3.5 或 GPT-4 接收文本并輸出文本,第三個簡單模型將該文本轉換回音頻。這個過程意味著主要智能來源GPT-4丟失了大量信息——它無法直接觀察音調、多個說話者或背景噪音,也無法輸出笑聲、歌唱或表達情感。

借助 GPT-4o,我們跨文本、視覺和音頻端到端地訓練了一個新模型,這意味著所有輸入和輸出都由同一神經網絡處理。由于 GPT-4o 是我們第一個結合所有這些模式的模型,因此我們仍然只是淺嘗輒止地探索該模型的功能及其局限性。

GPT-4o模型評估

根據傳統基準測試,GPT-4o 在文本、推理和編碼智能方面實現了 GPT-4 Turbo 級別的性能,同時在多語言、音頻和視覺功能上設置了新的高水位線。

GPT-4o語言標記化

有 20 種語言被選為新分詞器跨不同語系壓縮的代表。

模型安全性和局限性

GPT-4o 通過過濾訓練數據和通過訓練后細化模型行為等技術,在跨模式設計中內置了安全性。我們還創建了新的安全系統,為語音輸出提供防護。

我們根據我們的標準評估了 GPT-4oPreparedness Framework and in line with our voluntary commitments準備框架并符合我們的自愿承諾。我們對網絡安全、CBRN、說服力和模型自主性的評估表明,GPT-4o 在這些類別中的任何類別中的得分都不高于中等風險。該評估涉及在整個模型訓練過程中運行一套自動化和人工評估。我們使用自定義微調和提示測試了模型的安全緩解前和安全緩解后版本,以更好地激發模型功能。

GPT-4o 還與 70 多個外部紅隊進行了廣泛的合作external experts社會心理學、偏見和公平以及錯誤信息等領域的外部專家,以確定新增加的模式引入或放大的風險。我們利用這些經驗來制定安全干預措施,以提高與 GPT-4o 交互的安全性。我們將繼續降低發現的新風險。

我們認識到 GPT-4o 的音頻模式帶來了各種新的風險。今天,我們公開發布文本和圖像輸入以及文本輸出。在接下來的幾周和幾個月里,我們將致力于技術基礎設施、培訓后的可用性以及發布其他模式所需的安全性。例如,在發布時,音頻輸出將僅限于選擇預設的聲音,并將遵守我們現有的安全政策。我們將在即將發布的系統卡中分享有關 GPT-4o 全部模式的更多詳細信息。

我們希望得到反饋來幫助確定 GPT-4 Turbo 仍然優于 GPT-4o 的任務,以便我們可以繼續改進模型。

型號可用性

GPT-4o 是我們突破深度學習界限的最新舉措,這次是朝著實用性的方向發展。在過去的兩年里,我們花費了大量的精力來提高堆棧每一層的效率。作為這項研究的第一個成果,我們能夠更廣泛地提供 GPT-4 級別模型。 GPT-4o 的功能將迭代推出(從今天開始擴大紅隊訪問權限)。

GPT-4o 的文本和圖像功能今天開始在 ChatGPT 中推出。我們正在免費套餐中提供 GPT-4o,并向 Plus 用戶提供高達 5 倍的消息限制。我們將在未來幾周內在 ChatGPT Plus 中推出新版語音模式 GPT-4o 的 alpha 版。

開發人員現在還可以在 API 中訪問 GPT-4o 作為文本和視覺模型。與 GPT-4 Turbo 相比,GPT-4o 速度提高 2 倍,價格降低一半,速率限制提高 5 倍。我們計劃在未來幾周內在 API 中向一小群值得信賴的合作伙伴推出對 GPT-4o 新音頻和視頻功能的支持。

更多GPT-4o詳細內容:https://openai.com/index/hello-gpt-4o/

收藏
#GPT-4o
最新工具
轉換云
轉換云

一個在線音樂格式轉換網站,包括.ncm、.mgg、.mflac、...

蘿卜工坊
蘿卜工坊

一個能把電子文本變成逼真手寫風格的在線工具。它有AI專屬字體制作...

LyricsPoster
LyricsPoster

一個幫你把喜歡的歌手圖片和歌詞做成海報的在線工具。你可以在簡單的...

藍豆打字
藍豆打字

一個在線打字練習平臺,提供鍵盤指法、拼音、雙拼、五筆、源代碼、英...

一頁紙EasyPaper
一頁紙EasyPaper

一個能生成自定義紙張的免費在線工具。通過網頁界面,用戶可自行設置...

88查
88查

阿里旗下1688推出的企業信息查詢和商業情報工具。它利用大模型實...

Sleep Calculator
Sleep Calculator

一種利用睡眠周期設計的工具。輸入期望起床時間,它能自動算出多個適...

媒發
媒發

一款讓內容分發更簡單高效的工具,它的核心優勢是1分鐘就能把內容發...

FantasyGen
FantasyGen

能在線生成奇幻地圖的AI工具,用戶只要輸入對地圖的描述、選好風格...

DriftOS
DriftOS

一個免費的白噪音網站,不用注冊登錄,打開網頁就能直接播放聲音,不...

主站蜘蛛池模板: 叙永县| 星子县| 铜梁县| 高淳县| 白银市| 香格里拉县| 休宁县| 张家港市| 望江县| 鹤山市| 虎林市| 杂多县| 如东县| 开化县| 徐汇区| 太仆寺旗| 平安县| 梁河县| 隆子县| 太和县| 泊头市| 临汾市| 桃园市| 祥云县| 土默特右旗| 六盘水市| 开鲁县| 开鲁县| 四子王旗| 凤冈县| 隆昌县| 汝阳县| 建德市| 封丘县| 巴南区| 睢宁县| 田林县| 台中市| 龙井市| 定安县| 和平县|