錯過了前三次的偉大革命(蒸汽機革命、電氣革命、資訊革命),GPT-4 你還要錯過人工智慧AI革命嗎!!!

語言: CN / TW / HK

錯過了前三次的偉大革命(蒸汽機革命、電氣革命、資訊革命),GPT-4 你還要錯過人工智慧AI革命嗎!!!

看 GPT-4 是如何煉成絕世神功:葵花寶典?

欲練神功,不必自宮。西方不敗——GPT-4!

GPT-4 is OpenAI’s most advanced system, producing safer and more useful responses

GPT-4 是 OpenAI 最先進的系統,可產生更安全、更有用的響應

image-20230317095643129.png

更牛的問題解決能力

GPT-4由於其更廣泛的通用知識和解決問題的能力,可以更準確地解決難題。

Creativity 創造力

GPT-4 比以往任何時候都更具創造性和協作性。它可以生成、編輯並與使用者一起完成創意和技術寫作任務,例如創作歌曲、編寫劇本或學習使用者的寫作風格。

GPT-4 Input 輸入:

Explain the plot of Cinderella in a sentence where each word has to begin with the next letter in the alphabet from A to Z, without repeating any letters. 用一個句子解釋灰姑娘的情節,其中每個單詞必須以字母表中從 A 到 Z 的下一個字母開頭,不重複任何字母。

GPT-4 Output 輸出:

A beautiful Cinderella, dwelling eagerly, finally gains happiness; inspiring jealous kin, love magically nurtures opulent prince; quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously. 美麗的灰姑娘,渴望安居,終於獲得幸福;激起嫉妒的親人,愛情神奇地孕育出富貴的王子;悄悄拯救,拖鞋勝利,團結無比,熱心青年。

ChatGPT Input 輸入:

Explain the plot of Cinderella in a sentence where each word has to begin with the next letter in the alphabet from A to Z, without repeating any letters. 用一個句子解釋灰姑娘的情節,其中每個單詞必須以字母表中從 A 到 Z 的下一個字母開頭,不重複任何字母。

ChatGPT Output 輸出:

After attending a ball, Cinderella dances enchantingly for good-hearted King, leaving midnight noticed or perhaps quickly returning slipper to unite victoriously with prince, resulting in ultimate victory with wonderful, extravagant, youthful zest. 參加舞會後,灰姑娘為好心的國王翩翩起舞,留下午夜的注意,或者迅速返回拖鞋,與王子勝利團結,以美妙、奢侈、青春的熱情取得最終勝利。

image-20230317084912093.png

對比看下哪個更牛~

Visual input 視覺輸入

GPT-4 can accept images as inputs and generate captions, classifications, and analyses.

GPT-4 可以接受影象作為輸入並生成說明、分類和分析。下面是接受一個影象的輸入之後,生成影象說明、分類和分析的輸出結果:

image-20230317085635694.png

Input 輸入:

What can I make with these ingredients? 我可以用這些原料做什麼?

Output 輸出:

你可以用這些原料做很多選擇!一些可能性包括: - 煎餅或華夫餅 - 可麗餅 - 法式吐司 - 煎蛋卷或菜肉餡煎蛋餅 - 乳蛋餅 - 奶油凍或布丁 - 蛋糕或紙杯蛋糕 - 鬆餅或麵包 - 餅乾或餅乾 這些只是幾個例子,但可能性是無窮無盡的!

有木有很牛逼~

能夠識別分析影象那就越來越接近人類了,不但可以對話,還可以感知外在的世界,如果可以聊天時有腦有嘴的話,GPT-4那現在就是有眼了,有視覺能力了。當一個機器有視覺能力之後會發生什麼???大家可與腦洞一下~

有視覺能力這是GPT-4有別於前幾代GPT重大的升級,也是人工智慧發展到另一個新的里程碑的意義。AI 革命現在不是未來可期了,而是未來已來了,就發生在你我所處的這個共同的時代,老鐵們還不趕緊上車 (觀眾公眾號“李榮生”,瞭解及時準確全面的GPT的進展,ChatGPT新技術的在業務中的調教、應用和體驗)

錯過了前三次的偉大革命(蒸汽機革命、電氣革命、資訊革命),你還要錯過人工智慧AI革命嗎!!!

Longer context 更長的上下文

GPT-4 能夠處理超過 25,000 個單詞的文字,允許使用長格式內容建立、擴充套件對話以及文件搜尋和分析等用例。

Input 輸入:

[Text from: http://en.wikipedia.org/wiki/Rihanna] ​ Describe her Super Bowl performance and what made it special. 描述她在超級碗比賽中的表現以及它的特別之處。

Output 輸出:

Rihanna's Super Bowl LVII halftime show performance was special for a number of reasons. For one, it marked her first live performance in over five years, and it was her first time headlining the Super Bowl halftime show. Additionally, she made history by becoming the first person to perform at the Super Bowl while pregnant. The show itself was critically acclaimed, with many praising her high-energy performance and impressive vocals. It also garnered a massive viewership, becoming the second most-watched halftime show in history. 出於多種原因,蕾哈娜 (Rihanna) 的超級碗 LVII 中場秀表演很特別。首先,這是她五年多來的第一次現場表演,也是她第一次登上超級碗中場秀的頭條新聞。此外,她還創造了歷史,成為第一個在懷孕期間在超級碗上表演的人。該節目本身廣受好評,許多人稱讚她充滿活力的表演和令人印象深刻的歌聲。它還獲得了巨大的收視率,成為歷史上收視率第二高的中場秀。

備註: Super Bowl 超級碗是美國職業橄欖球聯盟(NFL)每年舉行的年度總決賽,通常在每年的二月初舉行,是美國和全球最受關注和觀看的單一體育賽事之一。

可以接收wikipedia網址地址的輸入,並經過分析之後歸納蕾哈娜 (Rihanna)比賽的表現和特別之處。為解決部分老鐵不方便之門,我把wikipedia地址的部分內容截圖如下:是個美女哦~

image-20230317092527923.png

可以接收更多文字的輸入,包括網址地址的搜尋和分析,經過理解之後可以根據prompt提示輸出,理解問題的能力更強大了。

GPT-4的能力總結一句話:會說、會看、更懂你!!!

更牛的推理能力

GPT-4 的高階推理能力超越了 ChatGPT,ChatGPT VS GPT-4 推理能力對比:

image-20230317083206574.png

ChatGPT Input 輸入:

Andrew從上午11點到下午3點有空,Joanne從中午到下午2點,然後下午3:30到5點有空。Hannah在中午有半個小時的時間,然後下午4點到6點。Andrew、Hannah和Joanne 30分鐘會議的開始時間有哪些選擇?

ChatGPT Output 輸出:

以下是它們的可用性列表: -安德魯:上午11點至下午3點 -喬安妮:中午至下午2點,下午3:30至下午5點 -漢娜:中午至下午12:30,下午4點至6點 ​ 根據他們的可用性,他們三人都有30分鐘的可用時間,從下午4點到下午4點30分。因此,會議可以安排在下午4點。

ChatGPT-4 Input 輸入:

Andrew從上午11點到下午3點有空,Joanne從中午到下午2點,然後下午3:30到5點有空。Hannah在中午有半個小時的時間,然後下午4點到6點。Andrew、Hannah和Joanne 30分鐘會議的開始時間有哪些選擇?

ChatGPT-4 Output 輸出:

安德魯:上午11點至下午3點 喬安妮:下午12點至2點,下午3:30至5點 漢娜:下午12點至12點30分,下午4點至6點 ​ 30分鐘會議的常見時間:中午12點至中午12點30分

ChatGPT VS GPT-4 考試能力對比

參加 美國 (Uniform Bar Exam 統一律師考試)和(Biology Olympiad 生物奧林匹克競賽考試)的對比,GPT-4 通過在測試中獲得更高的近乎一百分滿分數證明優於 ChatGPT。

image-20230317081742335.png

備註: Uniform Bar Exam(普通考試統一律師資格考試),簡稱UBE,是一個跨越美國多個州的法律考試。它是由具有法律職業監管權的各州聯合開發的,旨在便捷地實現律師的跨州執業。通過UBE,考生只需參加一次考試,就能將成績用於多個州的律師資格申請。UBE考試由三個部分組成,包括多項選擇題、法律分析和寫作。考試的題材涵蓋了民法、刑法和司法程式等多個領域的知識。通過UBE考試是律師在跨州執業時的重要成就之一,同時也證明了其掌握了足夠的法律知識和技能,能夠為客戶提供高質量的法律服務。

Biology Olympiad(生物奧林匹克競賽)是一個面向中學生的國際生物學競賽。它由國際生物學奧林匹克委員會(IBO)組織,旨在鼓勵中學生研究生物學、發展科學技能以及推動全球青少年對生物學的興趣。每年,參賽國家都會選派最優秀的中學生代表參加IBO大賽。本競賽通常包括一系列基礎和高階的生物學知識測試、實驗考察和科學研究等專案。參加Biology Olympiad不僅能鍛鍊和展示學生的生物學技能,還可以幫助學生獲得在全球範圍內訪問高水平生物學教育和研究資源的機會。

GPT-X 進化中

遵循 GPT、GPT-2 和 GPT-3 的研究路徑,我們的深度學習方法利用更多資料和更多計算來建立越來越複雜和強大的語言模型。

gpt-4-motif-20230317081633225.svg

GPT-4進化之旅

We spent 6 months making GPT-4 safer and more aligned. GPT-4 is 82% less likely to respond to requests for disallowed content and 40% more likely to produce factual responses than GPT-3.5 on our internal evaluations.

花費了6個月的時間來確保GPT-4更加安全和準確。我們對GPT-4進行了多次內部測試和修改,使其回答不被允許的內容請求的可能性降低了82%,同時在產生事實回答時的準確率比GPT-3.5提高了40%。這意味著我們對GPT-4進行了改進,解決了其可能存在的問題,並提高了它的準確性和可靠性,使其更適合用於公共平臺。

簡單一句話就是:我更牛逼了~。更要命的是,這個傢伙還不斷迭代、不斷進化中~

欲練神功,不必自宮,是否會煉就為真正的一個——西方不敗(GTP-X)?

如果做到更安全和更準確?

Safety & alignment 他們(OpenAI)是這樣做的:

人工反饋訓練

我們在訓練GPT-4時,吸收了更多人類反饋,包括ChatGPT使用者提交的反饋,以改善GPT-4的行為。我們還與超過50位專家合作,包括AI安全和安全領域的專家,進行早期反饋。

通過真實世界的使用不斷改進

我們將從以前模型在真實世界使用時的經驗教訓中,應用到GPT-4的安全研究和監控系統中。就像ChatGPT一樣,隨著越來越多的人使用GPT-4,我們也將以定期的節奏更新和改進它。

GPT-4協助的安全研究

GPT-4的高階推理和指令遵循能力加速了我們的安全工作。我們使用GPT-4來建立訓練資料,進行模型微調,並在訓練、評估和監控中迭代分類器。

有誰在使用 GPT-4 能力?

使用 GPT-4 構建創新產品的組織合作包括:

Stripe網際網路支付平臺 Stripe 利用 GPT-4 來簡化使用者體驗並打擊欺詐。

Morgan Stanley華爾街摩根士丹利投資銀行 摩根士丹利財富管理部署 GPT-4 來組織其龐大的知識庫。

Khan Academy全球線上平臺可汗學院 可汗學院在有限的試點專案中探索 GPT-4 的潛力

Government of Iceland冰島政府 冰島如何使用 GPT-4 來保護其語言。

Duolingo GPT-4 加深了 Duolingo 上的對話。Duolingo是一款流行的語言學習應用程式,允許使用者以遊戲化的方式學習一系列不同的語言。Duolingo 提供了一個互動平臺,通過其獨特的教學方法和遊戲元素,讓使用者在輕鬆有趣的環境中學習語言。Duolingo的目標是幫助人們學習語言、提高溝通技能和拓寬對其他文化的理解。它同時也為使用者提供一個可持續的、個性化的學習體驗。Duolingo 影響了全球數百萬語言學習者,並在廣泛的年齡範圍內取得了成功。

Be My Eyes 利用GPT-4技術改變了視覺輔助功能。Be My Eyes是一款志願者和盲人使用者之間的求助平臺。該平臺讓盲人使用者請求幫助時,匹配到願意幫助的志願者。使用GPT-4技術,Be My Eyes可以識別影象並實時將描述傳送給需要幫助的盲人使用者。這使得盲人使用者可以像有視力的人一樣,獲取到更多關於周圍環境的資訊。

通過在技術上方便快捷地連線盲人使用者和有視力的志願者,Be My Eyes廣泛地改變著視覺障礙群體的生活中的社交和日常方面。這項技術幫助他們更好地融入社會,增強了他們的自信和獨立性。最重要的是,Be My Eyes通過與GPT-4技術的整合,成為了利用人工智慧的科技慈善的優秀典範。

還有下面其他應用案例:

image-20230317074524959.png

gpt-4-motif.svg

關於 GPT-4 的更多資訊

More on GPT-4 :

| Research 研究 | GPT-4 是 OpenAI 在深度學習擴充套件方面的最新里程碑。詳情請檢視 GPT-4 研究。 | | ------------------ | -------------------------------------------------------------------------------------------------------------- | | Infrastructure基礎設施 | GPT-4 是在微軟 Azure AI 超級計算機上進行訓練的。Azure 的人工智慧優化基礎設施還使我們能夠向全球使用者提供 GPT-4。 | | Limitations 限制 | GPT-4 仍然存在許多已知的限制,例如社會偏見、幻覺和對抗性提示,我們正在努力解決這些問題。隨著社會採用這些模型,我們鼓勵和促進透明度、使用者教育和更廣泛的人工智慧素養。我們還旨在擴大人們在塑造我們的模型方面的輸入途徑。 | | Availability 可用性 | GPT-4 在 ChatGPT Plus 上可用,並作為 API 提供給開發人員構建應用和服務。 |

We’re excited to see how people use GPT-4 as we work towards developing technologies that empower everyone.

我們很期待看到人們如何使用 GPT-4,同時我們將努力開發能夠賦予每個人權力的技術。

View contributions

GPT-4 API 候補名單

We’re making GPT-4 available as an API for developers to build applications and services.

我們將 GPT-4 作為 API 供開發人員構建應用程式和服務。

Join waitlist 加入候補名單

image-20230317073049107.png

加入候補名單地址:http://openai.com/waitlist/gpt-4-api

Availability 可用性

During the gradual rollout of GPT-4, we’re prioritizing API access to developers that contribute exceptional model evaluations to OpenAI Evals to learn how we can improve the model for everyone. We are processing requests for the 8K and 32K engines at different rates based on capacity, so you may receive access to them at different times. Researchers studying the societal impact of AI or AI alignment issues can also apply for subsidized access via our Researcher Access Program.

在 GPT-4 的逐步推出期間,我們優先考慮為 OpenAI Evals 貢獻卓越模型評估的開發人員訪問 API,以瞭解我們如何為每個人改進模型。我們正在根據容量以不同的速率處理對 8K 和 32K 引擎的請求,因此您可能會在不同時間獲得對它們的訪問許可權。研究 AI 的社會影響或 AI 對齊問題的研究人員也可以通過我們的研究人員訪問計劃申請補貼訪問。

For use cases we tried, GPT-3.5 did not reliably handle multi-language text. We hope to explore GPT-4 for this use case.

對於我們嘗試的用例,GPT-3.5不能可靠地處理多語言文字。我們希望為這個用例探索GPT-4。