真實世界的人工智能應用落地——OpenAI篇 ⛵

語言: CN / TW / HK

💡 簡介

AI 以迅速的發展,不僅僅在研究界帶來了革新,在生活的方方面面也提供智能化,使我們更便利。在本篇內容中,ShowMeAI將介紹 OpenAI 的主要發展以及它們實際落地的 AI 產品應用。

💡 OpenAI vs DeepMind,兩大人工智能巨頭應對不同挑戰

OpenAI 的使命側重於以安全的方式為全人類實現人工智能的可用性。OpenAI 的模型為數據提取、文本生成、語音識別、圖像生成或編輯等日常任務帶來了高效的解決方案。儘管它們的任務和目標不同,但它們在開發大型模型方面有着共同的努力,這些模型在當今的大多數應用中都發揮着關鍵的作用。

DeepMind 的使命是解決智能問題,推動科學發展並造福人類。因此,它強調通用智能,即 AI 在任何情況下都能夠自行學習。這也解釋了為什麼 DeepMind 所有的突破都依賴於深度強化學習,即 AI 只有一個目標和一組可能的行動,需要找出實現該目標的最佳方法。

💡 GPT3,超智能化的內容生成助手

💦 GPT3介紹

📘GPT-3 是一種深度學習模型,該模型經過訓練後可以預測序列中的下一個標記,並能生成流暢逼真的文本,覆蓋文本分析和摘要、文案撰寫、代碼生成等應用場景。GPT-3 在發佈後不久就掀起了全球的熱潮,促進了大量應用程序和初創公司的誕生。下圖為用户使用 “Grammar Correction” 開始編程的操作示例。

💦 現實生活中的應用

OpenAI 官方表示,OpenAI API是公司第一個商業產品,自推出九個月以來,超過 300 個應用在使用 GPT-3,成千上萬的開發人員在使用平台。目前平均每天生成 45 億個單詞,且生產流量繼續擴大中。

如果你需要在線的文本解決方案,那可以閲讀更多相關信息並自己把模型玩起來:http://beta.openai.com/playground。OpenAI 為所有新帳户提供 18 美元的信用額度。

💡 CLIP,文本和圖像的天然融合藝術

💦 CLIP介紹

📘CLIP 是 OpenAI 開發的一種大型預訓練語言模型,將輸入的文本映射到一個連續的向量空間,並通過計算兩個文本之間的距離來進行文本分類和相似度計算。與傳統的語言模型不同,CLIP可以通過學習數據庫中的大量文本數據來實現端到端的文本分類,而不需要任何人工標註。因此,它可以用於許多不同的文本分類任務,包括情感分析、知識圖譜構建和圖像標註。下圖表明 CLIP 極大地改進了圖像分類的結果!

💦 現實生活中的應用

CLIP可以完成零樣本圖像分類、圖像描述、內容審核、圖像生成等。值得注意的是,CLIP 是 DALLE 的構建塊之一。

💡 DALL·E 2,優秀的藝術家

💦 DALL·E 2介紹

📘DALL·E 2 是 OpenAI 公司研發的一款新的人工智能系統,不僅可以根據文本描述生成對應的逼真圖像,還可以根據文本提示修改圖像內容,以及根據給定的圖像拓展生成多種主題風格一致的“變體”。目前公開可用,可以直接訪問 OpenAI 網站,也可以調用 API(2022 年 11 月已經發布!)。

💦 現實生活中的應用

DALL·E 2 的影響力可與 GPT3 媲美,應用場景也非常豐富,包括插圖、圖像攝影、NFT 生成、圖像編輯等。微軟已經宣佈 DALL·E 2 將為其 Designer App 提供支持;Shutterstock 還宣佈與 OpenAI 建立合作關係,允許用户在平台上使用 DALL·E 2 進行創作!

💡 Whisper,聽懂所有語言的智者

💦 Whisper介紹

📘Whisper 是一個自動語音識別 (ASR) 系統。它使用從網絡上收集的 680,000 小時多語言和多任務監督數據進行訓練。使用如此龐大且多樣化的數據集可以提高對口音、背景噪音和技術語言的魯棒性。此外,它還支持多種語言的轉錄,以及將這些語言翻譯成英語。

💦 現實生活中的應用

Whisper 是免費和可編程的,使用體驗令人興奮!這也使其成為現有商業語音識別服務的有力競爭者。它也可能直接挑戰了當前主流的“基於雲的 ASR 服務”。

由於 Whisper 模型較小,便於本地運行的移動 App 使用,從而可以避免轉錄前數據上傳雲端導致的隱私問題(已經有人行動起來了 📘例如下方推文)。

💡 Codex,完美代碼生成助手

💦 Codex介紹

📘OpenAI Codex 是一種基於 GPT-3 的自然語言到代碼系統,有助於將 自然語言指令轉換為十幾種流行的編碼語言。Codex 於去年 8 月通過 OpenAI 的 API 發佈,是 GitHub Copilot 的主要構建塊。

其實,可以要求 GPT3 解釋一段簡單的文本代碼,從代碼到解釋性文本這個過程GPT3也可以做得很好,理解和生成代碼的能力已經編碼在 GPT3 中。而 Codex 專注於生成可執行代碼,使其成為開發人員的絕佳助手。由於它已經集成到 Visual Studio 中,根據經驗,將它無縫集成到開發週期中。

💦 現實生活中的應用

許多應用已經出現,包括各種代碼助手 copilot、pygma 和 replit 等。

  • Copilot 編碼助手能夠根據指示生成代碼、將註釋轉換為代碼、生成測試並提出備選方案。
  • Pygma 使用 Codex 將 Figma 設計轉換為高質量代碼。
  • Replit 使用 Codex 描述選定的一段代碼的作用,以便每個人都能理解其功能。

下圖為 Replit 依靠 Codex 來解釋部分代碼。

💡 ChatGPT,令人興奮的AI聊天機器人

💦 ChatGPT介紹

📘ChatGPT 是 OpenAI 於 11 月 30 日推出的一款聊天機器人,能根據用户的提示,在對話中生成類似人類的文本響應,完成回答問題、提供信息或參與對話等各種任務。與許多使用預定義的響應或規則生成文本的聊天機器人不同,ChatGPT 經過了訓練,可以根據接收到的輸入生成響應,從而生成更自然、更多樣化的響應。

ChatGPT的亮點主要有哪些?

  • 新增代碼理解和生成能力,對輸入的理解能力和包容度高,能在絕大部分知識領域給出專業回答。
  • 加入道德原則。即ChatGPT能夠識別惡意信息,識別後拒絕給出有效回答。
  • 支持連續對話。ChatGPT具有記憶能力,提高了模型的交互體驗。

💦 現實生活中的應用

ChatGPT不僅會聊天,寫得了代碼,修復得了bug,還能幫你寫工作週報、寫小説、進行考試答題,繪畫,看病,甚至你還可以誘騙它規劃如何毀滅人類,許多人認為,ChatGPT不僅僅是一個聊天機器人,而可能是現有搜索引擎的顛覆者。

參考資料

推薦閲讀

「其他文章」