中國風?古典系?AI中文繪圖創作嚐鮮!⛵
- 💡 作者:韓信子@ShowMeAI
- 📘 深度學習實戰系列:https://www.showmeai.tech/tutorials/42
- 📘 本文地址:https://www.showmeai.tech/article-detail/413
- 📢 宣告:版權所有,轉載請聯絡平臺與作者並註明出處
- 📢 收藏ShowMeAI檢視更多精彩內容
💡 引言
人工智慧影象生成器現在風靡一時。雖然 📘Dall-E2、 📘MidJourney和 📘Stable Diffusion目前處於中心舞臺,但是百度開發的開源 AI 影象生成器 📘ERNIE-ViLG 也在網際網路上流傳。
💡 ERNIE-ViLG 是什麼
ERNIE 代表通過知識整合增強表示——視覺語言生成。它是一個統一的生成預訓練框架,用於使用 Transformer 模型進行雙向影象文字生成。
需要明確的是,ERNIE 並不是 Stable Duffusion 的一個變體版本,儘管這兩種模型都是開源的。根據 📘ERNIE論文,ERNIE-ViLG 2.0 是一種改進的文字到影象擴散模型,具有知識增強的去噪專家組合,以結合有關視覺場景的額外知識,並在不同步驟中解耦去噪能力。
💡 ERNIE-ViLG 使用方法
現在可以通過 huggingface 免費訪問該模型。我們可以在 📘ERNIE-ViLG Demo 檢視工具例項。
介面非常簡單:可以看到經典的提示框,各種藝術風格的選擇,以及影象解析度。在藝術風格方面,ERNIE 提供了一些有趣的選擇。這讓我想起了 📘Dream by WOMBO 中的一個類似功能。
讓我們用提示“An astronaut riding a horse in space”來生成樣本。
該應用程式生成六張解析度為 1024x1024 的影象。
ERNIE 的研究人員聲稱,他們的方法比 Dall-E2 和 Stable Diffusion 產生更清晰、更自然的細節。
真的嗎?現在讓我們嘗試將藝術風格更改為“油畫”。
這些結果本身都非常驚豔。
質量上,ERNIE 可以與 Dall-E2 和 Stable Diffusion 相媲美。但是,它在一致性方面表現不佳,就像在上面提到的,其中兩個結果中的馬無處可尋。這可能是訓練ERNIE的資料集較小所致。
不過,如果仔細考慮資料集的大小,訓練了 14.5 億張影象的 ERNIE 與 MidJourney、Google Parti 等大型競爭對手的差距並不大。
也許開發人員找到了一種優化演算法的方法,使其能夠在較小的資料集上執行良好。我假設如果模型是在更大的資料集上訓練的,現有的限制就會消失。
需要特別注意的是,ERNIE 是用中文開發的。這意味著,在開始影象生成過程之前,必須將英文提示翻譯成中文。當然,使用中文的寶寶可以盡情玩耍~
這裡有更多示例結果。
上圖提示文字:“戴眼鏡的貓”風格“油畫”
上圖提示文字:“五官端正的繪畫女生”
💡 API 訪問 ERNIE-ViLG
您可以通過 API 訪問 ERNIE。如果您想嘗試使用 API,請按照這個 📘GitHub 上的指南進行操作。
示例 API 呼叫如下所示。
python
def generate_image(
text_prompts:str,
style: Optional[str] = "探索無限",
topk: Optional[int] = 6,
output_dir: Optional[str] = 'ernievilg_output')
text_prompts
:輸入提示style
:生成影象的風格topk
:生成影象的數量(最多 6 個)output_dir
:儲存輸出影象的目錄
ERNIE 的使用指南還有一個建議列表,可幫助您找到結合使用樣式和修飾符的最佳方式。
- 【作圖規則】Prompt構建是文字符合邏輯的組合,有序且豐富的描述可以不斷提升畫面效果
- 【新手入門】不知如何輸入Prompt?點選示例,體驗文生圖的魅力,參考教程,逐步進階~
- 【風格生成】試試新增 “國潮”、“國風”等,感受中國風的魅力
- 【風格生成】試試混合兩種代表性的風格,例如“賽博朋克,扁平化設計”、”皮克斯動畫,賽博朋克”
- 【人像生成】新增“仙鶴、月亮、樓閣、小屋、街道、玫瑰、機械”,畫面會更飽滿
- 【人像生成】新增“精緻面容、唯美、cg感、細節清晰“等,人物刻畫會更細緻
- 【風格生成】新增“扁平化風格,logo”等,可以設計出各類圖示等,例如 “貓貓頭像,扁平化風格”
- 【風格生成】指定顏色,或新增“煙霧繚繞”、“火焰”、“煙塵”、“花瓣”,生成畫面的氛圍感更飽滿
- 【創意生成】發揮想象力,例如:“中西混搭”、“泰迪熊唱京劇”、“米老鼠吃火鍋”
- 【風格生成】“水彩”,“水墨”與古詩組合,畫面意境會有提升~
- 【風格生成】想要日系頭像和擬人化動物?試試關鍵詞“日系手繪”、“治癒風”
- 【風格生成】新增“pixiv”,生成二次元或者動漫的畫質更驚豔
參考資料
- 感謝飛書放過幕布!100個GPT-4實戰案例;GPT-4免費平替Poe;AI繪畫新手指南之SD篇;new Bing靠譜教程 | ShowMeAI日報
- whylogs工具庫的工業實踐!機器學習模型流程與效果監控 ⛵
- 脈脈瘋傳!2023年程式設計師生存指南;多款prompt效率加倍工具;提示工程師最全祕籍;AI裁員正在發生 | ShowMeAI日報
- 中國風?古典系?AI中文繪圖創作嚐鮮!⛵
- Python中內建資料庫!SQLite使用指南!
- Pandas中你一定要掌握的時間序列相關高階功能
- 資料科學家賺多少?資料全分析與視覺化 ⛵
- 互動式儀表板!Python輕鬆完成!⛵
- ChatGPT!我是你的破壁人;比爾·蓋茨不看好Web3與元宇宙;FIFA押中4屆世界盃冠軍;GitHub今日熱榜 | ShowMeAI資訊日報
- ChatGPT要收費了;華爾街大裁員;阿里2023十大科技趨勢;小紅書元宇宙虛擬服飾被吐槽;GitHub今日熱榜 | ShowMeAI資訊日報
- AI創業時代!這9個方向有錢途;AIGC再添霸榜應用Lensa;美團SemEval2022冠軍方法分享;醫學影象處理工具箱… | ShowMeAI資訊日報
- 噓!P站資料分析年報;各省市疫情感染進度條;愛奇藝推出元宇宙App;You推出AI聊天機器人;GitHub今日熱榜 | ShowMeAI資訊日報
- 美國公司裁員潮時間線◉科技寒冬視覺化;3份報告回顧中國開發者2022;自動駕駛下半場,誰會衝出重圍 | ShowMeAI每週通訊 #005-01.07
- 副業月入過萬?資料有話說;掃地機器人發展到哪步了;疫情後要不要重返辦公室;淘寶元宇宙直播間;GitHub今日熱榜 | ShowMeAI資訊日報
- 大戰谷歌!微軟Bing引入ChatGPT;羊了個羊40萬年薪招研發;Debian徹底移除Python2;GitHub今日熱榜 | ShowMeAI資訊日報
- 酸了!樂視工作制改為四天半;高通新年裁員;AI繪畫公司開始倒閉;網易入股張藝謀元宇宙公司;GitHub今日熱榜 | ShowMeAI資訊日報
- 要麼幹要麼滾!推特開始裁員了;深度學習產品應用·隨書程式碼;可分離各種樂器音源的工具包;Transformer教程;前沿論文 | ShowMeAI資訊日報
- 真實世界的人工智慧應用落地——OpenAI篇 ⛵
- 陽過→陽康,資料裡的時代側影;谷歌慌了!看各公司如何應對ChatGPT;兩份優質AI年報;本週技術高光時刻 | ShowMeAI每週通訊 #003-12.24
- 用魔法打敗魔法!這件毛衣讓攝像頭看不到你;兩款酷炫的AI寫作軟體;快如閃電的B站下載工具;基於擴散模型的蛋白質設計 | ShowMeAI資訊日報