Text-to-3D!建築學小哥自稱編程菜鳥,攢了個AI作畫三維版,還是彩色的
colab上在線可玩
衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
AI畫師,技術又精進了——
直接一句話/一張圖,生成3D模型、環繞視頻、NeRF實例那種。
還是帶顏色的。
輸入“一幅美麗的花樹畫,作者Chiho Aoshima,長鏡頭,超現實主義”,就能瞬間得到一個長這樣的花樹視頻,時長13秒。
這個文本/圖片-3D生成AI,叫 Dreamfields-3D ,來自一個自稱編程菜鳥的建築學在讀博士。
Demo剛被小哥放在微博、推特等平台,許多網友已經急着蹲內測了:
現在,小哥已經將它 開源 ,colab上也能運行。
一起來上手玩玩看~
AI作畫3D版在線玩
Dreamfields-3D玩法十分低門檻,大致只需要三步。這裏介紹一下colab上在線玩的步驟。
首先,檢查一下GPU,再安裝個谷歌驅動器。
第二步,調出工具開始運行,並安裝依賴項。
然後定義一些必要的功能,就可以在colab上訓練和測試了~
玩的時候需要輸入一些參數,保存格式有 視頻 和 網格 兩種,輸出模型格式為帶頂點色的obj和ply。
萬事俱備,讓我們現在開始。
試試輸入“一個賽博朋克風格的飛行霓虹燈汽車,格雷格魯特科夫斯基和西蒙斯大林風格,長鏡頭,CG社會,虛幻的引擎,史詩遊戲”?
會得到一個果然很賽博的汽車的視頻。
如果你是《千與千尋》重度愛好者,想搞張吉卜力風格的視頻玩玩。
沒問題,prompt輸入“一張美麗的天空城市的插圖,吉卜力工作室,藝術站,8k HD,CG社會”,這不就來了——
有網友迫不及待上手,做出了個小計算機。
當然在鵝妹子嚶的驚歎中,也有網友表達了希望Dreamfields-3D更好的期許。
當然,除了文本輸入,Dreamfield3D是支持 圖片 作為prompt的。
不過現在版本還 有待完善 ,如果輸入圖片,會造成過擬合,簡單説就是如果餵它一張車的正面圖,生成的3D視頻中,那輛車可能4個面都是正面……
想要玩兒圖片輸入的友友們,怕是要再等等了。
基於現狀,小哥在GitHub表達了未來的改進目標:
- 同時使用不同的CLIP模型。
- 僅在指定方向應用圖像提示。未來可能要加一個圖片角度的約束,例如只有在輸入圖片相同角度時,輸出才參考該圖片。
- 作為NeRF實例讀取現有網格,然後通過文本/圖像prompt進行修改。
- 在訓練中減少GPU RAM的使用。
(但小哥説了,自己是個編程菜鳥,後續可不保證哦)doge
基於谷歌Dreamfields-Torch
小哥是建築學出身,據他講,Dreamfield3D是他從創作者角度出發,對Dreamfield-Torch做了些優化,主要的代碼工作還是來自上游的Dreamfields-Torch和Dreamfields。
介紹下, Dreamfields 來自谷歌,它的特點是無需照片樣本,簡簡單單一句話,就能生成3D圖像,還可以生成多種物品組合成的複合結構。
在生成3D場景時,通常會選用 神經輻射場 (NeRF)參數方案。
NeRF的特點是可分別渲染場景,但需要很多張3D照片,才能實現360°視覺重建。
相比之下,Dreamfields生成3D模型 不需要照片 ,因為它基於NeRF 3D場景技術、OpenAI文本生成模型DALL·E以及CLIP的3D生成系統開發,通過神經網絡來儲存3D模型。
DALL·E和CLIP同樣師出谷歌,前者通過文本生成圖像,後者通過文本分類圖片。用CLIP來分類DALL·E生成的圖像,可以提升圖像生成的準確性。
Dreamfields-Torch則是一個經過修改的Dreamfields的Pytorch實現,主要是把原Dreamfields的後端,從原始NeRR換成了instant-ngp。
以此為基礎,小哥做出的Dreamfields-3D基本上靠 CLIP + NERF 運作。
作者簡介
作者蒙勝宇(Simon Meng),奧地利因斯布魯克大學(UIBK)建築學在讀博士。
碩士畢業於倫敦大學學院(UCL)建築學,現為UIBK及UCL技術課程助教及特邀評圖嘉賓,從事建築設計、藝術、AI及生物學跨領域研究。
小哥從去年6、7月份開始關注AI圖像生成。
他發現,很多破圈技術,如clip guide diffusion,disco diffusion,都是一些懂代碼的跨界者做的。
去年年末谷歌發佈Dreamfields,他就動了用它做3D輸出的心思。
於是,在拿到動畫後,他用AI做了超採樣放大和插幀,然後導出幀到普通的多目重建軟件(類似colmap),成功重建mesh(一個用3D模型數據還原的模型圖)。
小哥把mesh發在推特上,結果Dreamfields論文的原作者Ajay Jain聯繫到他,表示了歡迎,還鼓勵他保持優化更新——雖然那時候他用的是普通航拍實景重建軟件,不是編程方法。
上個月,小哥在Dreamfield-Torch的基礎上做了colab版,本月在GitHub開源,讓大家能夠愉快地玩耍。
以及,現在這個已經是基於Marching cubes的船新版本啦~
GitHub地址:
http://github.com/shengyu-meng/dreamfields-3D
colab地址:
http://colab.research.google.com/drive/1u5-zA330gbNGKVfXMW5e3cmllbfafNNB?usp=sharing#scrollTo=_VDLFG_gUEKa
參考鏈接:
[1]http://weibo.com/1948301550/M4o6m3vGn?type=comment#_rnd1663119855180
[2]http://twitter.com/meng_shengyu
[3]http://github.com/ashawkey/dreamfields-torch
版權所有,未經授權不得以任何形式轉載及使用,違者必究。
- LeCun:概率論無法實現真正AI,我們要退回原點重新開始
- Text-to-3D!建築學小哥自稱編程菜鳥,攢了個AI作畫三維版,還是彩色的
- 連你家電器的算力都不放過,新發現Linux惡意軟件用IoT設備挖礦,大小僅376字節
- Linux之父是個果粉:給自用M2 Mac裝上Fedora Linux,除了圖形加速和Chrome都搞定了
- 在百度搞發明的人
- 40系顯卡首批7199元起!賽博朋克2077幀數x4,老黃:大部分像素都是AI預測而非計算
- DeepMind用新AI超越自己:提速200倍,在所有雅達利遊戲上勝過人類
- 比標準Attention快197倍!Meta推出多頭注意力機制“九頭蛇”
- 可生成高清視頻的Stable Diffusion來了!分辨率提升4倍,超分算法來自騰訊,支持Colab在線試玩
- 大規模顯卡挖礦徹底涼涼,網友開香檳坐等價格崩盤,老黃連夜發40系預熱
- 小鵬打響特斯拉FSD對壘第一槍,城市路況AI開,目前僅限廣州
- 學術審稿潛規則被Science曝光:作者名氣越大,審稿人打分越高
- 7cm半機械蟑螂火了!極端環境也能做搜救工作,網友:我得嚇死
- 2022字節跳動Byte Camp夏令營:53所高校學員雲端完成24個項目
- 理想總裁2天套現近1億上熱搜,網友:要跑?
- 抖音智創語音團隊三維菁彩聲助力總枱中秋晚會沉浸式直播
- iOS 16升級引熱議,網友吐槽鎖屏太花哨,潘粵明更新後一度登不上微信
- 扎克伯格把PyTorch捐了!已歸入Linux基金會
- 晚上多吃不一定會胖,Cell子刊最新研究顛覆減肥認知
- 誰是下一個丘成桐?產業界也開始關心這事兒了