Select Page
照片、相片、2D影像轉換成3D模型

照片、相片、2D影像轉換成3D模型

3D Scanner是個很昂貴且複雜難使用的工具,隨著現在算法的精進,AI的流行,各式各樣的工具不斷的出現,早期我還有買一個專用的3D掃描器,現在發現我用手機拍的照片,用AI轉換比我用專業工具掃描的還方便且快速,並且已是用了不少網站服務,是用了不少網站服務,多數還是要費用且還不好用,但 Nvidia 不愧是AI的王者,推出好用且免費還開放原始碼的 NeRF ,入門還算簡單,看下面兩個影片就夠了。

Instant NeRF

下載請到 NVlabs/instant-ngp: Instant neural graphics primitives: lightning fast NeRF and more (github.com)

如果你是 Windows 系統,可以依照下圖,找到適合自己GPU的可執行檔

如果不是的話,就要自己 git 後按照步驟安裝,我自己安裝起來是還蠻麻煩的,建議是找台 Windows 會比較快

PIFuHD

專門用在人物轉3D模型的開源軟體,主要是 FB AI Research 在維護

PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization (shunsukesaito.github.io)

PIFuHD Demo – Colaboratory (google.com)

Meshroom 2023

更開放且進階的 Meshroom 3D 建模軟體

Github 原始碼

alicevision/Meshroom: 3D Reconstruction Software (github.com)

直接下載執行檔

Releases · alicevision/Meshroom (github.com)

ZoeDepht

ZoeDepth可以找出圖片中的深度圖,也可以一鍵建立3D模型以及一鍵建立360的圖片,蠻適合用在室內設計的場景中

ZoeDepth – a Hugging Face Space by shariqfarooq

Kaedim3d

Kaedim | 3D models in minutes (kaedim3d.com)

付費軟體,優點是容易使用,專門在產生一些小物件,尤其是可以給遊戲使用

https://www.app.kaedim3d.com/

參考資料

Turn 2D Images into Immersive 3D Scenes with NVIDIA Instant NeRF in VR | NVIDIA Technical Blog

即時NeRF贏得SIGGRAPH最佳論文,激勵創作者 |英偉達博客 (nvidia.com)

Getting Started with NVIDIA Instant NeRFs | NVIDIA Technical Blog

Knight Rider Rides a GAN with AI, NVIDIA Omniverse | NVIDIA Blog

NVIDIA 發表 GANcraft ,可將 Minecraft 地圖轉化為 3A 遊戲等級場景 #我的世界 (173603) – Cool3c

Stable Diffusion 核心套件更新整理

Stable Diffusion 核心套件更新整理

Stable Diffusion 最近太火紅,是好處也是壞處,好處是更新的速度超快,也代表進步的超快,壞處是每次更新,都需要工程師介入居多,複雜的設定,難懂的語言(只有工程師能懂),都阻礙著更新的進步,這邊用白話文分享如何更新關鍵資源

torch 1.13.1 -> torch 2.0.0

當你跑 run.bat 的時候會出現以下訊息,告訴你應該要申請 torch 了,升級的方法是在執行 webui.bat 的時候,加入 –reinstall-torch,觸發程式去更新 torch

也可以在 lauch.py 中修改 COMMANDLINE_ARGS 加入 –reinstall-torch

@echo off

set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=--reinstall-torch

call webui.bat

重新執行 run.bat 後就會看到開始更新了

更新 xformers

更新 xformers 與更新 torch 類似

我們一樣修改 COMMANDLINE_ARGS 加入 –reinstall-xformers ,然後重新執行 run.bat ,就會啟動更新程序

@echo off

set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=--reinstall-xformers

call webui.bat

更新後的錯誤處理方法

若是更新後啟動失敗,通常是沒 Torch 無法使用 GPU ,那就要加入指令 COMMANDLINE_ARGS=–skip-torch-cuda-test

@echo off

set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=--skip-torch-cuda-test

call webui.bat

AI-繪圖總整理-StableDiffusion – 雨 (rain.tips)

Midijourney 的創業故事

Midijourney 的創業故事

Midijourney 最近推出了V5,比較之前的模型,更多了寫實的風格,不變的是一樣好用和美,繪圖能力出色是它們最大的特點,也讓我對他們後面的創業故事非常的感興趣,員工多少人?創業動機?能賺多少錢?

Midjourney Emblem.png

創業動機,人類想像力的延伸

創辦人大衛·霍爾茨,原先他是我一直很愛用的一個工具 Leap Motion 的創辦人,後來將公司賣給了 Ultrahaptics 之後就創立了 Midijourney ,公司總共11人

  • 1創辦人
  • 8 RD
  • 1 法務
  • 1 財務

2022-2023年營收卻可以超過1億美元

技術能力的抉擇

因為創辦人之前的背景,所以覺得他要的解決人與機器間的互動問題,並且快速地推出市場,所以做了幾個關鍵性的決定

  • 不用APP,不用網頁,直接在Discord上建立機器人,也符合 AI 的特色,有一個機器人為你服務
  • 封閉技術,技術不開源,讓別人有付費的理由
  • 與對手(Stable Diffusion)相比,進入門檻很低,不用建立伺服器
  • 大模型,利用八個不同時區的夜晚差別訂價以及效能,來解決算力難題
  • 專注在改善使用者的溝通介面,不斷優化跟使用者的互動方式

商業模式-推出第一年賺1億美金

免費讓人使用,但算力慢,還要常常跟別人搶資源和公開自己的畫作,付每月的訂閱費用就有感升級,2023年初就已經累積了1000多萬的用戶,憑藉著超美的 AI 做圖

參考資料

https://www.bnext.com.tw/article/75000/midjourney-ai-davidholz

AI-繪圖總整理-StableDiffusion – 雨 (rain.tips)

推薦好用的 LoRA模型 – 無限期更新

推薦好用的 LoRA模型 – 無限期更新

Stable Diffusion LoRA 模型,讓大家都可以在大模型的基礎下,訓練自己擁有的模型,也讓大家熱於分享,所以想在這邊分享我用過和我製作的模型給大家,持續更新下去

鋼彈模型 Gundam

https://civitai.com/models/22470/gundam-rx78-2-outfit-style-rx78-2?modelVersionId=26830

這模型搭配真人或是二次元的大模型(checkpoint),都能有很好的表現,常搭配的是 Realistic Vision V2.0

開外掛拉,進階使用 Lora 的權重以及設定

開外掛拉,進階使用 Lora 的權重以及設定

Stable Diffusion Lora 超好用,已經不太需要說明,今天要來介紹一個可以讓 Lora 放開她的束縛,可以完全調整 Lora 在模型中的每一層的權重設定,為何要有分層設定,可以看看原作者的下面這張說明圖,分別在不同層插入 Lora 可以有不同的效果出現,也可以更精準的控制AI

LoRA 權重外掛

hako-mikan/sd-webui-lora-block-weight (github.com)

安裝方法,到擴充功能中,選擇從網址安裝,並且輸入 hako-mikan/sd-webui-lora-block-weight (github.com)

之後重啟系統即可看到多了 LoRA Block Weight 可以用

至於使用效果的話,我建議都試試看上面的設定,再去拿捏下手的感覺

LoRA 整合權重外掛的 UI

bbc-mc/sdweb-merge-block-weighted-gui: Merge models with separate rate for each 25 U-Net block (input, middle, output). Extension for Stable Diffusion UI by AUTOMATIC1111 (github.com)

LoRA擁有17個作用層

參考資料

TURING 用 Stable Diffusion 畫 EV 概念車

不要再說AI畫出來的圖還沒達到專業水準了,現在日本一家新創公司,都用 Stable Diffusion 來設計它們自己的電動概念車,並且將完整的過程放在 Youtube 上,從畫設計稿,到建模並且列印出來,並且還製作了動畫