by Rain Chu | 11 月 8, 2023 | AI, 人臉辨識, 圖型處理, 影片製作, 繪圖
Rope以其令人矚目的功能,站在了這場技術革新的前沿。這款AI工具不僅能夠輕鬆去除臉部遮擋,更整合了多種高清化算法,讓處理速度快如閃電。然而,在介紹如何安裝和使用Rope之前,我們必須提醒每一位用戶:這項強大的技術應當用於正當的創造和學術研究,千萬別拿去做壞事。現在,讓我們詳細了解如何在您的本地設備上安裝並運行Rope。
安裝必要軟體
在開始使用Rope之前,需要先安裝一些必要的軟體:
- 安裝Python
- 安裝FFmpeg
- FFmpeg是處理影片不可或缺的組件,可以通過命令行進行安裝,或是參考我之前的ffmpeg教學。
- Nvidia顯卡安裝CUDA
- 為了充分發揮Rope的性能,Nvidia顯卡用戶應安裝CUDA 11.8,這對於AI運算至關重要。
安裝Rope
安裝了必要的軟體後,便可以開始安裝Rope:
- 下載Rope壓縮包
- 安装visual studio 2022
- 創建虛擬環境
- 使用Python建立一個新的虛擬環境,這有助於管理依賴包和版本。
- python -m venv venv
- 啟動虛擬環境
- 透過命令行啟動虛擬環境,準備安裝Rope。
- call venv\scripts\activate.bat
- 安裝依賴包
- 在虛擬環境中,使用pip指令安裝Rope需要的所有依賴包。
- pip install -r requirements.txt
- 如果安裝失敗,要先執行下面的指令
- pip install –no-cache-dir -r requirements.txt
- pip uninstall onnxruntime onnxruntime-gpu
- pip install onnxruntime-gpu==1.15.0
- 下載換臉模型
透過這些步驟,您可以在本地機器上成功安裝和配置Rope,並開始進行高效的臉部轉換。隨著AI技術的快速發展,Rope提供了一個既方便又強大的工具,使創意和創新更加無限。
操作指南:如何使用Rope進行批量換臉
請先確認安裝 Rope 已經成功,接著,遵循以下步驟來執行Rope的批量換臉功能:
- 打開命令提示字元
- 進入Rope的本地根目錄
- 激活虛擬環境
- 通過執行
call venv\Scripts\activate.bat
指令來激活Rope的Python虛擬環境。
- 運行Rope主程式
- 使用
python run.py --execution-provider cuda
指令,開始執行批量換臉處理。
自定義選項:提升處理質量與效率
Rope提供多個可選參數來滿足用戶的特定需求:
- 面部增強
- 加入
face_enhancer
選項,可以對換臉後的面部進行增強處理,使其更加清晰細緻。
- python run.py –execution-provider cuda face_enhancer
- 調整輸出視頻質量
- 使用
--video-quality
選項並指定一個0到50的數值(數值越小,輸出質量越高)。
- python run.py –execution-provider cuda –video-quality 1
- 指定內存使用
- 若需要管理程序的內存使用,可透過
--max-memory
選項設定最大內存限制。
- python run.py –execution-provider cuda –max-memory 16
- 指定執行線程
- 對於較老的Nvidia顯卡,可使用
--execution-threads
來指定執行線程數,以達到最佳運行效能。
- python run.py –execution-provider cuda –execution-threads 2
- 預設是4
使用方法可以看YT
Rope又一款强大的一键换脸AI!可消除脸部遮挡,多种高清化算法,飞一般的处理速度!本地安装与参数使用详解。 – YouTube
解除roop检测深度换脸 – YouTubehttps://www.youtube.com/watch?v=YH4hB3wmRcQ
roop新奇用法:一键直播换脸、批量换图 – YouTube
Rope 分支
https://github.com/Hillobar/Rope/
https://github.com/s0md3v/sd-webui-roop
by Rain Chu | 10 月 27, 2023 | AI, 繪圖
不論你是否具備繪畫基礎,Fooocus的力量都能幫助你創建出大師級的作品。本文將深入解析Fooocus的核心技術及其使用體驗。
1. Fooocus的核心技術:
- GPT2為基礎的動態風格擴展:這項技術使得Fooocus能夠動態調整畫風,提供用戶更多元的選擇。
- 原生細緻化調整:Fooocus採用先進的k-擴散採樣技術,使得細緻化調整與基礎模型能夠更協同工作,確保作品的連貫性和質量。
- 負向引導:解決了XL基礎模型在最高解析度層面的問題,使得作品更具真實感。
- 自我專注導引的優化:這項技術確保了Fooocus生成的作品永遠不會顯得過於光滑或假象。
2. 使用體驗:
Fooocus的使用界面簡潔明了,即使是零基礎的用戶,也能在短時間內上手。其推薦的配置要求為4GB Nvidia GPU記憶體及8GB系統記憶體,但即便是中低端筆記本,如配備16GB RAM及6GB VRAM的Nvidia 3060,都能達到令人滿意的效果。
3.Fooocus於Windows上的安裝與使用教學
Fooocus不僅為專業的AI繪畫工具,其安裝和使用過程也十分簡單。以下將針對Windows平台進行Fooocus的安裝與使用教學。
下載Fooocus
https://github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_2-1-60.7z
解壓縮後放在Fooocus_win64_2-1-60目錄下
下載模型檔
sd_xl_base_1.0_0.9vae.safetensors
sd_xl_refiner_1.0_0.9vae.safetensors
模型檔需要放在 Fooocus\models\checkpoints\ 目錄下
Fooocus的修圖控制模型
控制模型要放在 Fooocus\models\inpaint\ 目錄下
第一次使用以及安裝
執行解壓縮目錄下的 run.bat
Fooocus_win64_2-1-60\run.bat
這時候會做好模型下載以及基本設定,並且在本地端起一個 http://127.0.0.1:7860/ 伺服器
接下來用瀏覽器開啟該網址即可,超簡單
原始碼
https://github.com/lllyasviel/Fooocus
延伸閱讀
by Rain Chu | 7 月 16, 2023 | AI, Chat
在這篇文章中,我們將深入探索如何透過利用OpenAI的語言模型ChatGPT來創作長篇小說,並突破其輸入輸出字數的限制。透過技術和策略性的實作,我們將探討如何把片段性的產出整合成一個有連貫性的故事,同時探討如何保持角色和劇情的一致性。此外,我們也將討論在創作過程中可能遇到的挑戰,以及如何進行有效的修改和校對。讀者將獲得全面的瞭解,深入理解如何將ChatGPT應用於長篇小說創作。
RecurrentGPT將長短期記憶網絡(LSTM)中的向量化元素(例如,細胞狀態、隱藏狀態、輸入和輸出)用自然語言(即,文本段落)替換,在每個時間步長t,RecurrentGPT接收一段在t-1步生成的文本段落以及對下一段的簡短計劃。然後,它將關注到長期記憶,長期記憶包含所有以前生成的段落的摘要。
延伸閱讀
by Rain Chu | 7 月 16, 2023 | 音樂
又是 Facebook(Meta),在AI上的研究不落人後,隨著人工智慧的快速發展,音樂生成的領域也正在經歷革命性的變革。本文將深入探討這一技術的演進,揭示如何應用各種的AI工具來創造音樂
試試現成的服務
描述一下你想要的音樂類型、場景
https://waveformer.replicate.dev/
Facebook 開發程式碼
https://github.com/facebookresearch/audiocraft
Music Gen 與其他三個比較、MusicLM、Riffusion、Musai
https://ai.honu.io/papers/musicgen/
Music Gen 論文
https://arxiv.org/abs/2306.05284
免費可以測試用的 huggingface 服務
https://huggingface.co/spaces/facebook/MusicGen
用 Google Colab 來做測試
https://colab.research.google.com/drive/1-Xe9NCdIs2sCUbiSmwHXozK6AAhMm7_i?usp=sharing
延伸閱讀
by Rain Chu | 4 月 10, 2023 | AI, Stable Diffusion, 繪圖
Stable Diffusion Lora 超好用,已經不太需要說明,今天要來介紹一個可以讓 Lora 放開她的束縛,可以完全調整 Lora 在模型中的每一層的權重設定,為何要有分層設定,可以看看原作者的下面這張說明圖,分別在不同層插入 Lora 可以有不同的效果出現,也可以更精準的控制AI
LoRA 權重外掛
hako-mikan/sd-webui-lora-block-weight (github.com)
安裝方法,到擴充功能中,選擇從網址安裝,並且輸入 hako-mikan/sd-webui-lora-block-weight (github.com)
之後重啟系統即可看到多了 LoRA Block Weight 可以用
至於使用效果的話,我建議都試試看上面的設定,再去拿捏下手的感覺
LoRA 整合權重外掛的 UI
bbc-mc/sdweb-merge-block-weighted-gui: Merge models with separate rate for each 25 U-Net block (input, middle, output). Extension for Stable Diffusion UI by AUTOMATIC1111 (github.com)
LoRA擁有17個作用層
參考資料
近期留言