by Rain Chu | 1 月 1, 2025 | AI , 影片製作
Pollo AI 可以讓用戶從文字提示、圖片或現有影片中創建超高品質的影片,支援多種影片風格,從真實的電影場景到富有想像力的動畫,滿足不同的創作需求。其快速的影片生成演算法,讓用戶能在短短幾分鐘內獲得高清、專業級的影片輸出,此外,Pollo AI還提供多樣的模板,如AI擁抱影片生成器,方便用戶輕鬆創作溫馨感人的影片
Pollo AI homepage,文字生圖
支援 40多種 AI 影片特效,使得任何事物或人物都能在影片中“活”起來,例如
擠壓特效 :讓照片中的主體如同麵團或橡皮泥般被擠壓變形,呈現出趣味十足的動態效果,適合在社交媒體上分享。
膨脹特效 :使物體、人物或動物如氣球般膨脹,隨後飄走或爆裂,創作出搞笑短片,流暢自然的動畫效果有望成為病毒式影片。
爆炸特效 :讓畫面中的主體以誇張且滑稽的方式“炸裂”,天馬行空的創意為觀眾帶來歡樂。
融化特效 :將靜態圖像轉化為動態影片,讓畫面中的主體如巧克力般慢慢融化,效果逼真,只需簡單的三步操作即可完成。
Pollo AI 特效以及影片樣版庫
VIDEO
首尾偵功能
Pollo AI還引入了首尾偵功能 ,使影片的開頭和結尾更加引人注目。用戶可以選擇多種動畫效果,為影片增添專業的開場和結尾,提升整體質感。這項功能特別適合用於宣傳影片、教學影片或任何需要強調開頭和結尾的影片類型。
Pollo AI Image to Video 功能,首尾禎產影片功能
三張圖片合成功能
Pollo AI的三張圖片合成功能 允許用戶上傳最多三張圖片,並生成一個角色或場景在影片中保持統一外觀的影片,這項功能確保影片中的角色或物體在每一幀中都保持一致的外觀和風格,適合需要連貫性角色動畫的影片創作。用戶可以上傳一至三張圖片,設定影片的長度、解析度和移動幅度,Pollo AI將自動生成符合要求的影片。
參考資訊
by rainchu | 12 月 19, 2024 | AI , 影片製作 , 語音合成 , 音樂
MMAudio 是一款開源的多模態影片轉音訊工具,透過多模態聯合訓練技術,可以將高品質的影片與音訊合成。該專案由伊利諾大學厄巴納-香檳分校、Sony AI 及 Sony 集團公司合作開發,適用於影片配音、虛擬角色語音等多媒體創作場景。
主要特色:
多模態聯合訓練: MMAudio 採用多模態聯合訓練方法,能夠同時處理影片和文字輸入,生成與內容同步的音訊。
高品質音訊合成: 透過先進的模型架構,MMAudio 能夠生成高品質且自然的音訊,適用於各類應用場景。
同步模組: MMAudio 的同步模組確保生成的音訊與影片畫面精確匹配,實現高度同步。
適用場景:
影片配音: 自動為無聲 影片生成對應的音訊,提升影片的可觀賞性。
虛擬角色語音生成: 為虛擬角色生成符合其動作和表情的語音,增強互動性。
多媒體內容創作: 協助創作者快速為視覺內容添加音訊,豐富作品表現力。
技術原理:
MMAudio 基於深度學習技術,特別是神經網路,理解和生成音訊資料。模型能夠處理影片和文字輸入,透過深度學習網路提取特徵,進行音訊合成。在訓練時,模型考慮音訊、影片和文字資料,使生成的音訊能夠與影片和文字內容相匹配。透過同步模組,確保音訊輸出與影片畫面或文字描述的時間軸完全對應,實現同步。
使用方法:
MMAudio 提供命令列介面和 Gradio 介面,使用者可以根據需求選擇使用。在命令列中,使用者可以透過指定影片路徑和文字提示,生成對應的音訊。Gradio 介面則提供了更友善的使用者介面,支援影片到音訊和文字到音訊的合成。
已知限制:
目前,MMAudio 存在以下限制:
有時會生成不清晰的語音或背景音樂。
對某些陌生概念的處理不夠理想。
相關資源:
by rainchu | 11 月 18, 2024 | AI , 影片製作
Camera Control 2024最新功能-相機視角控制
Runway 又推出了新功能了,這次的 Gen-3 可以讓你上傳一張圖片後就可以控制相機的視角,前後左右平移,旋轉跳躍,都可以正確地幫你補圖,一定要試試
相關資訊
by rainchu | 9 月 23, 2024 | AI , 人臉辨識 , 圖型處理 , 影片製作
用有多張臉,即時更換人臉的開源軟體,而且有綠色直接使用版本,已經幫忙把環境都打包好了,給懶人使用,支援windows、MAC、GPU
必要條件
Git 原始碼
https://github.com/hacksider/Deep-Live-Cam.git
下載模型
GFPGANv1.4
inswapper_128.onnx (Note: Use this replacement version if an issue occurs on your computer)
並且將這兩個檔案放在 models 的目錄下
安裝相關依賴
pip install -r requirements.txt
參考資料
https://github.com/hacksider/Deep-Live-Cam
by rainchu | 9 月 23, 2024 | AI , 影片製作
行銷人真的有越來越酷的各種AI工具,尤其在影片製作的方面,是百花齊放,各式各樣的應用一直冒出來,這個 VOZO AI 工具很適合做一些社交膜體上詪片
Rewrite 重寫功能
只要選定影片,就可以重新改變該影片的對白
Redub 重上字幕
可以快速叫出影片中的字幕,更改成自己的劇本,讓選定的影片按照你的劇本再上一次字幕,並且有翻譯功能
Repurpose 影片作成短影音
可以快速幫你把自己的影片或是youtube中的影片,快速剪輯一個短影音版本,可惜現在還是要以英文為主
支援多人口型同步
影片中有多人的話,可以支援多人的口型同步,這功能很新也很實用
自動多國語言翻譯
內建翻譯多國語言功能
價格參考
https://www.vozo.ai/pricing
參考資料
VOZO AI
by rainchu | 9 月 6, 2024 | AI , 影片製作
隨著AI技術的進步,影片製作變得前所未有的簡單,工具也是超級的多,讓人無從選擇,但大多數是西方的畫風,少有東方的模型,而Vidu AI 是一款大陸清華大學設計的 AIGV 工具,讓使用者能夠免費生成 4 秒鐘(免費)或是 8 秒鐘的高品質影片,且不需要任何專業知識即可完成,以下是它的幾個主要特色:
Vidu AI 特色
免費提供高品質影片 Vidu AI 允許使用者免費生成 4 秒鐘的影片,生成4秒影片通常只用30秒,無需任何費用即可擁有電影級別的視覺效果,這對於想要非專業的使用者者或是學生來說,絕對是一大福音。
東方風格的畫風 Vidu AI 的一大亮點是其影片生成的風格深受東方團隊用中國風的圖片訓練。不論是畫面構圖還是色彩選擇,皆展現出濃厚的東方美學,這使得影片不僅具備高品質,還充滿了獨特的文化氛圍。
電影級的影片製作 使用 Vidu AI 產生的影片無論是畫質還是視覺效果都達到了電影級別,讓影片內容充滿張力與故事感。
多樣化的動畫選項 有寫實電影和動畫電影兩種選擇,兩個選項都可以有電影等級的實力。
動態延續的創作流程 Vidu AI 提供了創意延續的功能,允許使用者將第四秒所生成的圖片作為下一段影片的起點,從而產生連續性的視覺效果。
參考資料:
Vidu AI 官網
申請 Vidu AI API
近期留言