AI 彙整 - 第 12 頁，總計 30 頁

增強式 ChatTTS 跟 Ollama 的整合

by Rain Chu | 10 月 20, 2024 | AI, Chat, 語音合成

可以中英文混合，笑聲，停頓的好用的語音生成模型

直接使用 ChatTTS

ChatTTS online DEMO https://chattts.com/#Demo

增強後好看又好用的 ChatTTS 外框 ChatTTS-Forge https://huggingface.co/spaces/lenML/ChatTTS-Forge

自行開發程式的重要資源

ChatTTS 官方說明 https://github.com/2noise/ChatTTS/blob/main/docs/cn/README.md

整合各種超強的 ChatTTS應用 https://github.com/libukai/Awesome-ChatTTS

ChatTTS 跟 Ollama 的整合 Demo https://github.com/melodylife/ollama-chat

延伸閱讀

ChatTTS-完整使用指南

終於補足AI簡報的缺口，Napkin AI，幫你畫流程圖

by Rain Chu | 10 月 20, 2024 | AI, 簡報製作, 繪圖

Napkin AI，直到今天都還不知道怎麼跟你收費的AI，可以幫你完成簡報的最後一哩路，把文字和項目給他，可以產生流程圖、比較圖、各式各樣的LOGO、圖示等，大幅度的美化你的簡報

Napkin 特色

1.多達40多種不同的模板

2.AI一鍵從文字生成圖表

3.漂亮且實用的手繪圖表

補充資料

美圖最新開發的 AI PPT-什麼樣的PPT，AI都能做

PDFgear-好用還免費的PDF編輯器

PDFgear-好用還免費的PDF編輯器

by rainchu | 10 月 7, 2024 | AI, MIS, Tool

看到完全免費的軟體就覺得很佛心，但沒想到還支援AI重點摘要，還有個平台都可以使用，功能還比一堆付費軟體還強大，就真的一定要大力的推廣這麼優秀的軟體

特色功能介紹

內建AI摘要：快速幫忙重點整理

文檔編輯：可以編輯文字，也可以加入圖片

合併PDF：常用來加入 EXCEL 做出來的圖表

拆分PDF：可以設定如何拆分PDF，再重新合併一份文件

多平台支援：支援 windows, mac, ios, android

官網下載

https://www.pdfgear.com

LiveKit-擁有自己的AI即時語音客服聊天小助理

by rainchu | 9 月 23, 2024 | AI, Chat

公開如何使用 OpenAI 配合 LiveKit 來實現會多國語言的小姐姐，可以即時回答您的問題，這個跟 Twilio 一樣的簡單和易用

取得 LiveKit key

利用 google 帳號登入 LiveKit Login 命名一個 project

並且到專案中的 settings -> KEYS ，取得 API KEY

程式碼

首先安裝相關依賴

pip install livekit-agents livekit-plugins-openai livekit-plugins-silero python-dotenv

設定環境變數

LIVEKIT_URL=""
LIVEKIT_API_KEY=""
LIVEKIT_API_SECRET=""
OPENAI_API_KEY=""

主要程式碼

import asyncio
from dotenv import load_dotenv
from livekit.agents import AutoSubscribe, JobContext,WorkerOptions, cli, llm
from livekit.agents.voice_assistant import VoiceAssistant
from livekit.plugins import openai, silero


load_dotenv()

async def entry(ctx: JobContext):
    chat_ctx = llm.ChatContext().append(
        role="system",
        text=("你是專業的助理，回答時候用專業的語氣回應。")
    )

    await ctx.connect(auto_subscribe=AutoSubscribe.AUDIO_ONLY)

    asssitant = VoiceAssistant(
        vad=silero.VAD.load(),
        stt=openai.STT(),
        tts=openai.TTS(voice="nova"),
        llm=openai.LLM(model="gpt-4o-mini"),
        chat_ctx=chat_ctx
    )
    asssitant.start(ctx.room)

    await asyncio.sleep(1)
    await asssitant.say("你好，第一次見面，很高興認識你",allow_interruptions=True)


if __name__ == "__main__":
    cli.run_app(WorkerOptions(entrypoint_fnc=entry))

測試與驗證

道專案中，可以看到 Get started 中有支援各種的平台的程式碼以及 server 可以使用

價格說明

https://livekit.io/pricing

參考資料

https://livekit.io

https://github.com/livekit/agents

demo code

Lobe Chat UI-有plugin，多模態的AI CHAT UI

AnythingLLM 採用 docker 安裝

Deep Live Cam-簡單易用，被遮擋也沒關係的即時換臉

by rainchu | 9 月 23, 2024 | AI, 人臉辨識, 圖型處理, 影片製作

用有多張臉，即時更換人臉的開源軟體，而且有綠色直接使用版本，已經幫忙把環境都打包好了，給懶人使用，支援windows、MAC、GPU

必要條件

python (3.10 recommended)
pip
git
ffmpeg
visual studio 2022 runtimes (windows)

Git 原始碼

https://github.com/hacksider/Deep-Live-Cam.git

下載模型

GFPGANv1.4
inswapper_128.onnx (Note: Use this replacement version if an issue occurs on your computer)

並且將這兩個檔案放在 models 的目錄下

安裝相關依賴

pip install -r requirements.txt

參考資料

https://github.com/hacksider/Deep-Live-Cam

微軟 Microsoft Ignite 2023 大會中推出的一款新工具「Deepfakes Creator」

VOZO AI 快速製作電影等級的生日祝福

by rainchu | 9 月 23, 2024 | AI, 影片製作

行銷人真的有越來越酷的各種AI工具，尤其在影片製作的方面，是百花齊放，各式各樣的應用一直冒出來，這個 VOZO AI 工具很適合做一些社交膜體上詪片

Rewrite 重寫功能

只要選定影片，就可以重新改變該影片的對白

Redub 重上字幕

可以快速叫出影片中的字幕，更改成自己的劇本，讓選定的影片按照你的劇本再上一次字幕，並且有翻譯功能

Repurpose 影片作成短影音

可以快速幫你把自己的影片或是youtube中的影片，快速剪輯一個短影音版本，可惜現在還是要以英文為主

支援多人口型同步

影片中有多人的話，可以支援多人的口型同步，這功能很新也很實用

自動多國語言翻譯

內建翻譯多國語言功能

價格參考

https://www.vozo.ai/pricing

參考資料

VOZO AI

steve ai : 超強大的 AI Video Tools

PixVerse AI工具：讓你輕鬆創作寫實電影場景

增強式 ChatTTS 跟 Ollama 的整合

直接使用 ChatTTS

自行開發程式的重要資源

延伸閱讀

終於補足AI簡報的缺口，Napkin AI，幫你畫流程圖

Napkin 特色

補充資料

PDFgear-好用還免費的PDF編輯器

特色功能介紹

官網下載

相關資訊

LiveKit-擁有自己的AI即時語音客服聊天小助理

取得 LiveKit key

程式碼

首先安裝相關依賴

設定環境變數

主要程式碼

測試與驗證

價格說明

參考資料

Deep Live Cam-簡單易用，被遮擋也沒關係的即時換臉

必要條件

Git 原始碼

下載模型

安裝相關依賴

參考資料

VOZO AI 快速製作電影等級的生日祝福

Rewrite 重寫功能

Redub 重上字幕

Repurpose 影片作成短影音

支援多人口型同步

自動多國語言翻譯

價格參考

參考資料

近期文章

近期留言

彙整

分類