Select Page

增強式 ChatTTS 跟 Ollama 的整合

可以中英文混合,笑聲,停頓的好用的語音生成模型

直接使用 ChatTTS

ChatTTS online DEMO https://chattts.com/#Demo

增強後好看又好用的 ChatTTS 外框 ChatTTS-Forge https://huggingface.co/spaces/lenML/ChatTTS-Forge

自行開發程式的重要資源

ChatTTS 官方說明 https://github.com/2noise/ChatTTS/blob/main/docs/cn/README.md

整合各種超強的 ChatTTS應用 https://github.com/libukai/Awesome-ChatTTS

ChatTTS 跟 Ollama 的整合 Demo https://github.com/melodylife/ollama-chat

延伸閱讀

PDFgear-好用還免費的PDF編輯器

PDFgear-好用還免費的PDF編輯器

看到完全免費的軟體就覺得很佛心,但沒想到還支援AI重點摘要,還有個平台都可以使用,功能還比一堆付費軟體還強大,就真的一定要大力的推廣這麼優秀的軟體

免費的PDF編輯軟體PDFgear

特色功能介紹

內建AI摘要:快速幫忙重點整理

文檔編輯:可以編輯文字,也可以加入圖片

合併PDF:常用來加入 EXCEL 做出來的圖表

拆分PDF:可以設定如何拆分PDF,再重新合併一份文件

多平台支援:支援 windows, mac, ios, android

PDFgear核心功能

官網下載

https://www.pdfgear.com

相關資訊

LiveKit-擁有自己的AI即時語音客服聊天小助理

LiveKit-擁有自己的AI即時語音客服聊天小助理

公開如何使用 OpenAI 配合 LiveKit 來實現會多國語言的小姐姐,可以即時回答您的問題,這個跟 Twilio 一樣的簡單和易用

取得 LiveKit key

利用 google 帳號登入 LiveKit Login 命名一個 project

並且到專案中的 settings -> KEYS ,取得 API KEY

程式碼

首先安裝相關依賴

pip install livekit-agents livekit-plugins-openai livekit-plugins-silero python-dotenv

設定環境變數

LIVEKIT_URL=""
LIVEKIT_API_KEY=""
LIVEKIT_API_SECRET=""
OPENAI_API_KEY=""

主要程式碼

import asyncio
from dotenv import load_dotenv
from livekit.agents import AutoSubscribe, JobContext,WorkerOptions, cli, llm
from livekit.agents.voice_assistant import VoiceAssistant
from livekit.plugins import openai, silero


load_dotenv()

async def entry(ctx: JobContext):
    chat_ctx = llm.ChatContext().append(
        role="system",
        text=("你是專業的助理,回答時候用專業的語氣回應。")
    )

    await ctx.connect(auto_subscribe=AutoSubscribe.AUDIO_ONLY)

    asssitant = VoiceAssistant(
        vad=silero.VAD.load(),
        stt=openai.STT(),
        tts=openai.TTS(voice="nova"),
        llm=openai.LLM(model="gpt-4o-mini"),
        chat_ctx=chat_ctx
    )
    asssitant.start(ctx.room)

    await asyncio.sleep(1)
    await asssitant.say("你好,第一次見面,很高興認識你",allow_interruptions=True)


if __name__ == "__main__":
    cli.run_app(WorkerOptions(entrypoint_fnc=entry))

測試與驗證

道專案中,可以看到 Get started 中有支援各種的平台的程式碼以及 server 可以使用

價格說明

https://livekit.io/pricing

參考資料

https://livekit.io

https://github.com/livekit/agents

demo code

Deep Live Cam-簡單易用,被遮擋也沒關係的即時換臉

Deep Live Cam-簡單易用,被遮擋也沒關係的即時換臉

用有多張臉,即時更換人臉的開源軟體,而且有綠色直接使用版本,已經幫忙把環境都打包好了,給懶人使用,支援windows、MAC、GPU

必要條件

Git 原始碼

https://github.com/hacksider/Deep-Live-Cam.git

下載模型

  1. GFPGANv1.4
  2. inswapper_128.onnx (Note: Use this replacement version if an issue occurs on your computer)

並且將這兩個檔案放在 models 的目錄下

安裝相關依賴

pip install -r requirements.txt

參考資料

https://github.com/hacksider/Deep-Live-Cam

VOZO AI 快速製作電影等級的生日祝福

VOZO AI 快速製作電影等級的生日祝福

行銷人真的有越來越酷的各種AI工具,尤其在影片製作的方面,是百花齊放,各式各樣的應用一直冒出來,這個 VOZO AI 工具很適合做一些社交膜體上詪片

Rewrite 重寫功能

只要選定影片,就可以重新改變該影片的對白

Redub 重上字幕

可以快速叫出影片中的字幕,更改成自己的劇本,讓選定的影片按照你的劇本再上一次字幕,並且有翻譯功能

Repurpose 影片作成短影音

可以快速幫你把自己的影片或是youtube中的影片,快速剪輯一個短影音版本,可惜現在還是要以英文為主

支援多人口型同步

影片中有多人的話,可以支援多人的口型同步,這功能很新也很實用

自動多國語言翻譯

內建翻譯多國語言功能

價格參考

https://www.vozo.ai/pricing

參考資料

VOZO AI