AI 彙整 - 第 19 頁，總計 31 頁

微軟 Microsoft Ignite 2023 大會中推出的一款新工具「Deepfakes Creator」

by Rain Chu | 5 月 21, 2024 | AI, 影片製作

微軟在2023年Ignite活動上推出了一項出人意料的產品，代表超級大廠也投入換臉的服務

這個新功能名為Azure AI語音文本轉語音虛擬形象，可以讓用戶通過上傳希望虛擬形象相似的人的圖像並編寫劇本來生成虛擬形象的說話視頻。

微軟在博客文章中寫道：“通過文本轉語音虛擬形象，用戶可以更有效地創建視頻……用於製作培訓視頻、產品介紹、客戶推薦等，只需輸入文本。就可以使用虛擬形象來建立會話代理、虛擬助理、聊天機器人等。

Deepfakes Web

https://deepfakesweb.com

Azure 上創建你的服務

你可以在 Azure 中，輸入 deepfake ，就可以找到這項服務

參考資料

AI Tools – AI工具大全(總整理)

ChatLaw 法律大模型：法律界的AI革命

by Rain Chu | 5 月 21, 2024 | AI, Chat

在法律領域中，AI 的應用日益增加，而「ChatLaw 法律大模型」正是這一趨勢的最新產物，這個由尖端技術驅動的模型，同時面相專業人士和一般人，提供前所未有的支持，從基本的法律查詢到複雜的案件分析，ChatLaw 都能提供高效且精確的協助，一般人只需要用白話文就可以請 Chatlaw 幫你判斷案件。

核心技術

ChatLaw 的核心在於其先進的演算法。這使得它能夠精確理解和分析法律文本，從而提供具有操作性的建議。無論是判例研究、法律意見書撰寫，還是復雜的法律論證，ChatLaw 都能夠提供高效的解決方案。

ChatLaw-13B，此版本為學術demo版，基於姜子牙Ziya-LLaMA-13B-v1訓練而來，中文各項表現很好，但是邏輯複雜的法律問答效果不佳，需要用更大參數的模型來解決。

ChatLaw-33B，此版本為學術demo版，基於Anima-33B訓練而來，邏輯推理能力大幅提升，但是因為Anima的中文語料過少，導致問答時常會出現英文數據。

ChatLaw-Text2Vec，使用93萬條判決案例做成的數據集基於BERT訓練了一個相似度匹配模型，可將用戶提問信息和對應的法條相匹配。

功能應用

律師和法學研究者使用 ChatLaw 可以迅速獲得所需的法律信息，包括最新的法規變動和相關的判決案例。此外，ChatLaw 的使用者界面極其友好，即使是非專業人士也能輕鬆上手，進行基本的法律查詢。

例如：你可以問”一名女大學生在地鐵站被偷拍”，他就可以回應你判例以及相關條文給你參考，不過現在都是大陸那邊的法律條文。

支援 Python 庫

https://github.com/PKU-YuanGroup/ChatLaw

對法律實踐的影響

ChatLaw 的出現讓法律服務更加民主化，讓普通公眾也能輕鬆接觸到專業的法律建議。這不僅提升了法律服務的普及率，也幫助減少了因法律知識欠缺而產生的社會問題。

參考資料

挤爆服务器，北大法律大模型ChatLaw火了：直接告诉你张三怎么判

姜子牙模型

Anima 模型

AI Tools – AI工具大全(總整理)

Google IO 2024年春季發表會

by Rain Chu | 5 月 15, 2024 | AI

打算用一句會形容每一個Google IO所發表的AI新功能

2024-05-15- Google IO 10min 彙整

Gemini in workspace

用 google ai 整合並且搜尋你所有在google上的私人資訊，包含用文字搜尋照片(找出女兒游泳的照片)，email的彙整，google meet的會議紀錄彙整，Ask Photos with Gemini，Ask with Video

Gemini 1.5 Pro token 1M

相較於其他產品，Gemini 1.5 Pro 的 token 數量可以來到 2M ，大約是1500頁論文，1小時的影片

Gemini 1.5 Flash

輕量型 Gemini ，用於端，有效率

Project Astra

跟昨天的 OpenAI 一樣，可以利用手機的攝像頭即時理解生活的大小事情，包含複雜的程式碼或是只是幫你找到眼鏡

Project Veo

跟 OpenAI SORA 一樣，是影片的生成引擎，可以生成 1080p 的影片 46 秒

TPU Trillium

比起上一代，要快4.7倍

Google AI Search (Gemini Era)

Gemini 客製了一個模型是給搜尋引擎使用，可以產初即時的資訊，有評分過後並且可以信任的資訊，也支援影片搜尋

Gemini Gems

跟 OpenAI 的 GPTs 一樣，可以用自然語言指揮你的AI，但不同的是有支援到 1M Tokens

Youtube AI

可以跟影片對話，提問

PailGemma

Gemma 2 才會支援，27B 參數，針對視覺處理

LearnLM

專作教育市場的 AI 大語言模型，會出題會改作業的時代要來了

Imagen 3

Google 最新的文生圖模型

Music AI Sandbox

提供給專業製作人們使用的 AI 生成音樂工具

AI Teammate (Chip)

協助你協同作業的萬能助理，他能在你開會的時候，幫你調查各種資料，以及解答問題

Circle to search

有了教學平台，當然也會有解題平台，學生可以用 Circle 取圈選題目，查詢答案，並且會提供解題步驟

AI旅行社

幫你規劃旅程

AI 防詐騙

幫你聽電話裡面的人是否有想要詐騙你

結論

整場會議上 AI 被提及 121 次，可見有多重要

OpenAI Spring Update – GPT-4o

OpenAI Spring Update – GPT-4o

by Rain Chu | 5 月 14, 2024 | AI, Chat

這一次OpenAI的2024年春季更新，帶來了虛擬人的真正可行性，因為可以真正即時的交互對談，過程中也真的像極了真人，有語氣，不會笨笨的把句子唸到完畢，完全能理解使用者的指令，並且做出對應的動作，重點還 free

更新說明

Hello GPT-4o | OpenAI

影片如下

Introducing GPT-4o (youtube.com)

重點摘要

realtime

反應速度快、真的超快，再也沒有延遲，可以看看DEMO

有了真的的人類情緒

懂說話者的語氣，你可以緊張、可以不舒服，他都可以感受到

chatgpt 可以用各種語氣回應，甚至連叫他用歌劇的方法也可以

Live research

可以用錄影的方法，了解上下文解題，數學題代公式的也難不倒

也可以用攝像頭看得出來使用者的情緒

Free to everyone

Desktop and Mobile Phones app

https://openai.com/chatgpt/download

Web UI Update

ChatGPT & GPTs：聊天機器人與AI機器人們(包含隱藏未公開功能)

手把手教學安裝 anything-llm (不使用 docker)

by Rain Chu | 5 月 13, 2024 | AI, Chat, Linux, NodeJS, React, Ubuntu, ViteJS, 程式

AnythingLLM是一款全功能的應用程序，支持使用商業或開源的大語言模型（LLM）和向量數據庫建構私有ChatGPT。用戶可以在本地或遠端運行該系統，並利用已有文檔進行智能對話。此應用將文檔分類至稱為工作區的容器中，確保不同工作區間的資料隔離，保持清晰的上下文管理。

特點：多用戶支持、權限管理、內置智能代理（可執行網頁瀏覽、代碼運行等功能）、可嵌入到網站的聊天窗口、多種文檔格式支持、向量數據庫的簡易管理界面、聊天和查詢兩種對話模式、引用文檔內容的展示，以及完善的API支持客戶端定制整合。此外，該系統支持100%雲端部署，Docker部署，且在處理超大文檔時效率高，成本低。

安裝 Anything llm

注意，以下要用 linux 平台安裝，windows 用戶可以用 WSL，推薦用 Ubuntu OS

在自己的 home 目錄下，到 GitHub 中下載原始碼

git clone https://github.com/Mintplex-Labs/anything-llm.git

利用 yarn 作設定資源

cd anything-llm
yarn setup

把環境變數建立起來，後端主機是 NodeJS express

cp server/.env.example server/.env
nano server/.env

密文需要最少12位的字元，檔案的存放路徑也記得改成自己的

JWT_SECRET="my-random-string-for-seeding"
STORAGE_DIR="/your/absolute/path/to/server/storage"

前端的環境變數，先把/api打開即可

# VITE_API_BASE='http://localhost:3001/api' # Use this URL when developing locally
# VITE_API_BASE="https://$CODESPACE_NAME-3001.$GITHUB_CODESPACES_PORT_FORWARDING_DOMAIN/api" # for Github Codespaces
VITE_API_BASE='/api' # Use this URL deploying on non-localhost address OR in docker.

如果你在設定的時候，遇到更新請求，可以跟我著我下面的方法作

把 prisma 更新好

yarn add --dev prisma@latest
yarn add @prisma/client@latest

前端的程式碼

先編譯前端程式碼，前端是由 viteJS + React

cd frontend && yarn build

將編譯好的資料放到 server 的目錄下

cp -R frontend/dist/* server/public/

選項，如果需要用到本地端的 LLM 模型，就把 llama-cpp 下載下來

cd server && npx --no node-llama-cpp download

把資料庫建立好

cd server && npx prisma generate --schema=./prisma/schema.prisma
cd server && npx prisma migrate deploy --schema=./prisma/schema.prisma

Server端是用來處理 api 以及進行向量資料庫的管理以及跟 LLM 交互

Collector 是一個 NodeJS express server，用來作UI處理和解析文檔

cd server && NODE_ENV=production node index.js &
cd collector && NODE_ENV=production node index.js &

更新的指令碼

現在 anything llm 更新速度超快，把這一段指令碼複製起來，方便未來作更新的動作

#!/bin/bash

cd $HOME/anything-llm &&\
git checkout . &&\
git pull origin master &&\
echo "HEAD pulled to commit $(git log -1 --pretty=format:"%h" | tail -n 1)"

echo "Freezing current ENVs"
curl -I "http://localhost:3001/api/env-dump" | head -n 1|cut -d$' ' -f2

echo "Rebuilding Frontend"
cd $HOME/anything-llm/frontend && yarn && yarn build && cd $HOME/anything-llm

echo "Copying to Sever Public"
rm -rf server/public
cp -r frontend/dist server/public

echo "Killing node processes"
pkill node

echo "Installing collector dependencies"
cd $HOME/anything-llm/collector && yarn

echo "Installing server dependencies & running migrations"
cd $HOME/anything-llm/server && yarn
cd $HOME/anything-llm/server && npx prisma migrate deploy --schema=./prisma/schema.prisma
cd $HOME/anything-llm/server && npx prisma generate

echo "Booting up services."
truncate -s 0 /logs/server.log # Or any other log file location.
truncate -s 0 /logs/collector.log

cd $HOME/anything-llm/server
(NODE_ENV=production node index.js) &> /logs/server.log &

cd $HOME/anything-llm/collector
(NODE_ENV=production node index.js) &> /logs/collector.log &

探索Perplexity：黃仁勳與貝佐斯投資的AI知識平台

by Rain Chu | 3 月 28, 2024 | AI, Chat

在當今快速發展的人工智慧領域中，Perplexity作為一家新興的對話式AI平台公司，於2022年8月成立，迅速吸引了眾多目光。這家新創公司不僅得到了科技界巨頭如黃仁勳和傑夫·貝佐斯等人的重金注資，更是以其創新的知識搜尋平台而聞名。Perplexity提供了一種全新的搜尋體驗，將傳統的網路搜尋與最先進的人工智慧技術結合起來，為使用者遇到的每個問題提供高品質的答案。

Perplexity的特色

注資背景顯赫：得到黃仁勳、貝佐斯等科技界巨頭的注資，顯示了市場對Perplexity業務模式和未來發展潛力的高度認可。
創新的知識搜尋平台：Perplexity是一個結合了網路搜尋與人工智慧的對話式AI平台，致力於解決用戶可能遇到的各種問題，無論是學術問題、日常疑惑還是專業咨詢。
高品質的答案：Perplexity憑藉先進的AI技術，提供的答案品質高於一般搜尋引擎，更加準確、有深度且可靠。
提供參考來源：為了確保信息的透明度和可信度，Perplexity在提供答案的同時，會附上參考來源，讓用戶可以進一步查證。
自動推薦追問問題：該平台能夠根據用戶的查詢自動推薦相關的追問問題，豐富用戶的探索過程。
搜尋YouTube影片：Perplexity不僅限於文本搜尋，還能夠搜索YouTube影片，為用戶提供更多樣化的信息來源。
Chrome擴充工具「Perplexity – AI Companion」：Perplexity還推出了一款Chrome擴充工具，讓用戶在瀏覽網頁時能夠更方便地使用其服務。

至於Perplexity的商業模式，它提供了專業版服務，專業版用戶支付每月20美元的費用，便可無限制使用其「Copilot」功能，享受客服支援，甚至可以上傳自己的資料請Perplexity分析。截至目前，Perplexity已擁有約10萬名付費用戶，顯示出其服務的受歡迎程度以及市場的廣大潛力。

https://www.perplexity.ai/

ChatGPT & GPTs：聊天機器人與AI機器人們(包含隱藏未公開功能)

« Older Entries

Next Entries »

微軟 Microsoft Ignite 2023 大會中推出的一款新工具「Deepfakes Creator」

Deepfakes Web

Azure 上創建你的服務

ChatLaw 法律大模型：法律界的AI革命

核心技術

功能應用

支援 Python 庫

對法律實踐的影響

參考資料

Google IO 2024年春季發表會

Gemini in workspace

Gemini 1.5 Pro token 1M

Gemini 1.5 Flash

Project Astra

Project Veo

TPU Trillium

Google AI Search (Gemini Era)

Gemini Gems

Youtube AI

PailGemma

LearnLM

Imagen 3

Music AI Sandbox

AI Teammate (Chip)

Circle to search

AI旅行社

AI 防詐騙

結論

OpenAI Spring Update – GPT-4o

更新說明

影片如下

重點摘要

realtime

有了真的的人類情緒

Live research

Free to everyone

Desktop and Mobile Phones app

Web UI Update

手把手教學安裝 anything-llm (不使用 docker)

安裝 Anything llm

前端的程式碼

更新的指令碼

探索Perplexity：黃仁勳與貝佐斯投資的AI知識平台

Perplexity的特色

近期文章

近期留言

彙整

分類