by Rain Chu | 5 月 30, 2024 | AI, 音樂
Views: 51
MusicGPT 可以讓使用者能夠在本地使用大型語言模型 (LLMs) 根據自然語言提示生成音樂的功能,他的重點放在文字條件音樂生成、旋律條件音樂生成以及生成無限長或無限音樂流的能力,今天要說明 MusicGPT 如何作為 Suno.ai 的開源替代方案,有甚麼樣的特色有甚麼樣的優缺點。
文字生成音樂
MusicGPT 的文字生成音樂,可以讓用戶輸入描述性文字或情感語言,然後在本地端的系統將其轉化為相應的音樂作品。這一功能對於想要通過音樂增強其敘事的作曲家和故事講述者特別有用,像是YT、小紅書、抖音,能夠完美匹配文本中描述的情緒或場景。無論是反映平靜月光夜的寧靜作品,還是回響著繁忙城市興奮感的活力曲目,MusicGPT 都能適應輸入文本的細微差別。
旋律生成音樂
旋律條件音樂生成將創新推向更深一步,允許用戶輸入特定旋律,MusicGPT 則以此為基礎生成完整的作品。這一功能非常適合那些有旋律想法但需要協助將其發展成完整作品的音樂家和作曲家。MusicGPT 不僅保留原始旋律,還增加了和聲、節奏和配器,提供豐富、飽滿的音樂體驗。
無限長音樂流
MusicGPT 最突破性的功能之一是其生成無限長的能力。這一功能對於遊戲背景音樂、冥想應用程序或公共場所的環境聲景等應用特別吸引人。與傳統的音樂曲目不同,MusicGPT 的作品可以根據需要持續進行,不斷演變而不重複。這創造了一個動態的聽覺環境,可以持續適應聽眾的需求或互動。
Suno.ai 的開源替代方案
MusicGPT 不僅在技術進步上脫穎而出,也因其作為開源解決方案的可訪問性而受到關注。與可能運行專有技術的平台如 Suno.ai 不同,MusicGPT 提供了一種透明、可定制的方法。用戶可以在自己的系統上本地運行它,利用大型語言模型的力量根據自然語言提示生成音樂。這不僅確保了創作過程的隱私和控制,也促進了以社群驅動的發展,其中改進和變化可以由全球用戶共享和實施。
參考資料:
MusicGPT官網:https://www.music-gpt.xyz
原始碼連結:https://github.com/gabotechs/MusicGPT
by Rain Chu | 5 月 23, 2024 | AI, PPT
Views: 126
在現代數位時代,製作引人注目的PPT演示文稿是許多專業和教育場合中的必要技能。Mindshow 作為一個創新的工具,為使用者提供了多樣化的功能,使得PPT製作變得更加簡單高效。以下是一些 Mindshow 的主要特色:
1. 超多模板選擇
Mindshow 提供了豐富的模板庫,也支援多國語言,無論是商業報告、學術展示還是創意演講,都可以在 Mindshow 中找到合適的模板,這些模板設計精美,大多數是歐美的簡潔風格,我個人很喜歡,並且結構合理,可以節省使用者大量的設計時間和精力。
2. 歐美 Style
Mindshow 的模板以歐美風格為主,設計簡約大方,適合各種各樣的正式場合,模板融合了現代設計理念,使得PPT看起來專業且時尚,能夠有效吸引觀眾的注意力。
3. 長文生成PPT
Mindshow 的另一大亮點是其自動生成PPT的功能。使用者只需給你寫好的一篇長文,系統就能自動分析並生成相應的PPT頁面,節省了手動編輯的時間,這對於已經有文章要轉換成教學文件的使用者來說,是一個非常實用的功能。
4. APP可以下載
為了方便使用者隨時隨地進行PPT製作,Mindshow 提供了手機應用程式。使用者可以在手機上直接編輯和查看PPT,非常適合需要經常出差或在移動中工作的專業人士。
5. 免費使用
儘管 Mindshow 提供了豐富的功能,其免費版本已經足夠滿足大部分使用者的需求。這意味著即使是預算有限的學生或初創企業,也能夠享受到高品質的PPT製作服務。
參考資料
by Rain Chu | 5 月 23, 2024 | AI, PPT
Views: 12
美圖最近推出新產品,一句話,10秒鐘,生成PPT,並且還可以直接在網站上修改,要快速製作一個PPT專業且吸引人的PPT變得越來越重要。但卻常常面臨創意枯竭、內容組織困難以及設計不當的問題。幸運的是,美團最新開發的 AI PPT 工具可以解決這些難題。只需一句話,AI 就能根據您的需求自動生成符合專業水準的 PPT。
同時解決你的思路、文章、設計上的難題
這款 AI PPT 工具不僅能幫助您迅速整理思路,生成內容,還能提供精美的設計模板。無論是商業演示、學術報告,還是個人展示,AI 都能根據您的指示自動調整格式和風格,確保您的每一頁PPT都能給人留下深刻印象。
美團最新開發的 AI PPT – 什麼樣的PPT,AI都能做
美團的 AI PPT 工具具備強大的自動化能力,能夠分析您的文字輸入,理解您的需求,並快速生成符合您預期的PPT。無論是數據圖表、文字內容還是圖像排版,AI 都能靈活處理,幫助您輕鬆完成高質量的演示文稿
多種下載格式與高彈性編修
這款 AI PPT 工具支持多種下載格式,包括 PPT、PNG、PDF 等,方便您根據需求選擇最適合的文件格式。此外,您還可以在線直接編修,提供了極大的彈性和便利性。透過這款工具,製作 PPT 將變得前所未有的簡單且高效。無需再為思路混亂、文章結構以及設計風格煩惱,只需簡單幾步,AI 就能幫您搞定一切,讓您輕鬆應對各種演示需求
了解更多請訪問 美圖設計室。
參考資料
by Rain Chu | 5 月 21, 2024 | AI, 影片製作
Views: 2
微軟在2023年Ignite活動上推出了一項出人意料的產品,代表超級大廠也投入換臉的服務
這個新功能名為Azure AI語音文本轉語音虛擬形象,可以讓用戶通過上傳希望虛擬形象相似的人的圖像並編寫劇本來生成虛擬形象的說話視頻。
微軟在博客文章中寫道:“通過文本轉語音虛擬形象,用戶可以更有效地創建視頻……用於製作培訓視頻、產品介紹、客戶推薦等,只需輸入文本。就可以使用虛擬形象來建立會話代理、虛擬助理、聊天機器人等。
Deepfakes Web
https://deepfakesweb.com
Azure 上創建你的服務
你可以在 Azure 中,輸入 deepfake ,就可以找到這項服務
參考資料
by Rain Chu | 5 月 21, 2024 | AI, Chat
Views: 7
在法律領域中,AI 的應用日益增加,而「ChatLaw 法律大模型」正是這一趨勢的最新產物,這個由尖端技術驅動的模型,同時面相專業人士和一般人,提供前所未有的支持,從基本的法律查詢到複雜的案件分析,ChatLaw 都能提供高效且精確的協助,一般人只需要用白話文就可以請 Chatlaw 幫你判斷案件。
核心技術
ChatLaw 的核心在於其先進的演算法。這使得它能夠精確理解和分析法律文本,從而提供具有操作性的建議。無論是判例研究、法律意見書撰寫,還是復雜的法律論證,ChatLaw 都能夠提供高效的解決方案。
ChatLaw-13B,此版本為學術demo版,基於姜子牙Ziya-LLaMA-13B-v1訓練而來,中文各項表現很好,但是邏輯複雜的法律問答效果不佳,需要用更大參數的模型來解決。
ChatLaw-33B,此版本為學術demo版,基於Anima-33B訓練而來,邏輯推理能力大幅提升,但是因為Anima的中文語料過少,導致問答時常會出現英文數據。
ChatLaw-Text2Vec,使用93萬條判決案例做成的數據集基於BERT訓練了一個相似度匹配模型,可將用戶提問信息和對應的法條相匹配。
功能應用
律師和法學研究者使用 ChatLaw 可以迅速獲得所需的法律信息,包括最新的法規變動和相關的判決案例。此外,ChatLaw 的使用者界面極其友好,即使是非專業人士也能輕鬆上手,進行基本的法律查詢。
例如:你可以問”一名女大學生在地鐵站被偷拍”,他就可以回應你判例以及相關條文給你參考,不過現在都是大陸那邊的法律條文。
支援 Python 庫
https://github.com/PKU-YuanGroup/ChatLaw
對法律實踐的影響
ChatLaw 的出現讓法律服務更加民主化,讓普通公眾也能輕鬆接觸到專業的法律建議。這不僅提升了法律服務的普及率,也幫助減少了因法律知識欠缺而產生的社會問題。
參考資料
挤爆服务器,北大法律大模型ChatLaw火了:直接告诉你张三怎么判
姜子牙模型
Anima 模型
by Rain Chu | 5 月 15, 2024 | AI
Views: 0
打算用一句會形容每一個Google IO所發表的AI新功能
2024-05-15- Google IO 10min 彙整
Gemini in workspace
用 google ai 整合並且搜尋你所有在google上的私人資訊,包含用文字搜尋照片(找出女兒游泳的照片),email的彙整,google meet的會議紀錄彙整,Ask Photos with Gemini,Ask with Video
Gemini 1.5 Pro token 1M
相較於其他產品,Gemini 1.5 Pro 的 token 數量可以來到 2M ,大約是1500頁論文,1小時的影片
Gemini 1.5 Flash
輕量型 Gemini ,用於端,有效率
Project Astra
跟昨天的 OpenAI 一樣,可以利用手機的攝像頭即時理解生活的大小事情,包含複雜的程式碼或是只是幫你找到眼鏡
Project Veo
跟 OpenAI SORA 一樣,是影片的生成引擎,可以生成 1080p 的影片 46 秒
TPU Trillium
比起上一代,要快4.7倍
Google AI Search (Gemini Era)
Gemini 客製了一個模型是給搜尋引擎使用,可以產初即時的資訊,有評分過後並且可以信任的資訊,也支援影片搜尋
Gemini Gems
跟 OpenAI 的 GPTs 一樣,可以用自然語言指揮你的AI,但不同的是有支援到 1M Tokens
Youtube AI
可以跟影片對話,提問
PailGemma
Gemma 2 才會支援,27B 參數,針對視覺處理
LearnLM
專作教育市場的 AI 大語言模型,會出題會改作業的時代要來了
Imagen 3
Google 最新的文生圖模型
Music AI Sandbox
提供給專業製作人們使用的 AI 生成音樂工具
AI Teammate (Chip)
協助你協同作業的萬能助理,他能在你開會的時候,幫你調查各種資料,以及解答問題
Circle to search
有了教學平台,當然也會有解題平台,學生可以用 Circle 取圈選題目,查詢答案,並且會提供解題步驟
AI旅行社
幫你規劃旅程
AI 防詐騙
幫你聽電話裡面的人是否有想要詐騙你
結論
整場會議上 AI 被提及 121 次,可見有多重要
近期留言