by Rain Chu | 1 月 1, 2025 | GitHub , Windows
PowerToys 是一套由在 Windows 95 就開始用到現在的 Microsoft 開發實用工具集合,專為提高 Windows 使用者生產力和使用體驗而設計,PowerToys 提供了許多高效能的工具,幫助使用者完成日常任務,近年來,Microsoft 將其重新打造為開源專案,並為 Windows 10 和 Windows 11 提供支持。
PowerToys 在 Windows 10, 11 新增功能介紹
進階貼上(Advanced Paste)
此工具允許使用者將剪貼簿中的文字以所需格式貼上,並提供 AI 支援的選項來強化貼上功能。
Always On Top
使用此功能,您可以透過快捷鍵 Win + Ctrl + T
將視窗固定在其他視窗之上,確保重要視窗不被遮蓋。
PowerToys Awake
此工具可讓電腦保持清醒狀態,無需調整電源和睡眠設定,適合執行長時間任務時使用。
File Locksmith
此功能可檢查哪些檔案正在使用中,以及由哪些程序使用,方便管理檔案鎖定狀態。
主控件檔案編輯器(Hosts File Editor)
提供方便的方式來編輯包含網域名稱和相符 IP 位址的「Hosts」檔案,便於網路管理。
無框線的滑鼠(Mouse Without Borders)
允許使用相同的鍵盤和滑鼠與多部電腦互動,順暢地在電腦之間共用剪貼簿內容和檔案。
New+
此功能可讓您從檔案總管中的一組個人化範本建立檔案和資料夾,提升工作效率。
預覽(Peek)
允許您預覽檔案內容,而不需要開啟多個應用程式或中斷工作流程,選取檔案並使用快捷方式 Ctrl + 空格鍵
即可。
螢幕尺規(Screen Ruler)
螢幕尺規是一個實用工具,允許使用者快速測量螢幕上的像素,對於設計師和開發者來說特別有用。 只需按下快捷鍵 Win + Shift + M
,即可啟動螢幕尺規,選擇測量方式,量度的像素將顯示在螢幕上。
PowerToys 的主要功能介紹:
1. FancyZones
FancyZones 是一個窗口管理工具,讓使用者可以輕鬆定義自訂的視窗佈局。這對於需要多任務處理的人來說非常實用,例如在多螢幕或高解析度顯示器上,同時排列多個應用程式視窗。
功能亮點 :
設定自訂區域佈局
快速分配應用程式到區域
支持鍵盤快速操作
2. PowerToys Run
這是一個快速啟動器,類似於 macOS 的 Spotlight,可以幫助使用者快速找到應用程式、檔案,甚至執行系統命令。
功能亮點 :
即時搜尋結果
支持插件擴展
可啟動 URL、執行腳本
3. Keyboard Manager
Keyboard Manager 是一個鍵盤重映射工具,讓使用者根據自己的需求修改鍵盤快捷鍵或重新定義按鍵。
功能亮點 :
支持單鍵和組合鍵重映射
適合想提升工作流程的使用者
4. Color Picker
Color Picker 是一個顏色選取工具,特別適合設計師和開發者。使用者可以快速提取螢幕上任意位置的顏色,並獲得 HEX、RGB 等格式。
功能亮點 :
5. File Explorer Add-ons
這個工具提供了多種檔案預覽功能,讓使用者可以直接在檔案總管中檢視支援格式的內容,例如 SVG、Markdown 和 PDF 等。
功能亮點 :
6. Text Extractor
Text Extractor 是一個 OCR 工具,允許使用者從圖片中提取文字。這在需要快速複製文件或截圖中的內容時特別有用。
功能亮點 :
7. Mouse Utilities
這是一組滑鼠輔助工具,幫助使用者更輕鬆地找到滑鼠指標或執行高精度點擊。
功能亮點 :
8. Image Resizer
Image Resizer 是一個影像大小調整工具,可以直接在檔案總管中調整圖片大小,適合需要快速批次處理影像的使用者。
功能亮點 :
為什麼選擇 PowerToys?
免費且開源 :PowerToys 是一個完全免費的工具,並且基於開源社群開發,功能持續更新。
高度客製化 :所有工具都可以根據使用者需求進行自訂設置。
整合 Windows 生態系統 :與 Windows 的原生功能深度整合,使用者不需要額外安裝繁瑣的軟體。
結論
可以透過 GitHub PowerToys 頁面 下載並探索更多功能。
by rainchu | 12 月 19, 2024 | AI , 影片製作 , 語音合成 , 音樂
MMAudio 是一款開源的多模態影片轉音訊工具,透過多模態聯合訓練技術,可以將高品質的影片與音訊合成。該專案由伊利諾大學厄巴納-香檳分校、Sony AI 及 Sony 集團公司合作開發,適用於影片配音、虛擬角色語音等多媒體創作場景。
主要特色:
多模態聯合訓練: MMAudio 採用多模態聯合訓練方法,能夠同時處理影片和文字輸入,生成與內容同步的音訊。
高品質音訊合成: 透過先進的模型架構,MMAudio 能夠生成高品質且自然的音訊,適用於各類應用場景。
同步模組: MMAudio 的同步模組確保生成的音訊與影片畫面精確匹配,實現高度同步。
適用場景:
影片配音: 自動為無聲 影片生成對應的音訊,提升影片的可觀賞性。
虛擬角色語音生成: 為虛擬角色生成符合其動作和表情的語音,增強互動性。
多媒體內容創作: 協助創作者快速為視覺內容添加音訊,豐富作品表現力。
技術原理:
MMAudio 基於深度學習技術,特別是神經網路,理解和生成音訊資料。模型能夠處理影片和文字輸入,透過深度學習網路提取特徵,進行音訊合成。在訓練時,模型考慮音訊、影片和文字資料,使生成的音訊能夠與影片和文字內容相匹配。透過同步模組,確保音訊輸出與影片畫面或文字描述的時間軸完全對應,實現同步。
使用方法:
MMAudio 提供命令列介面和 Gradio 介面,使用者可以根據需求選擇使用。在命令列中,使用者可以透過指定影片路徑和文字提示,生成對應的音訊。Gradio 介面則提供了更友善的使用者介面,支援影片到音訊和文字到音訊的合成。
已知限制:
目前,MMAudio 存在以下限制:
有時會生成不清晰的語音或背景音樂。
對某些陌生概念的處理不夠理想。
相關資源:
by rainchu | 11 月 28, 2024 | Agent , AI
Flowise 是一款開源的低代碼工具,一般人也可以輕易地使用,用於構建自定義的大語言模型(LLM)編排流程和 AI 代理。透過直觀的拖放介面,使用者可以輕鬆設計複雜的 AI 工作流程,無需深入的程式設計知識。
Flowise 的主要特點:
開源且免費 :Flowise 完全開源,使用者可自由使用並進行二次開發,無需擔心授權問題。 GitHub
低代碼開發 :透過簡單的拖放介面,使用者可以快速構建 LLM 應用,縮短開發週期。 Flowise AI Docs
多代理支援 :Flowise 提供多代理系統,允許使用者設計可與外部工具和資料來源互動的代理,實現更高效的任務處理。 Flowise AI Docs
靈活的工作流程設計 :使用者可以根據需求,自定義工作流程的邏輯和順序,滿足不同場景的應用需求。
Flowise 與其他 AI 代理工具的差異:
與 Langflow 的比較 :Langflow 專注於自然語言處理,提供可視化介面來構建和調試語言處理流程。相比之下,Flowise 更強調 LLM 的編排和代理的靈活性,適用範圍更廣。
與 Dify 的比較 :Dify 致力於簡化 AI 應用的部署,提供一站式解決方案。而 Flowise 更專注於工作流程的設計和代理的構建,提供更大的自定義空間。
與其他工具的比較 :Flowise 的開源性和低代碼特性,使其在靈活性和可擴展性方面具有優勢,適合需要快速迭代和自定義需求的開發者。
參考資料
VIDEO
by Rain Chu | 6 月 3, 2022 | AI , Raspberry Pi , 圖型處理 , 機器人
最新名人新寵「波士頓動力機器狗」,一隻要價220萬台幣,可不是每個人都養得起的,但佛心的史丹佛機器狗,已經開源了,在大陸那邊已經百花齊放,每家公司都擁有自己的機器狗,不用羨慕他們,全世界最強的擬態機器人公司,當然還是波士頓動力,但你看完這篇,也可以在幾天內買好零件,打造自己的動力機器狗。
波士頓動力機器狗宣傳片
VIDEO
史丹佛大學 Pupper 簡介
史丹佛大學開源的機器狗專案,用的主機是 Raspberry Pi 4,OS 是 Linux base ,可以與 Ubuntu 相容,核心的影像辨識演算法用的是 OpenCV ,預設就可以選轉、跳躍、小跑步
日本做的可愛 Pupper
從 Pupper BOM 表開始
可以從下面的網址,取得製作動力機器狗的所有需要的元件,如果全部都用買的大約要900美元,但很多東西是可以自己印,或是自己改,但如果嫌麻煩,直接去 Amazon 上一次購足即可
https://docs.google.com/spreadsheets/d/e/2PACX-1vRAPT8knAtIKwr5NxvVsEOxPK8zk8y3jPc51TdTPQtBHN7I9rqgU3z4Ys-C3Z3ETR2kcSDSY-u5ZP6k/pubhtml?widget=true&headers=false
去 Amazon 買足 Pupper 元件
上面提到的所有元件,已經有人整理好了,你只需要用下面的連結,進去選擇你需要的就可以了,Amazon 的購物清單,真的是超方便敗家的
https://www.amazon.com/-/zh_TW/hz/wishlist/ls/2ZB9AWGJ92F9L?ref_=wl_fv_le
直接購買整理好的 Pupper 元件
https://www.mangdang.net/Product?_l=en
組裝 Pupper 的身體
這部分是最花時間的,分成元件、外殼本體、電子電路,熟捻的高手大約要花費2小時
VIDEO
https://pupper.readthedocs.io/en/latest/guide/assembly.html
https://github.com/stanfordroboticsclub/Pupper-Raspi-PDB/
安裝 Pupper 的大腦 (軟體)
這個部分,如果你是常用 Raspberry Pi 的人,應該可以在1小時左右處理好,如果不是的話,按步驟來,應該需要3-4小時
https://pupper.readthedocs.io/en/latest/guide/software_installation.html
安裝程式在https://github.com/Nate711/RPI-Setup
OpenCV如果想換版本可以參考我之前的文章
校準以及測試
VIDEO
連接你的PS4搖桿,來控制 Pupper
https://pupper.readthedocs.io/en/latest/guide/operation.html
Pupper 參考資訊
Fusion 360 CAD 模型:https ://a360.co/2TEh4gQ
你可以透過 Fusion 360 CAD 匯出模型,並且用 3D 列印把它列印出來
史丹佛大學動力機器狗專案首頁
https://pupper.readthedocs.io/en/latest/guide/purchasing.html
近期留言