Select Page

Microsoft PowerToys 介紹

PowerToys 是一套由在 Windows 95 就開始用到現在的 Microsoft 開發實用工具集合,專為提高 Windows 使用者生產力和使用體驗而設計,PowerToys 提供了許多高效能的工具,幫助使用者完成日常任務,近年來,Microsoft 將其重新打造為開源專案,並為 Windows 10 和 Windows 11 提供支持。

PowerToys 在 Windows 10, 11 新增功能介紹

進階貼上(Advanced Paste)

此工具允許使用者將剪貼簿中的文字以所需格式貼上,並提供 AI 支援的選項來強化貼上功能。

Always On Top

使用此功能,您可以透過快捷鍵 Win + Ctrl + T 將視窗固定在其他視窗之上,確保重要視窗不被遮蓋。

PowerToys Awake

此工具可讓電腦保持清醒狀態,無需調整電源和睡眠設定,適合執行長時間任務時使用。

File Locksmith

此功能可檢查哪些檔案正在使用中,以及由哪些程序使用,方便管理檔案鎖定狀態。

主控件檔案編輯器(Hosts File Editor)

提供方便的方式來編輯包含網域名稱和相符 IP 位址的「Hosts」檔案,便於網路管理。

無框線的滑鼠(Mouse Without Borders)

允許使用相同的鍵盤和滑鼠與多部電腦互動,順暢地在電腦之間共用剪貼簿內容和檔案。

New+

此功能可讓您從檔案總管中的一組個人化範本建立檔案和資料夾,提升工作效率。

預覽(Peek)

允許您預覽檔案內容,而不需要開啟多個應用程式或中斷工作流程,選取檔案並使用快捷方式 Ctrl + 空格鍵 即可。

螢幕尺規(Screen Ruler)

螢幕尺規是一個實用工具,允許使用者快速測量螢幕上的像素,對於設計師和開發者來說特別有用。 只需按下快捷鍵 Win + Shift + M,即可啟動螢幕尺規,選擇測量方式,量度的像素將顯示在螢幕上。


PowerToys 的主要功能介紹:


1. FancyZones

FancyZones 是一個窗口管理工具,讓使用者可以輕鬆定義自訂的視窗佈局。這對於需要多任務處理的人來說非常實用,例如在多螢幕或高解析度顯示器上,同時排列多個應用程式視窗。

功能亮點

  • 設定自訂區域佈局
  • 快速分配應用程式到區域
  • 支持鍵盤快速操作

2. PowerToys Run

這是一個快速啟動器,類似於 macOS 的 Spotlight,可以幫助使用者快速找到應用程式、檔案,甚至執行系統命令。

功能亮點

  • 即時搜尋結果
  • 支持插件擴展
  • 可啟動 URL、執行腳本

3. Keyboard Manager

Keyboard Manager 是一個鍵盤重映射工具,讓使用者根據自己的需求修改鍵盤快捷鍵或重新定義按鍵。

功能亮點

  • 支持單鍵和組合鍵重映射
  • 適合想提升工作流程的使用者

4. Color Picker

Color Picker 是一個顏色選取工具,特別適合設計師和開發者。使用者可以快速提取螢幕上任意位置的顏色,並獲得 HEX、RGB 等格式。

功能亮點

  • 即時顏色選取
  • 支持多種顏色格式
  • 可加入快捷鍵觸發

5. File Explorer Add-ons

這個工具提供了多種檔案預覽功能,讓使用者可以直接在檔案總管中檢視支援格式的內容,例如 SVG、Markdown 和 PDF 等。

功能亮點

  • 提供更多檔案格式預覽支持
  • 簡化檔案瀏覽

6. Text Extractor

Text Extractor 是一個 OCR 工具,允許使用者從圖片中提取文字。這在需要快速複製文件或截圖中的內容時特別有用。

功能亮點

  • 支持多語言識別
  • 即時文字提取

7. Mouse Utilities

這是一組滑鼠輔助工具,幫助使用者更輕鬆地找到滑鼠指標或執行高精度點擊。

功能亮點

  • 滑鼠高亮
  • 快速定位滑鼠指標

8. Image Resizer

Image Resizer 是一個影像大小調整工具,可以直接在檔案總管中調整圖片大小,適合需要快速批次處理影像的使用者。

功能亮點

  • 支持多種解析度
  • 批次調整大小
  • 不影響原始圖片品質

為什麼選擇 PowerToys?

  • 免費且開源:PowerToys 是一個完全免費的工具,並且基於開源社群開發,功能持續更新。
  • 高度客製化:所有工具都可以根據使用者需求進行自訂設置。
  • 整合 Windows 生態系統:與 Windows 的原生功能深度整合,使用者不需要額外安裝繁瑣的軟體。

結論

可以透過 GitHub PowerToys 頁面 下載並探索更多功能。

MMAudio:自動為影片生成同步音訊的開源解決方案

MMAudio:自動為影片生成同步音訊的開源解決方案

MMAudio 是一款開源的多模態影片轉音訊工具,透過多模態聯合訓練技術,可以將高品質的影片與音訊合成。該專案由伊利諾大學厄巴納-香檳分校、Sony AI 及 Sony 集團公司合作開發,適用於影片配音、虛擬角色語音等多媒體創作場景。

主要特色:

  • 多模態聯合訓練: MMAudio 採用多模態聯合訓練方法,能夠同時處理影片和文字輸入,生成與內容同步的音訊。
  • 高品質音訊合成: 透過先進的模型架構,MMAudio 能夠生成高品質且自然的音訊,適用於各類應用場景。
  • 同步模組: MMAudio 的同步模組確保生成的音訊與影片畫面精確匹配,實現高度同步。

適用場景:

  • 影片配音: 自動為無聲影片生成對應的音訊,提升影片的可觀賞性。
  • 虛擬角色語音生成: 為虛擬角色生成符合其動作和表情的語音,增強互動性。
  • 多媒體內容創作: 協助創作者快速為視覺內容添加音訊,豐富作品表現力。

技術原理:

MMAudio 基於深度學習技術,特別是神經網路,理解和生成音訊資料。模型能夠處理影片和文字輸入,透過深度學習網路提取特徵,進行音訊合成。在訓練時,模型考慮音訊、影片和文字資料,使生成的音訊能夠與影片和文字內容相匹配。透過同步模組,確保音訊輸出與影片畫面或文字描述的時間軸完全對應,實現同步。

使用方法:

MMAudio 提供命令列介面和 Gradio 介面,使用者可以根據需求選擇使用。在命令列中,使用者可以透過指定影片路徑和文字提示,生成對應的音訊。Gradio 介面則提供了更友善的使用者介面,支援影片到音訊和文字到音訊的合成。

已知限制:

目前,MMAudio 存在以下限制:

  • 有時會生成不清晰的語音或背景音樂。
  • 對某些陌生概念的處理不夠理想。

相關資源:

Flowise vs. 其他 AI 代理工具:哪個更適合您的需求?

Flowise vs. 其他 AI 代理工具:哪個更適合您的需求?

Flowise 是一款開源的低代碼工具,一般人也可以輕易地使用,用於構建自定義的大語言模型(LLM)編排流程和 AI 代理。透過直觀的拖放介面,使用者可以輕鬆設計複雜的 AI 工作流程,無需深入的程式設計知識。

Flowise 的主要特點:

  • 開源且免費:Flowise 完全開源,使用者可自由使用並進行二次開發,無需擔心授權問題。 GitHub
  • 低代碼開發:透過簡單的拖放介面,使用者可以快速構建 LLM 應用,縮短開發週期。 Flowise AI Docs
  • 多代理支援:Flowise 提供多代理系統,允許使用者設計可與外部工具和資料來源互動的代理,實現更高效的任務處理。 Flowise AI Docs
  • 靈活的工作流程設計:使用者可以根據需求,自定義工作流程的邏輯和順序,滿足不同場景的應用需求。 

Flowise 與其他 AI 代理工具的差異:

  1. Langflow 的比較:Langflow 專注於自然語言處理,提供可視化介面來構建和調試語言處理流程。相比之下,Flowise 更強調 LLM 的編排和代理的靈活性,適用範圍更廣。 
  2. Dify 的比較:Dify 致力於簡化 AI 應用的部署,提供一站式解決方案。而 Flowise 更專注於工作流程的設計和代理的構建,提供更大的自定義空間。 
  3. 與其他工具的比較:Flowise 的開源性和低代碼特性,使其在靈活性和可擴展性方面具有優勢,適合需要快速迭代和自定義需求的開發者。 

參考資料

不到萬元台幣打造自己的機器狗-Make your pupper

不到萬元台幣打造自己的機器狗-Make your pupper

最新名人新寵「波士頓動力機器狗」,一隻要價220萬台幣,可不是每個人都養得起的,但佛心的史丹佛機器狗,已經開源了,在大陸那邊已經百花齊放,每家公司都擁有自己的機器狗,不用羨慕他們,全世界最強的擬態機器人公司,當然還是波士頓動力,但你看完這篇,也可以在幾天內買好零件,打造自己的動力機器狗。

波士頓動力機器狗宣傳片

史丹佛大學 Pupper 簡介

史丹佛大學開源的機器狗專案,用的主機是 Raspberry Pi 4,OS 是 Linux base ,可以與 Ubuntu 相容,核心的影像辨識演算法用的是 OpenCV ,預設就可以選轉、跳躍、小跑步

日本做的可愛 Pupper

從 Pupper BOM 表開始

可以從下面的網址,取得製作動力機器狗的所有需要的元件,如果全部都用買的大約要900美元,但很多東西是可以自己印,或是自己改,但如果嫌麻煩,直接去 Amazon 上一次購足即可

https://docs.google.com/spreadsheets/d/e/2PACX-1vRAPT8knAtIKwr5NxvVsEOxPK8zk8y3jPc51TdTPQtBHN7I9rqgU3z4Ys-C3Z3ETR2kcSDSY-u5ZP6k/pubhtml?widget=true&headers=false

去 Amazon 買足 Pupper 元件

上面提到的所有元件,已經有人整理好了,你只需要用下面的連結,進去選擇你需要的就可以了,Amazon 的購物清單,真的是超方便敗家的

https://www.amazon.com/-/zh_TW/hz/wishlist/ls/2ZB9AWGJ92F9L?ref_=wl_fv_le

直接購買整理好的 Pupper 元件

https://www.mangdang.net/Product?_l=en

組裝 Pupper 的身體

這部分是最花時間的,分成元件、外殼本體、電子電路,熟捻的高手大約要花費2小時

https://pupper.readthedocs.io/en/latest/guide/assembly.html

https://github.com/stanfordroboticsclub/Pupper-Raspi-PDB/

安裝 Pupper 的大腦 (軟體)

這個部分,如果你是常用 Raspberry Pi 的人,應該可以在1小時左右處理好,如果不是的話,按步驟來,應該需要3-4小時

https://pupper.readthedocs.io/en/latest/guide/software_installation.html

安裝程式在https://github.com/Nate711/RPI-Setup

OpenCV如果想換版本可以參考我之前的文章

校準以及測試

連接你的PS4搖桿,來控制 Pupper

https://pupper.readthedocs.io/en/latest/guide/operation.html

Pupper 參考資訊

Fusion 360 CAD 模型:https ://a360.co/2TEh4gQ

你可以透過 Fusion 360 CAD 匯出模型,並且用 3D 列印把它列印出來

史丹佛大學動力機器狗專案首頁

https://pupper.readthedocs.io/en/latest/guide/purchasing.html