Select Page
OmniParser-微軟的開源螢幕解析工具

OmniParser-微軟的開源螢幕解析工具

繼之前提到的 Ahthropic Computer Use ,那時候超級驚豔的,馬上就看到MS也有推出自己的版本,雖然沒有自動執行功能,但可以配合 pyautogui 達成,雖然不支援中文,但可以透過中文OCR 或是 tesseract 處理

安裝到本地端

先建立一個虛擬環境起來

conda create -n omni python=3.12 -y
conda activate omni

選項:有GPU的,先把CUDA安裝起來

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

整個安裝也很簡單,就五個步驟

git clone https://github.com/microsoft/OmniParser.git && cd OmniParser
pip install -r requirements.txt
huggingface-cli download --repo-type model microsoft/OmniParser --local-dir weights --include "icon_detect/*" "icon_caption_blip2/*" "icon_caption_florence/*"
python /home/Ubuntu/OmniParser/weights/convert_safetensor_to_pt.py
python gradio_demo.py

OmniParser 1.5 更新

先下載模型

python weights/convert_safetensor_to_pt.py

For v1.5: 
download 'model_v1_5.pt' from https://huggingface.co/microsoft/OmniParser/tree/main/icon_detect_v1_5, make a new dir: weights/icon_detect_v1_5, and put it inside the folder. No weight conversion is needed. 

執行指令要改成 1.5 版本

python gradio_demo.py --icon_detect_model weights/icon_detect_v1_5/model_v1_5.pt --icon_caption_model florence2

支援其他的語言

舉例來說,要改成中文,請找到專案下的 utils.py ,將 en 改成 ch

reader = easyocr.Reader(['en'])
paddle_ocr = PaddleOCR(
#    lang='en',  # other lang also available
    lang='ch',  # other lang also available
    use_angle_cls=False,
    use_gpu=False,  # using cuda will conflict with pytorch in the same process
    show_log=False,
    max_batch_size=1024,
    use_dilation=True,  # improves accuracy
    det_db_score_mode='slow',  # improves accuracy
    rec_batch_num=1024)

在介面中選取使用 PaddleOCR

相關資源

OmniParser 原始碼

OmniParser 官網

OmniParser 模型

https://blog.stoeng.site/20241030.html

Visa、MasterCard 都大推的「數位企業卡」,可以綁定手機嗎?

Visa、MasterCard 都大推的「數位企業卡」,可以綁定手機嗎?


由於企業在經營過程中,需要支付眾多費用如商務差旅、辦公用品採購、交通費和員工福利等,這些支出不僅種類繁多,而且報銷流程繁瑣且耗時,因此,及時監控金流變得尤為重要。

為了解決這個問題,Visa和萬事達卡分別在13日宣布推出「數位企業卡」(Virtual Corporate Card),意在獲得企業金流管理市場的先機。

數位企業卡

所謂的「數位企業卡」是透過企業名義申辦一張主卡號,再由員工申請數位子卡來進行交易,這使得員工可以使用隨機生成的卡號來支付各類費用,如企業採購、跨境付款、廣告費、交通和住宿費等。

萬事達卡聲稱,這種純數位卡的好處有三個主要方面:首先,它為跨境支付提供了更大的靈活性,並能產生一次性或多次性使用的卡號,從而提供了更安全的支付方式。其次,它可以解決傳統財務對帳和結算問題,用戶可以根據交易類型、週期和額度定制卡片,而且每筆交易都需要事先申請,系統會即時通知員工和簽核人員,自動產生報銷單,幫助企業有效管理支出。最後,如果交易出現異常,簽核方可以立即鎖卡,增加交易的安全性。

Visa台灣區總經理趙麗芳高興地宣布,經過一年準備,Visa數位企業卡現在已經準備就緒,並可以綁定LINE Pay使用。研究顯示,全球有73%的小型企業認為數位支付是其成長的關鍵,然而還有45%的中小企業在進行B2B支付時仍然依賴現金和支票。

同樣地,萬事達卡也與TapPay(喬睿科技)合作,預計在2024年上半年推廣「萬事達卡企業虛擬信用卡支付解決方案」,以幫助台灣企業加速數位轉型,更有效地控制商務支出。

這兩家金融服務巨頭的舉動,顯示出數位支付技術在企業運營管理中的重要性。數位企業卡提供的解決方案不僅能提升金流的效率和安全性,還能為企業節省貴重的人力成本,促進業務發展。在FinTech行業中,這種創新的支付方案可能成為企業日益增長需求的答案,而Visa和萬事達卡都在積極探索這片新興市場,提供更加智能、便捷的支付選項給大家。

綁定手機更便利

為了使支付過程更加便捷,Visa和萬事達卡還特別強調了其與手機APP的緊密整合。例如,Visa的數位企業卡可以綁定LINE Pay,而萬事達卡則計劃與TapPay合作,預計將在不久的將來擴大導入這項服務。這樣的結合不僅大大減少了現金支付的不便,還意味著在任何時候、任何地點,只要通過手機即可進行交易,無需隨身攜帶實體信用卡,這對於追求效率與安全的現代企業來說,無疑是一大福音。

COMMEET

科技新創公司COMMEET的結合更是將這一方案的便利性提升到了新的高度。透過其AI光學字元辨識技術(OCR)和智能費用管理系統,從拍照上傳發票到費用追蹤和報銷單生成,所有過程都能通過手機APP實現,大幅提升了報銷作業的效率。

申請請到 COMMEETTapPayOwlPay