Anomaly-OV:讓 AI 不只「看到」異常,更能「解釋」為什麼

這份研究由 Johns Hopkins University 與 Honda Research Institute USA 的研究團隊發佈於 CVPR’25 上。針對多模態大型語言模型(MLLMs)在零樣本異常檢測與推理上的不足,提出了名為 Anomaly-OneVision 的專用視覺助理模型及 ...

閱讀文章 →

CEG(Constellation Energy)個股研究:核能 × AI 資料中心用電,市場在重估什麼?

全球數據中心的電力需求正以前所未有的速度爆炸 ,美國能源部估計 2028 年可能到 325–580 TWh。而 AI 訓練與推論正是這股浪潮的核心驅動力。然而,傳統電力基礎設施早已面臨瓶頸。此時美國最大核電運營商的 Constellation Energy,以及其 2026 年初剛吞併 Calpin...

閱讀文章 →

Claude Code 新手必讀:Everything Claude Code 的 Agents、Skills、Hooks、MCP 一次搞懂(含常見踩坑與解法)

從零開始上手 Everything Claude Code!這套 GitHub 近 2 萬星的配置庫,由 Anthropic 黑客松冠軍開源,包含 Agents、Skills、Hooks 等完整工具鏈。本文提供詳細安裝步驟、第一個工作流實作、8 個常見錯誤排查,適合 Claude Code 新手與想...

閱讀文章 →

Long-CLIP:突破 CLIP 77 個 token 的長文本模型

傳統 CLIP 在處理超過 77 個 token 的描述時表現不佳,甚至有效長度不足 20 個字,限制了其在細節檢索與精準圖像生成的應用。作者提出了知識保存延伸(Knowledge-preserved Stretching)與主成分匹配(Primary Component Matching)兩大策略...

閱讀文章 →

MMICL: EMPOWERING VISION-LANGUAGE MODEL WITH MULTI-MODAL IN-CONTEXT LEARNING

透過設計一個包含圖像聲明的獨特上下文方案。近一步構建專屬的 MIC 數據集以成功賦予視覺語言模型(VLM)處理多圖像輸入、理解複雜圖文指代關係以及進行高效多模態上下文學習的能力。「圖文指代關係」(Text-to-Image Reference)指的是在包含多張圖像和大量文字的複雜情境中,文字描述與特...

閱讀文章 →

Language-Guided Adaptive Vision TokenPruning for Efficient Multimodal LargeLanguage Models

動機視覺語言模型在推進的同時,不斷提高的解析度與細節更增進了模型在推論時產出的視覺編碼(Vision Token)數量。以 LLaVA-1.5 為例,模型需處理高達 576 個 Vision Token 這將會帶來大量的運算負擔,因此巨大的運算成將會是 VLM 的發展頻頸。為提高效率作者本次提出一份...

閱讀文章 →

ALIGN: Scaling Visual-Language Models with Noisy Data

該研究為 Google 研究團隊所推出的論文,發表於 ICML 2021 上。最主要目的是透過大規模、未經過度篩選的網路圖片與文字描述(alt-text)資料集,來提升視覺和視覺-語言表徵學習的效率與規模。WHY? 動機是?該研究的動機來自於在視覺應用中的表徵學習 Representation Le...

閱讀文章 →

如何做到深度學習公平自動化篩選履歷?並透過 LLM XAI 做到決策透明

這篇文章分享一條實作路線:以 BAAI/bge-large-en-v1.5 為底,結合 LoRA 高效微調 + 對抗去偏 + 多任務學習 + 文字層敏感屬性遮蔽,再用 排序與反事實公平評估 做檢查,打造一個兼顧效能與公平的履歷匹配系統。Github連結:Edwarddev0723/bge-lora-...

閱讀文章 →

FLAIR: Fine-grained Language-informed Image Representations

本文將以 FLAIR 模型論文為主軸,深入解析其如何突破 CLIP 等傳統多模態架構在語意對齊上的侷限,並說明精細語義對齊機制在提升 AI 圖像理解層次方面的關鍵作用。透過逐步拆解 FLAIR 的高品質多樣描述生成、文字條件化注意力池化設計,以及多正樣本損失函數,本文將說明這些技術創新如何使模型在局...

閱讀文章 →

Spec-Kit 教學:Vive Coding 時代你一定要會的 Coding Agent 工具

Speckit 是一款規格驅動的任務執行工具,這篇文章將教你如何安裝、建立 workflow 並分享實際使用心得與踩雷解法。Speckit 專案位置:https://github.com/github/spec-kit目錄▶ 為什麼選擇 Speckit?▶ 怎麼使用 & 安裝?▶ Speckit 指...

閱讀文章 →