IT之家 7 月 31 日消息,阿里旗下達摩院日前與大連理工大學合作,推出了一款名為 HQTrack 的 AI 框架。該框架主要由視頻多目標分割器(VMOS)和掩模優化器 (MR) 組成,旨在“實現對視頻中任何目標的高質量跟蹤”。
研究團隊表示,HQTrack 基于開源框架 DeAOT、HQ-SAM,在此之上進行了一定改進,實現了“在視頻中分割各目標”的可能性。
▲ 圖源 HQTrack 的 GitHub 頁面
【資料圖】
同時,研究團隊使用 Intern-T 作為特征提取器,提高框架對不同類型物體的區分能力,同時加入了一個門控傳播模塊(GPM),以便于框架在復雜環境中感知更多微小物體,生成高質量的即時目標遮罩。
據悉,在 VOTS2023 競賽中,HQTrack 以 0.615 的質量得分獲得第二名,研究團隊表示,該 AI 框架可以應用于人臉識別、智能駕駛、監控追蹤等領域,并有望在未來商業應用中落地。
▲ 圖源 HQTrack 的 GitHub 頁面
該項目目前已經在 GitHub 中開放,感興趣的小伙伴們可以在此訪問,IT之家將 HQTrack 核心功能轉錄于下方:
1. 多目標追蹤:HQTrack 可以同時追蹤多個目標對象,適用于復雜場景下的目標追蹤任務。
2. 目標分割:HQTrack 能夠準確地分割視頻中的目標對象,并生成高質量的目標遮罩,可用于目標識別和分析。
3. 高質量輸出:HQTrack 的追蹤結果具有高質量和高準確性,能夠滿足各種應用場景的需求。
4. 簡單易用:HQTrack 提供了簡潔的接口和使用指南,用戶可以輕松地使用和集成該工具。

相關文章
精彩導讀
熱門資訊