Please select your location and preferred language where available.
鎧俠實現單一伺服器 48 億筆高維度向量搜尋,透過 GPU 加速讓索引建置效率提升 7.8 倍
運用 NVIDIA cuVS 和 KIOXIA AiSAQ 技術,以極低 DRAM 占用下實現了 1024 維度向量索引
- 2026 年 3 月 17 日
- 鎧俠株式會社
【東京訊】全球記憶體解決方案領導廠商鎧俠株式會社,憑藉著開源 KIOXIA AiSAQTM 近似最近鄰搜尋(ANNS)技術,成功實現在單一伺服器上擴展至 48 億筆向量的高維度向量搜尋。此外,鎧俠透過 NVIDIA cuVS 的 GPU 加速功能,大幅縮短索引建構時間,為 AI 搜尋帶來質的飛躍。這兩項成就標誌著檢索增強生成(RAG)搜尋解決方案的重大進展。鎧俠仍正在持續開發,以支援超過 48 億筆向量的大規模部署。
在大規模向量資料庫中的索引建構時間一直是產業的所面臨的關鍵痛點。透過與輝達(NVIDIA)的合作,鎧俠展示了 KIOXIA AiSAQ 在處理 1024 維高維度向量時,索引建構時間最高提升了 20 倍,而端對端的建置時間也提升了 7.8 倍。這項 20 倍的提升,意味著原本使用 CPU 需要耗時 28.4 天才能完成的索引建置,使用四顆 NVIDIA Hopper GPU後縮短至僅需 1.4 天;而在端對端的測試中則也從 31 天大幅縮減至短短 4 天。*1
現在的 AI 應用程式可能仰賴儲存於 SSD 固態硬碟上,規模達數百億甚至更多的向量化資訊。然而,即便在十億級別的規模下,單靠 DRAM 來處理,也以不切實際。透過 KIOXIA AiSAQ 技術實現了高度可擴展的儲存架構,在由 GPU 加速索引建構的 Milvus 向量資料庫環境中,僅需以單一查詢伺服器,即可達成數十億級別的搜尋,且延遲表現達到優於 RAG 應用的需求,使大規模部屬從願景走向現實。
「向量資料庫為那些需要在海量非結構化數據中,及時理解意圖、情境與相似性的應用程式提供了核心的骨幹。」輝達儲存技術副總裁 Jason Hardy 表示。「透過利用 NVIDIA cuVS 進行 GPU 加速索引,鎧俠支援了高維度向量資料庫,使其能以空前的效率進行擴充並建立索引。」
KIOXIA AiSAQ 開源軟體技術於去年首度發布,旨在解決 RAG 的擴展性挑戰。它讓系統能直接從 SSD 進行向量搜尋,進而減少對 DRAM 的依賴, KIOXIA AiSAQ 技術具備高度可擴展性,無論是多租戶環境(Multi-tenant)或大型單體式索引(Monolithic Index)佈署都非常適用。此技術採用了一種創新的全域索引(Global Index)演算法,結合了混合集群(Hybird clustering)與圖形搜尋(Graph search),能在極大規模下實現高效的向量搜尋。並透過靈活的調整選項來平衡效能與海量向量的擴充性。KIOXIA AiSAQ 軟體讓大規模佈署變得更易於實踐且方便擴張。
鎧俠株式會社 SSD 部門副總裁兼總經理横塚賢志(Masashi Yokotsuka) :「要將向量資料庫擴展到數十億級別,必須重新思考記憶體與運算的配置。」透將 KIOXIA AiSAQ SSD 型向量搜尋與 NVIDIA GPU 加速,實現指數建構,我們在大規模部署下提供實用的指數建構。身為產業創新者,我們將持續使用快閃記憶體突破人工智慧的極限。
鎧俠致力於推動儲存驅動的 AI 解決方案,支援大規模智慧資料處理,並持續發展 KIOXIA AiSAQ 為數兆向量部署。
請透過連結前往下載 KIOXIA AiSAQ™ 開放原始碼軟體。
註:
- 為此基準處理了總計 19.66 TB 的向量資料。效能或基準結果可能會因主機裝置、讀取和寫入條件、資料大小和其他因素而有所不同。
- KIOXIA AiSAQ 是鎧俠的商標。
- 公司名稱、產品名稱和服務名稱可能是第三方公司的商標。
關於鎧俠
鎧俠是記憶體解決方案的全球領導者,致力於開發、生產和銷售快閃記憶體和固態硬碟(SSD)。2017 年 4 月,其前身東芝記憶體株式會社從東芝株式會社獨立出來,該公司於 1987 年發明 NAND 快閃記憶體。鎧俠致力推出可為客戶帶來更多選擇並為社會創造更多價值的產品、服務和系統,期望透過「記憶」技術來創造振奮人心的體驗並改變世界。鎧俠的創新 3D 快閃記憶體技術 BiCS FLASH™ 正在形塑高密度儲存應用的未來,包括先進的智慧型手機、電腦、自動化系統、資料中心及生成式 AI 系統。
Information in this document, including product prices and specifications, content of services and contact information, is correct on the date of the announcement but is subject to change without prior notice.