先問的不是模型,而是知識從哪裡來
不少團隊一開始就討論模型大小、回答速度、是否接雲端 API,但真正第一個要問的問題,是「系統要回答的內容來自哪裡」。如果來源文件本身分散、版本混亂、命名不一致,AI 只會把混亂放大。企業在導入前,應先盤點文件來源,例如 SOP、內部指引、產品文件、常見問答、合約樣板、培訓材料等,並確定哪些文件屬於正式版本、哪些只能作參考。只有當知識來源本身被整理過,AI 才有可能穩定輸出。
權限不清,答案就不可能真正安全
企業知識庫最常被低估的,不是技術,而是權限。不同部門、角色、地區與項目成員,看到的內容原本就不一樣;如果知識庫沒有把這件事納入設計,系統很容易出現「回答得很完整,但回答給了不該看的人」的情況。實務上,應至少區分公開資料、部門資料、項目資料與敏感資料四個層次,並把帳戶、群組、文件權限與回答範圍連動。對不少企業而言,這也是為何私有化部署或受控部署比公有雲更合適。
能回答,不代表可追溯
管理層通常不只想知道 AI 能否回答問題,而是想知道「它的答案根據什麼」。如果系統無法指出引用的是哪份文件、哪個版本、哪段內容,那麼一旦出錯,就很難修正,也很難建立信任。成熟的企業知識庫應支援來源引用、版本辨識、更新紀錄與問題回饋機制。這不只是技術設計,也是治理設計。
真正有用的知識庫,一定有更新流程
很多 PoC 在演示時看起來不錯,但三個月後沒人更新文件,結果答案開始過時。知識庫不是一次性項目,而是持續維護的運作能力。企業在導入前,應先定清楚哪些文件可以進系統、誰負責審核、多久更新一次,以及使用者如何回報答案不準確。把更新流程設計好,系統才有機會越用越準。
導入前先釐清的 5 個問題
第一,知識來源是否已整理到可被系統使用。第二,哪些資料可被不同角色查詢。第三,答案是否需要附帶來源與版本。第四,誰負責內容更新與品質維護。第五,這個系統是做示範,還是要進入日常工作。這五個問題若先答清楚,後面的技術選型會容易得多。
適合哪些企業先做
當企業有大量內部文件、跨部門問答重複出現、新人培訓成本高,或客戶支援需頻繁查閱資料時,就很適合先做受控知識庫。相比追求一次做很大,先從單一部門、單一文件庫、單一問答場景開始,通常更容易成功。