老闆問你:「我們什麼時候能有 AI 知識庫?」
競爭對手發了新聞稿,說他們用 RAG 打造了「智慧知識管理系統」。
老闆轉發給你:「這個我們能做嗎?什麼時候能上線?」
你心裡想的是:
- 我們的 Confluence 連自己人都懶得更新
- 文件散落在 5 個不同平台
- 上次有人整理知識庫是 3 年前
- 上 RAG?那不是把垃圾變成「自信的垃圾」嗎?
但你不能這樣回答。
你需要的是一個框架,讓你能用老闆聽得懂的語言,專業地評估這件事。
RAG 是放大器,不是修復器
先說結論:不是每間公司都該做 RAG,至少不是現在。
RAG(Retrieval-Augmented Generation)的本質是「把你的知識庫接上 LLM」。
如果你的知識庫本來就好:
- 文件有人維護
- 資訊有結構
- 員工會去查
那 RAG 會讓它更好——搜尋更快、回答更精準、使用體驗更佳。
但如果你的知識庫本來就爛:
- 文件過時
- 版本混亂
- 沒人在用
那 RAG 會讓它更爛——而且是自信地爛。
傳統搜尋找不到東西,用戶知道「沒找到」。 RAG 找到錯的東西,會包裝成流暢的答案,用戶以為是對的。
這比「找不到」更危險。
三個判斷維度
在回答老闆之前,你需要評估三件事:
- 你的知識現在有人在用嗎?
- 你有預算持續維護嗎?
- 出錯的後果你扛得起嗎?
判斷一:你的知識現在有人在用嗎?
這是最基本的問題。
如果現有知識庫沒人在用,RAG 不會讓它變得有人用。
RAG 只是換了一個介面(從搜尋框變成對話框),底層的問題不會消失:
- 內容過時 → RAG 會給過時的答案
- 內容矛盾 → RAG 會隨機選一個版本回答
- 內容不存在 → RAG 可能會幻覺出一個答案
診斷指標
問自己這些問題:
使用率
- 過去 30 天,有多少員工用過內部搜尋?
- 他們找到需要的資訊了嗎?
- 還是最後都去問同事?
新鮮度
- 核心文件(SOP、政策、技術文件)的最後更新時間?
- 有沒有「大家都知道是錯的,但沒人改」的文件?
Ownership
- 每份文件有明確的負責人嗎?
- 負責人知道自己是負責人嗎?
- 負責人有在維護嗎?
殘酷的現實
根據我的經驗,大多數企業的知識庫狀況是:
- 使用率 < 30%(大家寧願問人)
- 50% 以上文件超過 1 年沒更新
- 80% 的文件沒有明確 owner
如果你的公司是這樣,RAG 不是解法,是災難。
判斷二:你有預算持續維護嗎?
RAG 不是「做完就不用管」的專案。
它是一個需要持續營運的系統。
成本結構
一次性成本(PoC 階段)
| 項目 | 估計 |
|---|---|
| 資料處理與清理 | 2-4 週人力 |
| 系統開發 | 4-8 週人力 |
| Embedding 處理 | $100-500(依資料量) |
| 測試與調整 | 2-4 週人力 |
持續成本(上線後)
| 項目 | 估計(每月) |
|---|---|
| Vector DB(如 Pinecone) | $70+ |
| LLM API(如 OpenAI) | 依用量,$100-1000+ |
| Embedding API | 依更新頻率 |
| 維護人力(至少 0.25 FTE) | 看你的人力成本 |
| 監控與告警處理 | 時間成本 |
沒有 Owner 的 RAG 專案
我見過太多這樣的案例:
- PoC 成功,大家很開心
- 上線,前幾週運作正常
- 新文件沒人加進去
- 舊文件沒人更新
- 回答品質開始下降
- 用戶開始抱怨
- 沒人有時間處理
- 系統變成「那個沒人敢關,但也沒人在用的東西」
如果沒有明確的 owner 和持續預算,不要開始。
判斷三:出錯的後果你扛得起嗎?
RAG 一定會出錯。
根據研究,即使是最好的 RAG 系統,faithfulness(答案忠於來源)也很難超過 95%。
這代表每 20 個回答,可能有 1 個包含錯誤資訊。
問題是:這 1 個錯誤的後果是什麼?
風險評估矩陣
| 使用場景 | 出錯後果 | 風險等級 |
|---|---|---|
| 內部 IT 知識庫 | 員工多花時間除錯 | 低 |
| HR 政策查詢 | 員工誤解權益 | 中 |
| 客戶服務 | 客戶收到錯誤資訊 | 高 |
| 法規遵循查詢 | 法律風險 | 極高 |
| 醫療/金融建議 | 人身或財務損失 | 不建議 |
風險緩解措施
如果決定做,你需要:
1. 明確的免責聲明
本系統使用 AI 技術回答問題,可能出現錯誤。
對於重要決策,請務必查證原始文件。
2. 來源顯示
每個回答都要顯示「根據哪份文件」,讓用戶可以驗證。
3. Fallback 機制
當信心分數低於門檻,不要硬回答:
我找不到足夠的資訊來回答這個問題。
你可以:
1. 換個方式問
2. 直接查詢知識庫
3. 聯繫 [負責人]
4. Human-in-the-loop
高風險場景,RAG 只做「草稿」,人工審核後才發出。
RAG 就緒度檢核表
在決定之前,用這個 checklist 自評:
知識庫健康度(3 項)
過去 30 天,有 >50% 目標用戶使用過內部搜尋
核心文件的更新時間 < 6 個月
>80% 的文件有明確且有在維護的 owner
組織準備度(3 項)
有專人(至少 0.25 FTE)可以負責 RAG 系統維護
有年度預算用於 AI/知識系統營運
有定期審核與淘汰過時文件的機制
風險可控度(3 項)
錯誤答案的最壞後果是「浪費時間」,不是「法律責任」
用戶理解這是 AI 輔助,會自己驗證重要資訊
有 fallback 機制(找不到就轉人工或顯示原始文件)
評分解讀
| 達標項目 | 建議 |
|---|---|
| 9/9 | ✅ 綠燈:可以開始 PoC |
| 6-8/9 | ⚠️ 黃燈:先補強弱項,1-2 個月後再評估 |
| 3-5/9 | 🔶 橘燈:需要 3-6 個月的基礎建設 |
| <3/9 | ❌ 紅燈:先改善知識管理,RAG 不是現在的優先項 |
決策矩陣
根據兩個關鍵維度,你的處境落在哪裡?
│ 有維護能力 │ 沒維護能力
────────────────────┼────────────────────┼────────────────────
知識品質好 │ ✅ 現在就做 │ ⚠️ 先確保 owner
(文件新、有人用) │ │ 再開始
────────────────────┼────────────────────┼────────────────────
知識品質差 │ 🔧 先整理 2-3 個月 │ ❌ 不要做
(文件舊、沒人看) │ 再啟動 RAG │ 先解決根本問題
各象限的行動建議
✅ 綠燈區:現在就做
- 你的知識庫健康,團隊也有能力維護
- 直接進入 PoC,3 個月內可以上線
- 重點是定義成功指標,不是糾結技術選型
⚠️ 黃燈區:先確保 owner
- 知識品質不錯,但沒人有空維護 RAG
- 先解決人力問題:誰是 owner?有多少時間?
- 沒有 owner 就不要開始,否則 3 個月後會後悔
🔧 橘燈區:先整理再做
- 有人力,但知識庫太亂
- 花 2-3 個月做「知識大掃除」
- 刪掉過時文件、合併重複內容、建立 owner 機制
- 然後再啟動 RAG
❌ 紅燈區:不要做
- 知識爛、也沒人維護
- RAG 不會解決這個問題,只會讓問題更難被發現
- 先投資在知識管理的基礎建設
怎麼跟老闆說
這是最關鍵的部分。
如果結論是「可以做」
老闆,我評估過了,我們的知識庫狀況不錯,
團隊也有能力維護這個系統。
我建議 Q1 啟動 PoC,範圍先限定在 [具體領域],
預計 3 個月後可以給你初步成果。
需要的資源是 [人力] 和 [預算],
成功指標是 [具體指標]。
如果結論是「還不行」
❌ 不要這樣說:
「我們的資料品質不夠好,現在做 RAG 會失敗。」
老闆聽到的是:「你在找藉口。」
✅ 要這樣說:
老闆,我評估過了。
現在導入的成功率大概 40%,
主要風險是我們的知識庫有 [具體問題]。
如果先花 2 個月做資料整理,成功率會提高到 75%。
我建議這樣:
- 本季:先做知識庫健檢和整理
- 下季:啟動 RAG PoC
- Q3:正式上線
這樣風險更可控,也不會比競爭對手慢太多。
我下週給你一份詳細的準備計畫。
老闆聽到的是:「你有在想,而且有具體計畫。」
關鍵原則
- 不要說「不行」,說「還沒準備好」
- 給出具體時程,不是無限期延後
- 提出替代行動,讓老闆知道你在推進
- 用數字說話,「40% 成功率」比「可能會失敗」有說服力
如果決定做:第一步不是選技術
很多人一說要做 RAG,就開始研究:
- 用 Pinecone 還是 Weaviate?
- OpenAI 還是 Claude?
- LangChain 還是 LlamaIndex?
這些都不是第一步。
正確的啟動順序
第 1 步:資料盤點(1-2 週)
- 資料來源有哪些?
- 每個來源的資料量?
- 更新頻率?
- 誰是 owner?
第 2 步:範圍定義(1 週)
- PoC 要解決什麼問題?
- 目標用戶是誰?
- 成功怎麼定義?
第 3 步:資料清理(2-4 週)
- 刪除過時文件
- 合併重複內容
- 補充缺失的 metadata
第 4 步:技術選型(1 週)
這時候才開始選工具。
第 5 步:PoC 開發(4-6 週)
小範圍驗證,快速迭代。
延伸閱讀
如果你決定做,接下來會遇到很多實作上的坑。
我寫了另一篇文章,專門講開發者在第一個月會踩的 5 個坑:
那篇是給實際動手做的人看的,包含 chunking 策略、評估框架、監控指標等技術細節。
總結:一頁摘要
如果你需要一頁紙跟老闆報告,用這個:
RAG 導入評估摘要
現況評估:
- 知識庫健康度:[好/中/差]
- 維護能力:[有/不足/無]
- 風險等級:[低/中/高]
就緒度分數:[X]/9
建議:
- [現在做 / 先準備 X 個月 / 暫不建議]
如果做:
- 範圍:[具體範圍]
- 時程:[具體時程]
- 資源:[人力 + 預算]
- 成功指標:[具體指標]
如果不做:
- 替代方案:[先做什麼]
- 重新評估時間:[什麼時候]
最後的話
RAG 是好工具,但不是萬靈丹。
它能讓好的知識管理變得更好, 但不能讓爛的知識管理變好。
在追逐 AI 熱潮之前,先問自己:
我們的知識,現在有人在用嗎?
如果答案是「有」,RAG 會是很好的加速器。 如果答案是「沒有」,先解決這個問題。
技術債可以慢慢還, 但「自信地給錯誤答案」的系統, 會讓你的技術債利息越滾越高。
選擇權在你手上。