不是每間公司都該做 RAG——這是判斷標準


老闆問你:「我們什麼時候能有 AI 知識庫?」

競爭對手發了新聞稿,說他們用 RAG 打造了「智慧知識管理系統」。

老闆轉發給你:「這個我們能做嗎?什麼時候能上線?」

你心裡想的是:

  • 我們的 Confluence 連自己人都懶得更新
  • 文件散落在 5 個不同平台
  • 上次有人整理知識庫是 3 年前
  • 上 RAG?那不是把垃圾變成「自信的垃圾」嗎?

但你不能這樣回答。

你需要的是一個框架,讓你能用老闆聽得懂的語言,專業地評估這件事。


RAG 是放大器,不是修復器

先說結論:不是每間公司都該做 RAG,至少不是現在。

RAG(Retrieval-Augmented Generation)的本質是「把你的知識庫接上 LLM」。

如果你的知識庫本來就好:

  • 文件有人維護
  • 資訊有結構
  • 員工會去查

那 RAG 會讓它更好——搜尋更快、回答更精準、使用體驗更佳。

但如果你的知識庫本來就爛:

  • 文件過時
  • 版本混亂
  • 沒人在用

那 RAG 會讓它更爛——而且是自信地爛

傳統搜尋找不到東西,用戶知道「沒找到」。 RAG 找到錯的東西,會包裝成流暢的答案,用戶以為是對的。

這比「找不到」更危險。


三個判斷維度

在回答老闆之前,你需要評估三件事:

  1. 你的知識現在有人在用嗎?
  2. 你有預算持續維護嗎?
  3. 出錯的後果你扛得起嗎?

判斷一:你的知識現在有人在用嗎?

這是最基本的問題。

如果現有知識庫沒人在用,RAG 不會讓它變得有人用。

RAG 只是換了一個介面(從搜尋框變成對話框),底層的問題不會消失:

  • 內容過時 → RAG 會給過時的答案
  • 內容矛盾 → RAG 會隨機選一個版本回答
  • 內容不存在 → RAG 可能會幻覺出一個答案

診斷指標

問自己這些問題:

使用率

  • 過去 30 天,有多少員工用過內部搜尋?
  • 他們找到需要的資訊了嗎?
  • 還是最後都去問同事?

新鮮度

  • 核心文件(SOP、政策、技術文件)的最後更新時間?
  • 有沒有「大家都知道是錯的,但沒人改」的文件?

Ownership

  • 每份文件有明確的負責人嗎?
  • 負責人知道自己是負責人嗎?
  • 負責人有在維護嗎?

殘酷的現實

根據我的經驗,大多數企業的知識庫狀況是:

  • 使用率 < 30%(大家寧願問人)
  • 50% 以上文件超過 1 年沒更新
  • 80% 的文件沒有明確 owner

如果你的公司是這樣,RAG 不是解法,是災難


判斷二:你有預算持續維護嗎?

RAG 不是「做完就不用管」的專案。

它是一個需要持續營運的系統。

成本結構

一次性成本(PoC 階段)

項目 估計
資料處理與清理 2-4 週人力
系統開發 4-8 週人力
Embedding 處理 $100-500(依資料量)
測試與調整 2-4 週人力

持續成本(上線後)

項目 估計(每月)
Vector DB(如 Pinecone) $70+
LLM API(如 OpenAI) 依用量,$100-1000+
Embedding API 依更新頻率
維護人力(至少 0.25 FTE) 看你的人力成本
監控與告警處理 時間成本

沒有 Owner 的 RAG 專案

我見過太多這樣的案例:

  1. PoC 成功,大家很開心
  2. 上線,前幾週運作正常
  3. 新文件沒人加進去
  4. 舊文件沒人更新
  5. 回答品質開始下降
  6. 用戶開始抱怨
  7. 沒人有時間處理
  8. 系統變成「那個沒人敢關,但也沒人在用的東西」

如果沒有明確的 owner 和持續預算,不要開始。


判斷三:出錯的後果你扛得起嗎?

RAG 一定會出錯。

根據研究,即使是最好的 RAG 系統,faithfulness(答案忠於來源)也很難超過 95%。

這代表每 20 個回答,可能有 1 個包含錯誤資訊。

問題是:這 1 個錯誤的後果是什麼?

風險評估矩陣

使用場景 出錯後果 風險等級
內部 IT 知識庫 員工多花時間除錯
HR 政策查詢 員工誤解權益
客戶服務 客戶收到錯誤資訊
法規遵循查詢 法律風險 極高
醫療/金融建議 人身或財務損失 不建議

風險緩解措施

如果決定做,你需要:

1. 明確的免責聲明

本系統使用 AI 技術回答問題,可能出現錯誤。
對於重要決策,請務必查證原始文件。

2. 來源顯示

每個回答都要顯示「根據哪份文件」,讓用戶可以驗證。

3. Fallback 機制

當信心分數低於門檻,不要硬回答:

我找不到足夠的資訊來回答這個問題。
你可以:
1. 換個方式問
2. 直接查詢知識庫
3. 聯繫 [負責人]

4. Human-in-the-loop

高風險場景,RAG 只做「草稿」,人工審核後才發出。


RAG 就緒度檢核表

在決定之前,用這個 checklist 自評:

知識庫健康度(3 項)


  • 過去 30 天,有 >50% 目標用戶使用過內部搜尋

  • 核心文件的更新時間 < 6 個月

  • >80% 的文件有明確且有在維護的 owner

組織準備度(3 項)


  • 有專人(至少 0.25 FTE)可以負責 RAG 系統維護

  • 有年度預算用於 AI/知識系統營運

  • 有定期審核與淘汰過時文件的機制

風險可控度(3 項)


  • 錯誤答案的最壞後果是「浪費時間」,不是「法律責任」

  • 用戶理解這是 AI 輔助,會自己驗證重要資訊

  • 有 fallback 機制(找不到就轉人工或顯示原始文件)

評分解讀

達標項目 建議
9/9 ✅ 綠燈:可以開始 PoC
6-8/9 ⚠️ 黃燈:先補強弱項,1-2 個月後再評估
3-5/9 🔶 橘燈:需要 3-6 個月的基礎建設
<3/9 ❌ 紅燈:先改善知識管理,RAG 不是現在的優先項

決策矩陣

根據兩個關鍵維度,你的處境落在哪裡?

                    │ 有維護能力          │ 沒維護能力
────────────────────┼────────────────────┼────────────────────
知識品質好          │ ✅ 現在就做         │ ⚠️ 先確保 owner
(文件新、有人用)  │                    │    再開始
────────────────────┼────────────────────┼────────────────────
知識品質差          │ 🔧 先整理 2-3 個月  │ ❌ 不要做
(文件舊、沒人看)  │    再啟動 RAG      │    先解決根本問題

各象限的行動建議

✅ 綠燈區:現在就做

  • 你的知識庫健康,團隊也有能力維護
  • 直接進入 PoC,3 個月內可以上線
  • 重點是定義成功指標,不是糾結技術選型

⚠️ 黃燈區:先確保 owner

  • 知識品質不錯,但沒人有空維護 RAG
  • 先解決人力問題:誰是 owner?有多少時間?
  • 沒有 owner 就不要開始,否則 3 個月後會後悔

🔧 橘燈區:先整理再做

  • 有人力,但知識庫太亂
  • 花 2-3 個月做「知識大掃除」
  • 刪掉過時文件、合併重複內容、建立 owner 機制
  • 然後再啟動 RAG

❌ 紅燈區:不要做

  • 知識爛、也沒人維護
  • RAG 不會解決這個問題,只會讓問題更難被發現
  • 先投資在知識管理的基礎建設

怎麼跟老闆說

這是最關鍵的部分。

如果結論是「可以做」

老闆,我評估過了,我們的知識庫狀況不錯,
團隊也有能力維護這個系統。

我建議 Q1 啟動 PoC,範圍先限定在 [具體領域],
預計 3 個月後可以給你初步成果。

需要的資源是 [人力] 和 [預算],
成功指標是 [具體指標]。

如果結論是「還不行」

❌ 不要這樣說:

「我們的資料品質不夠好,現在做 RAG 會失敗。」

老闆聽到的是:「你在找藉口。」

✅ 要這樣說:

老闆,我評估過了。

現在導入的成功率大概 40%,
主要風險是我們的知識庫有 [具體問題]。

如果先花 2 個月做資料整理,成功率會提高到 75%。

我建議這樣:
- 本季:先做知識庫健檢和整理
- 下季:啟動 RAG PoC
- Q3:正式上線

這樣風險更可控,也不會比競爭對手慢太多。
我下週給你一份詳細的準備計畫。

老闆聽到的是:「你有在想,而且有具體計畫。」

關鍵原則

  1. 不要說「不行」,說「還沒準備好」
  2. 給出具體時程,不是無限期延後
  3. 提出替代行動,讓老闆知道你在推進
  4. 用數字說話,「40% 成功率」比「可能會失敗」有說服力

如果決定做:第一步不是選技術

很多人一說要做 RAG,就開始研究:

  • 用 Pinecone 還是 Weaviate?
  • OpenAI 還是 Claude?
  • LangChain 還是 LlamaIndex?

這些都不是第一步。

正確的啟動順序

第 1 步:資料盤點(1-2 週)

  • 資料來源有哪些?
  • 每個來源的資料量?
  • 更新頻率?
  • 誰是 owner?

第 2 步:範圍定義(1 週)

  • PoC 要解決什麼問題?
  • 目標用戶是誰?
  • 成功怎麼定義?

第 3 步:資料清理(2-4 週)

  • 刪除過時文件
  • 合併重複內容
  • 補充缺失的 metadata

第 4 步:技術選型(1 週)

這時候才開始選工具。

第 5 步:PoC 開發(4-6 週)

小範圍驗證,快速迭代。

延伸閱讀

如果你決定做,接下來會遇到很多實作上的坑。

我寫了另一篇文章,專門講開發者在第一個月會踩的 5 個坑

👉 RAG 專案的第一個月,你會踩的 5 個坑

那篇是給實際動手做的人看的,包含 chunking 策略、評估框架、監控指標等技術細節。


總結:一頁摘要

如果你需要一頁紙跟老闆報告,用這個:

RAG 導入評估摘要

現況評估:
- 知識庫健康度:[好/中/差]
- 維護能力:[有/不足/無]
- 風險等級:[低/中/高]

就緒度分數:[X]/9

建議:
- [現在做 / 先準備 X 個月 / 暫不建議]

如果做:
- 範圍:[具體範圍]
- 時程:[具體時程]
- 資源:[人力 + 預算]
- 成功指標:[具體指標]

如果不做:
- 替代方案:[先做什麼]
- 重新評估時間:[什麼時候]

最後的話

RAG 是好工具,但不是萬靈丹。

它能讓好的知識管理變得更好, 但不能讓爛的知識管理變好。

在追逐 AI 熱潮之前,先問自己:

我們的知識,現在有人在用嗎?

如果答案是「有」,RAG 會是很好的加速器。 如果答案是「沒有」,先解決這個問題。

技術債可以慢慢還, 但「自信地給錯誤答案」的系統, 會讓你的技術債利息越滾越高。

選擇權在你手上。

Leave a Comment