AI 不會取代 QA，但會淘汰「只會執行」的 QA

🌏 Read this article in English

Table of Contents

開場：一個反直覺的現象

「AI 要取代 QA 了！」

這句話你大概聽過很多次。每次有新的 AI 測試工具發布，這種標題就會出現一輪。

但如果你實際導入過 AI 測試工具，你會發現一個反直覺的現象：

QA 團隊的人數，短期內並不會減少。

為什麼？

首先，人力調整從來都不是說砍就能砍的。組織有慣性，有既有的職責分工，有人情世故。

但更重要的原因是：AI 產出的東西，需要人來驗證。

AI 可以在一個小時內跑完原本需要三天的測試。但跑完之後呢？

這些測試結果是對的嗎？
有沒有漏掉什麼重要的場景？
AI 說「通過」，真的可以上線嗎？

這些問題，AI 回答不了。需要人來判斷。

所以真正的變化不是「QA 被取代」，而是「QA 的工作內容被重新定義」。

這篇文章要談的，就是這個重新定義。

先搞清楚：QA 到底在做什麼？

在討論 AI 能不能取代 QA 之前，我們需要先拆解 QA 的工作內容。

很多人以為 QA 就是「跑測試」。這是一個嚴重的誤解。

QA 的工作可以分成五種類型：

第一種：執行型

這是最基礎的工作。按照既定的測試案例，一個一個跑過去，記錄結果，截圖存證。

這種工作重複性高、規則明確、不需要太多判斷。

第二種：撰寫型

寫測試案例、寫自動化腳本。把測試需求轉化成可執行的步驟。

這需要技術能力，但本質上還是「把已知的東西文件化」。

第三種：設計型

決定「要測什麼」。設計測試策略、定義覆蓋範圍、決定優先順序。

這需要理解業務邏輯。你要知道哪些功能最重要、哪些場景風險最高、客戶最在意什麼。

第四種：探索型

Exploratory Testing。不按照腳本，而是用直覺和經驗去挖掘潛在問題。

「如果使用者這樣操作會怎樣？」「這個邊界條件有沒有被處理？」「這個流程感覺怪怪的，讓我試一下…」

這需要創意、懷疑精神、和對產品的深度理解。

第五種：驗收型

最終判斷。測試結果出來了，但這代表產品可以上線嗎？這個 bug 算嚴重還是輕微？這個風險可以接受嗎？

這涉及責任歸屬。最終拍板的人，要承擔「放行」的責任。

現在，讓我們看看 AI 能取代哪些：

類型	AI 取代程度	原因
執行型	幾乎完全取代	重複性工作，AI 最擅長
撰寫型	大部分可取代	AI 能寫腳本，但需要人審核
設計型	很難取代	需要業務知識，AI 沒有
探索型	很難取代	需要直覺和懷疑，AI 不會質疑自己
驗收型	無法取代	責任歸屬問題，必須是人

結論很清楚：AI 取代的是「執行」，不是「判斷」。

如果你的 QA 團隊大部分時間都在做執行型工作，那確實會受到衝擊。

但如果你的 QA 能做設計、探索、驗收——他們的價值不但不會下降，反而會上升。

核心問題：誰來驗證 AI 是對的？

這是整篇文章最重要的一節。

AI 測試工具的宣傳通常是這樣的：

「AI 自動產生測試案例，覆蓋率提升 300%！」
「AI 自動執行測試，節省 80% 時間！」
「AI 自動分析結果，產出詳細報告！」

聽起來很美好。但讓我問你一個問題：

AI 說「測試通過」，你敢直接上線嗎？

如果你的答案是「不敢」，那你就理解了問題所在。

AI 可以跑更多測試、產出更多報告、覆蓋更多場景。但這些產出本身需要被驗證。

問題一：AI 測的是對的東西嗎？

AI 可以根據程式碼自動產生測試案例。但它怎麼知道哪些功能對業務最重要？怎麼知道客戶最常抱怨什麼？怎麼知道上次出事的地方在哪裡？

它不知道。它只能根據程式碼的結構去猜。

一個有經驗的 QA 會說：「這個金流功能要重點測，因為上次出過事。」AI 不會，除非你明確告訴它。

問題二：AI 說「通過」，真的通過嗎？

AI 執行測試後說「通過」，這代表什麼？

代表測試腳本跑完了、沒有報錯、結果符合預期。

但測試腳本本身是對的嗎？預期值設得對嗎？有沒有漏掉什麼情況？

AI 不會質疑自己。它不會說「等等，這個測試好像沒有驗證到真正重要的東西」。

這種質疑，只有人能做。

問題三：出了問題，責任算誰的？

假設 AI 測試說「通過」，你上線了，結果出了嚴重 bug。

客戶來抱怨、老闆來問責。這時候你說「AI 說可以的」，有用嗎？

沒用。

最終承擔責任的是人，不是 AI。所以最終做決策的也必須是人。

這就是為什麼「驗收型」工作無法被取代。不是技術上做不到，是責任歸屬上不允許。

所以，QA 的新核心工作是什麼？

驗證 AI 的驗證。

聽起來有點繞，但這就是現實。

AI 產出測試 → QA 驗證測試是否正確 AI 執行測試 → QA 驗證結果是否可信 AI 產出報告 → QA 判斷是否可以上線

QA 從「第一線執行者」變成「AI 的監督者」。

這不是降級，這是升級。

AI 時代 QA 最重要的四種能力

既然 QA 的工作從「執行」變成「判斷」，那需要的能力也會改變。

我按重要性排序，這個排序可能跟你想的不一樣：

第一名：業務理解能力（最重要）

這是最反直覺的。

大家以為 AI 時代最重要的是技術能力、Prompt 能力。錯了。

最重要的是：你懂不懂這個產品在幹嘛？

哪些功能對客戶最重要？
哪些場景最常出問題？
哪些錯誤是致命的、哪些是可以容忍的？
業務邏輯的邊界條件在哪裡？

這些知識存在資深 QA 的腦袋裡，不在任何文件裡，更不在 AI 的訓練資料裡。

AI 可以幫你跑測試，但它不知道「什麼該測」。這個判斷，需要業務理解。

一個懂業務的 QA，可以看一眼 AI 產生的測試案例，立刻說：「這個漏掉了 XX 場景，那個才是客戶最常用的。」

一個不懂業務的 QA，只能說：「AI 產生了 200 個測試案例，看起來很多，應該夠了吧。」

這就是差距。

第二名：批判思考能力

AI 不會質疑自己。它會很有自信地給你一份漂亮的報告，即使報告裡有問題。

QA 需要有能力質疑：

「這個測試真的驗證了我們想驗證的東西嗎？」
「覆蓋率 90% 聽起來很高，但那 10% 是什麼？」
「AI 說這是 edge case 不用管，但真的嗎？」
「這個測試通過了，但結果看起來怪怪的…」

批判思考不是「不相信 AI」，是「不盲目相信任何東西」。

這種能力在 AI 時代反而更重要了。因為 AI 產出的東西量很大、看起來很專業、很容易讓人放下戒心。

能夠在一片「看起來都對」的報告中發現問題，這是高價值技能。

第三名：Prompt 能力

這是大家最常提到的「AI 時代新技能」。

確實重要，但被高估了。

Prompt 能力是「讓 AI 產出更好的東西」的能力。你要知道怎麼問、怎麼給 context、怎麼迭代。

但問題是：你要先知道什麼是「好的東西」，才能判斷 AI 產出的夠不夠好。

這又回到業務理解和批判思考。

一個不懂業務的人，就算 Prompt 寫得再漂亮，也不知道 AI 產出的測試案例對不對。

所以 Prompt 能力排第三。它是放大器，但前提是你本身要有東西可以被放大。

第四名：技術能力

這可能是最反直覺的：技術能力排最後。

不是說技術能力不重要。你還是要能看懂測試腳本、能 debug、能跟工程師溝通、能把測試整合進 CI/CD。

但技術能力的「門檻」被 AI 大幅降低了。

以前你要會寫 Selenium、會寫 Playwright、會處理各種環境問題。現在 AI 可以幫你寫、幫你 debug、幫你查文件。

技術能力從「稀缺資源」變成「基礎設施」。有是必要的，但不再是差異化的來源。

總結這個排序：

排名	能力	為什麼重要	AI 能幫忙嗎？
1	業務理解	決定「測什麼」	不能
2	批判思考	判斷「AI 對不對」	不能
3	Prompt	讓 AI 產出更好	這就是跟 AI 協作
4	技術	看懂、debug、整合	可以輔助

前兩項是「不可被 AI 取代的」，後兩項是「可以被 AI 輔助的」。

反直覺的結論：AI 時代，「軟技能」比「硬技能」更重要。

對團隊的實際影響

講了這麼多理論，實際上會發生什麼事？

短期（導入後 1 年內）

人數不會明顯減少。

原因我前面說過：組織有慣性，而且 AI 的產出需要人來驗證。

但會有兩個明顯的變化：

第一，QA 報告的品質會提升。

因為 AI 可以跑更多測試、覆蓋更多場景。原本只能測 happy path 的，現在可以測到 edge case。原本只能做一輪的，現在可以做三輪。

如果 QA 有意識地使用 AI，報告會更精確、覆蓋範圍更大。

第二，QA 之間的能力差距會被放大。

會用 AI 的 QA，產出是原來的 3-5 倍，品質還更好。不會用 AI 的 QA，產出跟以前一樣，相比之下就顯得很差。

這個差距會越來越明顯。

中期（1-3 年）

團隊結構會開始調整。

「執行型」QA 的需求會下降。因為 AI 可以做執行，不需要那麼多人手工跑測試。

「設計型」「驗收型」QA 的價值會上升。因為這些是 AI 做不了的，而且需求沒有減少。

具體來說：

原本一個 5 人的 QA 團隊，可能是這樣的配置： – 4 個人做執行、撰寫 – 1 個人做設計、驗收

導入 AI 之後，可能變成： – 2 個人操作 AI + 驗證結果 – 1 個人做設計、驗收

人數從 5 變成 3，但產出可能更高。

長期

最終的狀態不是「AI 取代 QA」，而是「會用 AI 的 QA 取代不會用 AI 的 QA」。

這跟其他職業的變化是一樣的。

不是 Excel 取代了會計，是會用 Excel 的人取代了只會用算盤的人。不是 CAD 取代了製圖員，是會用 CAD 的人取代了只會手繪的人。

QA 也一樣。AI 是工具，會用工具的人取代不會用工具的人。

給 QA 的建議

如果你是 QA，看完這篇文章，可以做什麼？

第一，不要急著學 Prompt Engineering。

我知道這聽起來很奇怪。但根據前面的分析，Prompt 能力排第三，不是第一。

你應該先問自己：我對這個產品的業務邏輯夠熟嗎？我知道客戶最在意什麼嗎？我知道哪裡最容易出問題嗎？

如果答案是「不太確定」，那你應該先花時間搞懂業務，而不是學 Prompt。

第二，培養質疑的習慣。

從現在開始，對任何測試結果都多問一句：「這真的對嗎？」

不只是 AI 的產出。你自己寫的測試、工程師說的「這不會有問題」、PM 說的「這個 case 不重要」——都值得質疑。

這個習慣會讓你在 AI 時代變得更有價值。

第三，學習跟 AI 協作，而不是跟 AI 競爭。

AI 執行測試比你快，這是事實。跟它比速度沒有意義。

你應該思考的是：我怎麼利用 AI 的速度，加上我的判斷力，產出比以前更好的結果？

這是協作，不是競爭。

第四，累積你的業務知識，這是 AI 拿不走的。

你對這個產品的理解、對這個領域的經驗、對客戶行為的洞察——這些存在你腦袋裡，不在任何地方。

AI 可以學習公開的知識，但學不了你獨有的經驗。

這是你的護城河。持續累積。

給 Tech Lead 的建議

如果你是 Tech Lead 或管理者，考慮導入 AI 測試，要注意什麼？

第一，導入 AI 測試不等於可以裁 QA。

至少短期內不行。

AI 的產出需要驗證，驗證需要有經驗的人。如果你把 QA 都裁了，誰來驗證 AI？

而且 AI 測試工具也需要人來操作、調整、維護。這些工作還是需要人。

第二，短期效益是「提升品質」，不是「減少成本」。

導入 AI 測試之後，你應該期待的是： – 測試覆蓋率提升 – 報告更精確 – 發現更多之前沒發現的問題

而不是： – 可以少請兩個 QA

成本節省是中長期的事。短期內，你可能還要額外投資工具、培訓、調整流程。

第三，重新定義 QA 的職責。

既然工作內容改變了，職責定義也要跟著改。

以前的 QA 職責可能是：「執行測試案例，回報結果」

新的職責應該是：「確保測試策略正確，驗證 AI 產出的測試結果，對產品品質做最終把關」

把這個寫進 Job Description。讓團隊知道期望改變了。

第四，投資 QA 的業務理解能力。

讓 QA 參與需求討論、讓他們跟客戶接觸、讓他們理解商業目標。

這些以前可能被認為「不是 QA 該管的」。但在 AI 時代，這變成 QA 最重要的能力。

值得投資。

結論

回到標題：AI 不會取代 QA。

但這句話只對一半。

完整的說法是：

AI 不會取代「會判斷」的 QA，但會淘汰「只會執行」的 QA。

AI 擅長執行：跑測試、寫腳本、產報告。這些工作的需求會大幅下降。

AI 不擅長判斷：測什麼、結果對不對、能不能上線。這些工作的價值會大幅上升。

如果你是 QA，現在就開始轉型。從執行者變成判斷者。強化業務理解、培養批判思考。

如果你是管理者，重新定義團隊的職責。短期靠 AI 提升品質，中長期再談人力調整。

不管你是誰，記住這件事：

不是 AI 取代你，是會用 AI 的人取代你。

這句話適用於 QA，也適用於幾乎所有知識工作者。

如果你對 AI 測試的實際導入有興趣，可以參考這篇更技術性的文章：

👉 下一代 QA：在大型 Java 既有專案中實現 AI 驅動的自主多輪驗收測試