91APP CDMP

選 CDP AI Agent 前，先問這 4 個問題：不然你買的只是一個會聊天的介面

本文聚焦 CDP AI Agent 導入前最常被忽略的問題：demo 很順，不代表真實環境能用。文章以零售品牌實測經驗為例，整理四個關鍵測試，包括數字查詢是否快速且準確、任務是否真的執行、建議是否根據品牌第一方數據，以及多輪追問下系統是否穩定。核心觀點很清楚：品牌要投資的不是會聊天的 AI，而是能真正支撐 CRM、會員經營與營收成長的可落地系統。

Brick Liao

18 Mar 2026 • 13 min read

Photo by Microsoft Copilot / Unsplash

有一次，我跟一位零售品牌的行銷主管坐在會議室裡，看她現場測一套剛 demo 完、大家都覺得很厲害的 CDP AI Agent。「簡報」裡每一頁都很順，回答自然、畫面漂亮、流程也像是真的能把行銷工作整個接手。

她一開始其實很期待，還笑著說，如果這套真的能用，團隊今年會輕鬆很多。結果不到半小時，現場氣氛就變了。問會員數，等了很久；叫它建一個簡單流程，系統說完成了，後台卻什麼都沒有；再追問兩輪，直接 timeout。她最後看著螢幕，只說了一句：「這不是不能聊天，這是不能上班。」

那一刻我其實很有感。現在市場上太多 AI 工具，都很會展示「看起來很像會做事」，但品牌真正需要的，從來不是一個會說話的介面，而是一個能對數字負責、能把任務做完、能在真實商業環境裡穩定運作的系統。也因此，選 CDP AI Agent，最危險的不是功能不夠多，而是你太早相信 demo。

「廠商 demo 的時候非常順，我們當場就決定導入。結果真正上線後，問個會員人數要等 8 分鐘，答案還是錯的。」這句話來自一個零售品牌的行銷操作人員，在完整測試 CDP AI Agent功能之後留下的評語。她的團隊花了半個下午，帶著 7 個真實業務情境測試：7 題全敗。

CDP AI Agent 是指整合在客戶數據平台上、能理解自然語言指令並自動執行行銷任務的 AI 系統，核心價值在於讓品牌用對話方式操作數據與自動化流程，而不需要逐一手動設定。但這個定義說的是「應該做到的事」，不是「多數工具現在真的做到的事」。選工具之前，有 4 個問題你必須親自測試，而不是看 demo。

為什麼選 CDP AI Agent 之前要先測，不要先相信 demo

廠商 demo 的環境通常是精心準備過的：資料是乾淨的、問題是預設好的、網路是穩定的，操作流程剛好都走到成功路徑。放到真實品牌環境，情況完全不同——數據有歷史包袱、指標定義各品牌不一、行銷人員追問的方式也不會照著 demo 腳本走。更關鍵的問題是，許多 CDP AI Agent 的底層架構，在設計之初就沒有針對「品牌真實數據環境」做過壓力測試。

它們建立在 RAG（Retrieval-Augmented Generation）架構上，把結構化的業務數字轉成文字 chunk 儲存，靠語意搜尋來回答數字問題。這個設計在文件問答場景合理，但放到「我的有效會員有多少人」這種需要精確計算的問題，就會出現幻覺式錯誤。

系統不是算錯，而是根本沒有在算。真正的測試，是你自己帶著日常業務問題坐下來問。以下 4 個問題，是讓你在 30 分鐘內判斷一套 CDP AI Agent 落地能力的最短路徑。

問題1：查一個基本指標，要花多久、答案準不準？

這是最基本的測試，也是最容易暴露問題的一題。

拿一個你自己知道答案的數字去問：「我的會員有多少人？有效聯絡人有多少？」如果你已知答案大約是 39 萬，AI 給你 9 萬，問題就很明顯。更值得注意的不只是準不準，還有要等多久。基本指標查詢，正常應該在幾秒內回應。如果要等超過一分鐘，代表系統缺乏預聚合資料層，每次查詢都在即時全表掃描——這在日常行銷操作中根本不可行。

從一個實際測試案例來看：查詢會員人數等了 8 分鐘，輸出數字邏輯上說不通，且系統完全沒有偵測到自己的答案有問題，直接輸出給用戶。對熟悉品牌數據的人來說，這代表每一個 AI 輸出都要重新驗證，等於多了一道工序。對不熟悉數字的新進人員來說，問題更嚴重：直接採用，等於讓錯誤的數字進入行銷決策。數字不準還能靠人工檢查，但如果你要靠人工檢查每一個 AI 輸出，這個工具就失去了存在的理由。

問題2：AI Agent 說「已完成」，後台真的有建立嗎？

這一題測的是執行可信度，也是最多品牌測試後最傻眼的發現。請 AI 幫你建立一個簡單的行銷自動化流程，比如「針對三個月未購的會員，發送一封喚回 Email」。確認後，去後台檢查這個流程是否真的存在。

在前述測試案例中，操作人員請 AI 建立行銷流程，系統回覆「已幫您建立完畢，省去從零開始拉節點的麻煩」。後台什麼都沒有出現。連試三次，三次都是同樣結果。

這個問題在工程上稱為 Action Hallucination：AI 在 API 尚未確認成功之前，就向用戶宣告任務完成。一個設計嚴謹的 CDP AI Agent，在回答「完成」之前，必須確認 API 回傳的 object_id、節點數量、流程狀態，任何一個環節失敗，都應該告知用戶並提供替代方案，而不是繼續說「搞定了」。

值得留意的是，如果廠商的「AI 建立 Campaign 流程」功能，實際能力只是告訴你節點應該怎麼排，手動建立腳本的部分還是要你自己操作，那這個功能的 AI 含量非常低。複製現有模板通常只需要 10秒，比等 AI 失敗三次更快更穩。

問題3：AI Agent 的建議，是根據你的品牌數據，還是通用模板？

這是最容易被忽略、但影響最深遠的問題。請 AI 給你一份預算配置建議，例如「我下半月有 50 萬行銷預算，應該怎麼分配給不同會員族群？」然後追問：「你這份建議的數字怎麼來的？你知道我的高價值會員有多少人嗎？你算過 10萬預算放 Email，花得完嗎？」在實際測試中，AI 給出了一份看似完整的預算配置，全押 Email 渠道，配上各族群的預算比例。被追問依據後，系統自己承認：「坦白說，先前的建議並沒有針對您的實際受眾人數進行精準試算。」

這句話的意思是：AI 用的是通用語料模板，不是你的品牌數據。真正整合品牌數據的 CDP AI Agent，在給出受眾建議之前，會知道這個族群在你的系統裡有多少人、對應的渠道成本是多少、歷史 ROAS 是多少。如果這些數字它都不知道，那它給你的「建議」，跟找一個沒看過你後台的顧問問問題，得到的答案差不多。聽起來有道理，但對你的品牌沒有根據。受眾建議給出 210 到 3,223 人，這個量體遠低於一個正常品牌一天的溝通規模，就是這個問題的直接體現。

問題4：追問之後，AI Agent 會崩潰還是繼續對話?

行銷決策很少是一次問完的。你會追問、會質疑、會要求深入解釋。這一題測的是 AI 的對話穩定性，也是最能區分架構深淺的一題。

追問前一個答案的數字來源，看它是否能回溯同一份數據繼續解釋；質疑它給的建議有沒有根據，看它是承認不確定、還是繼續圓謊；追問到第三輪，看系統是否還在線上、還是直接 timeout。在實際測試中，第一輪追問「你的預算建議怎麼來的？」得到了自我推翻的回答；第二輪深入追問數字來源，系統在等待 10 分鐘後直接 timeout，連錯誤訊息都沒有，對話就這樣結束了。

這個問題的根源在 Context 管理。每一輪追問，系統都在累積對話歷史。沒有做 context compression 或 sliding window 的系統，追問幾輪就會超過 context limit，然後崩潰。更糟的是，有些系統每一輪對話都獨立處理，前後輪之間沒有共享的計算假設——所以你一質疑，它就翻供，因為它根本沒有記住上一輪自己說了什麼。

這 4 個問題，Salesforce 和 HubSpot 也沒答好

你可能會想，這是不是只有小廠商才有的問題。答案是：不是。

類似測試不如預期的消息已是舊聞，Salesforce 其機會預測準確率約為 52%，已有 Cotera VP of Sales 公開表示停止採信，「跟丟銅板沒有差別」。Email 發送時間優化功能，實測開信率提升約 3%，遠低於官方宣傳效果。Salesforce AI 分析 Einstein Analytics Connector 的 timeout 上限為 300 秒，這比我們前述案例等待的 10 分鐘還短，代表連廠商自己都知道這個問題存在。

HubSpot 的情況同樣沒有更好。Reddit 社群 r/hubspot 有一篇廣泛流傳的貼文，描述 AI 無法正確處理基本的職稱對應部門邏輯，把大量聯絡人錯誤歸類為高階主管；另一篇「Does Anyone Actually Like HubSpot AI?」獲得 38 個認同，留言集中在工作流程品質令人失望。

這個模式在產業中反覆出現：許多行銷 AI 工具的開發邏輯，是先做好聊天介面，再嘗試接上數據。語言流暢不等於數字準確，介面好看不等於執行可靠。品牌導入之後，才發現 demo 和日常操作之間有一道很深的落差。

真正能落地的 CDP AI Agent，差異不在模型，在四件事：

指標有嚴格定義（Semantic Layer）
推理有結構化中間計畫（Typed Plan）
執行有雙向確認（Verified Execution）
建議有品牌數據作為約束（Constraint Solver）

四層任何一層缺失，都會在真實使用情境下以不同方式崩潰。

說到底，品牌要買的從來不是一場漂亮的展示，也不是一個很會回答問題的聊天視窗。品牌真正要買的，是一套能進入日常營運、能承接真實數據、能把判斷轉成行動，最後還能對營收結果負責的系統。

所以，選 CDP AI Agent 最重要的動作，不是先聽它多會講，而是先看它能不能在你的環境裡，把最基本的事做對、做快、做完整。因為真正決定一套工具值不值得投資的，從來不是 demo 當下的掌聲，而是上線三個月後，你的團隊還願不願意每天打開它。

FAQ：選 CDP AI Agent 時最常踩的坑

Q1：廠商說他們的 AI 準確率很高，怎麼驗證？

要求廠商用你自己的數據做現場測試，不是用他們準備好的 demo 資料。拿你已知答案的指標去問，比較 AI 輸出和你後台的實際數字。如果廠商拒絕現場測試，這本身就是一個答案。

Q2：AI 行銷工具回答慢，是網路問題還是系統問題？

基本指標查詢若需要超過一分鐘，通常是架構問題，不是網路問題。正常設計的系統會有預聚合快取，基本問題幾秒內就能回應。你可以換網路環境測試，如果速度沒有明顯差異，問題在系統本身。

Q3：AI 建立的流程說完成了但沒出現，是 bug 還是正常現象？

這不是 bug，是系統設計缺少執行驗證機制。設計正確的系統在告知「完成」之前，會確認 API 回傳狀態。如果廠商說這是偶發 bug，請要求重現穩定率的數據，以及他們的 fallback 機制是什麼。

Q4：如何判斷 AI 建議用的是品牌數據還是通用模板？

追問建議的數字根據。「高價值會員你認定有多少人？」「這個受眾在我系統裡的觸達成本是多少？」如果 AI 無法回答這些問題，或者承認沒有參考你的實際數據，那它給你的是通用模板，不是品牌決策依據。

Q5：CDP AI Agent 和傳統 CDP 相比，哪個更值得投資？

這不是非此即彼的選擇，而是基礎要先打好。沒有乾淨的第一方數據、沒有清楚的指標定義，AI Agent 再智慧也沒有可靠的基礎可以操作。先確認你的 CDP 資料品質，再評估 AI Agent 的落地條件，才是正確的投資順序。

延伸閱讀：如何挑選 CDP AI Agent：從 CRM 到 OMO，品牌該買的是會創造營收的系統

想了解更多？留下您的資訊

感謝您的諮詢