你的 AI agent 為什麼老是出錯?問題根源在數據
Gartner 預測到 2026 年,企業將放棄六成缺乏 AI-ready 數據的 AI 專案。當品牌把 AI agent 放上客服、推薦、行銷第一線,決定它有沒有用的不只是模型,更是它讀到的顧客數據夠不夠完整、即時、整合。本文拆解 AI agent 最常踩的三個數據斷點:身分沒統一、數據過時、跨系統散落,用三個翻車場景說明 agent 如何把錯誤放大,並提供「上線前顧客數據體檢 5 問」。先把顧客數據整理成一份能被即時調用的底座,再談要接哪一個 agent。
大家都在比 AI agent 多聰明,真正決定它有沒有用的,是它讀到的那份顧客數據。
一份 60% 會被放棄的名單
Gartner 在 2025 年 2 月給出一個讓人安靜下來的預測:到 2026 年,企業將放棄 60% 缺乏「AI-ready 數據」支撐的 AI 專案。所謂 AI-ready,指的是整理到能被 AI 直接拿來用的數據。同一份研究還附了一個更現實的數字,2024 年第三季 Gartner 訪問 248 位數據管理主管,63% 表示自己沒有、或不確定有沒有適合 AI 的數據管理做法。
Gartner 在 2026 年 4 月發布的另一份調查(訪問 782 位基礎架構與營運(I&O)主管,調查於 2025 年 11 至 12 月進行),把失敗的原因問得更直接:38% 的人把「數據品質差或數據不夠」列為 AI 專案失敗的直接主因,而真正達標、拿到預期回報的 AI 應用只有 28%。
這些數字放在一起,指向同一件事。過去兩年所有人都在問「哪個模型比較強」,但讓 AI 專案倒下的,往往不是模型。模型強弱、任務怎麼設計、權限怎麼治理都會影響成敗,只是對多數品牌來說,第一個、也最常被忽略的上限,是餵給它的那份數據。當品牌開始把 AI agent 放到客服、推薦、行銷的第一線,這個問題會更刺眼。一個 agent 再會推理,它能做的判斷,上限就是它讀到的「AI agent 數據」有多完整、多即時、多乾淨。
我在導入現場看到的三個陌生人
我看品牌導入 AI agent 的現場,最常見的卡點不是模型不夠強,是它被餵了一份連人都看不懂的顧客數據。
有一個畫面我印象很深。同一位老顧客,在官網的會員系統裡是編號 A123,在門市的會員卡是尾號 4567,在 LINE 官方帳號又綁成另一組 ID。三份資料躺在三個系統,沒有一條線把它們接起來。於是 AI agent 打開資料,看到的不是一位往來三年的熟客,是三個彼此不認識的陌生人。它對其中一個自我介紹、給另一個發新會員禮、對第三個推薦他上週剛買過的東西。模型每一步都「算對了」,因為它讀到的本來就是錯的。
那一刻我有點不忍。品牌花錢買了最新的 agent,卻像請了一位能力很強的新員工,第一天就被交了一疊名字對不起來的客戶檔案。
AI agent 為什麼一吃到爛數據就出包?
把這件事拆開,AI agent 讀顧客數據時最常踩的坑有三個。為了方便後面討論,本文把它們稱為「AI agent 的三個數據斷點」。
| 數據斷點 | 典型症狀 | 對 agent 的後果 |
|---|---|---|
| 身分沒統一 | 同一個人在官網、門市、LINE 是不同 ID | 把熟客當新客,重複溝通、推錯內容 |
| 數據過時 | 庫存、訂單、會員狀態不是即時更新 | 推已售完商品、回答過期資訊、催繳已付款項 |
| 跨系統散落 | 訂單在 A 系統、會員在 B、行為在 C | 只看得到半張臉,判斷建立在殘缺資料上 |
第一個斷點是身分沒統一。零售品牌的顧客資料天生長在很多地方,會員資料一套、訂單一套、線上行為一套、門市 POS 又一套。少了一層把同一個人接起來的歸戶,agent 眼中的顧客就是一堆對不起來的碎片。
第二個斷點是數據過時。AI agent 之所以好用,是因為它能即時回應,但這也代表它對數據新鮮度特別敏感。庫存如果是昨晚的快照,它就會自信地推薦今天上午已經完售的商品;會員等級如果一週才同步一次,它就會對昨天剛升等的客人用舊身分說話。
第三個斷點是跨系統散落。很多品牌不是沒有數據,是數據被切在太多系統裡,彼此不通。會員制度、商品行為、到店消費、跨店紀錄各自為政,agent 一次只接得到其中一塊,等於蒙著一隻眼睛在判斷。
這三個斷點有一個共同點:它們都不是換一個更聰明的模型能解決的。換了 agent,碎片還是碎片,過時還是過時。任務怎麼設計、權限怎麼控管,當然也會左右 agent 的表現,但這三個數據斷點,是最先擋在前面、卻最少被檢查的一關。
AI agent 翻車現場:三個數據沒顧好的場景
把斷點換成具體場景,會更有感覺。以下三個都是零售與餐飲品牌很常見的情況。
場景一,客服 agent 答錯。顧客問「我上週的訂單到哪了」,agent 接到的訂單系統還停在三天前的狀態,於是回了一個早就更新過的物流資訊。顧客追問,它又從另一個沒打通的退換貨系統撈不到對應紀錄,只能繞圈。問題不在 agent 不會講話,在它讀到的訂單數據既過時又散落。
場景二,推薦 agent 推錯東西。一位顧客上週才在門市買了一台咖啡機,這週上官網,推薦 agent 熱情地把同一台咖啡機放到他面前。原因很單純,門市的消費紀錄和線上的會員身分沒有歸戶,agent 不知道「官網的這個人」就是「門市買過的那個人」。它推的不是錯的商品,是推給了一個它以為從沒買過的陌生人。
場景三,行銷 agent 發錯分群,這個場景最值得拆開講。想像一個經營二十多個品牌的多通路餐飲集團。有位客人八月在集團的牛排品牌慶生、十一月在鐵板燒過紀念日、二月在日料家庭聚餐、五月又在燒肉店朋友聚會。如果行銷 agent 只讀「牛排品牌」這一個品牌的數據,它會看到「這個人五月之後就沒回牛排店了」,於是把他標成流失客,發一張喚回優惠券。
但這個人其實是集團裡消費頻次很高的主力客,他只是這幾個月去了集團的其他品牌。單看一個品牌的數據,會把跨品牌活躍客誤判成流失;只有把集團跨品牌的消費軌跡整合起來,agent 才看得到他真實的樣子。當數據只剩單一來源,再強的 agent 也只能照著殘缺的視角,對一位忠誠老客發出「我們好想念你」的訊息。尷尬的,永遠是那位收到訊息的客人,和按下發送的行銷主管。
對照組長什麼樣?同一個 agent,如果讀到的是一份歸戶完成、即時更新、跨系統打通的顧客數據,三個場景會完全翻轉。客服 agent 看得到最新訂單與退換貨;推薦 agent 知道這台咖啡機剛被買走,改推耗材或保養;行銷 agent 看到的是一位橫跨多品牌的高頻主力客,溝通的方向自然從「喚回」變成「維繫」。Agent 沒有換,換的只是它讀到的數據。Gartner 那份調查裡,38% 的主管把數據品質列為 AI 失敗主因,講的就是這件事。
為什麼問題出在數據,不在模型?
要理解這件事,得先接受一個樸素的前提:AI agent 不會無中生有,它只會放大它讀到的東西。數據乾淨完整,它放大的是洞察;數據殘缺過時,它放大的是錯誤,而且放大得又快又有自信。這就是資訊工程裡那句老話的 agent 版本,餵進去的是垃圾,產出來的也會是垃圾,差別只在 agent 會用很流暢的語氣把垃圾講得像真的。
這裡要澄清一個常見的誤會,和 MCP 有關。
MCP(Model Context Protocol,讓 AI 去接資料來源的一套開放標準,2024 年 11 月由 Anthropic 提出,2025 年底捐給 Linux 基金會旗下的 Agentic AI Foundation)這一年多被講得很熱。它解決的是「AI 怎麼安全地接到各種數據源」這個接線問題,常被比喻成 AI 世界的 USB 接口。MCP 確實重要,它讓不同資料源的接法更標準化,大幅降低每接一套系統都要重寫一次介接的成本。但它降低的是接線成本,不等於免整合、免治理、免權限設計。
但要小心一個盲點:MCP 是管線,不是淨水器。它負責把 agent 接到你的數據源,卻不負責檢查那頭流過來的水乾不乾淨。如果源頭的顧客數據本來就身分沒統一、跨系統散落,MCP 只會讓 agent 更快、更直接地讀到那份有問題的數據。管線接得再漂亮,接的是黃金還是垃圾,差在源頭。這也是為什麼「agent cdp」「ai cdp」這類字眼開始被放在一起討論,agent 要能用,得先有一個整理好的顧客數據源在那裡等它。
那麼,一份「能被 agent 用的顧客數據」到底長什麼樣?它其實是好幾塊拼圖拼起來的:身分(來自會員系統),互動史(來自 CRM),到店與線上消費(來自 POS 與電商訂單),跨店跨業消費(來自更廣的消費數據),站外興趣(來自 DMP 的興趣標籤)。任何一塊單獨拿給 agent,它看到的都只是側臉。五塊拼起來,它才看得到一個完整、立體、會跨品牌跨通路移動的人。問題是,這五塊在大多數品牌裡,是散在五個不同系統、由五組人維護、用五種格式記錄的。
要補一句,不是每一種 agent 都需要這麼完整的五塊。如果只是回答固定問題的知識型客服 agent,知識庫的品質可能比顧客數據更先決;會員規模還小的品牌,也可以先從單一高價值場景做起,不必一開始就追求全套整合。但只要 agent 要對「人」做判斷,這五塊拼圖就遲早得拼起來。
要餵 agent 好數據,先有一份能被調用的顧客數據底座
講到這裡,結論其實已經浮出來了。要讓 AI agent 真的有用,順序不是先挑 agent,是先把顧客數據整理成一份「身分統一、即時更新、可被即時調用」的底座。
這份底座在產業裡有個名字,叫顧客數據平台,也就是把 CDP、DMP、會員與訪客數據整合在一起的數據中台。91APP 的 CDMP 做的正是這件事,把品牌散在十幾個系統裡的第一方數據匯流成一份完整的會員樣貌,再補上平台內建的站外數據,讓品牌不必自己一個個去談數據授權。對一個經營多品牌的集團來說,這代表 agent 第一次能跨品牌、跨通路、跨站外,看見同一位會員的完整輪廓。
這裡要特別澄清一件事,免得「數據中台」這個詞被誤會。它的重點不是再蓋一套龐大的 IT 系統,把所有東西重做一遍。過去有些企業把中台做成了大型工程,反而愈做愈重。在 AI agent 的脈絡下,它要做的事很具體:讓散落的顧客數據被歸戶、被即時更新、被 agent 隨時讀取。換句話說,底座存在的唯一理由,是讓上面跑的 agent 餵得到好料。
而且這不必一步到位。品牌不一定要先建一套龐大的中台,可以先從最影響 agent 成效的那一段資料鏈下手,例如先做身分歸戶、把訂單與會員狀態即時同步、用 API 串起幾個關鍵系統,再逐步補齊。當一個品牌把這份底座準備好,它要換哪一家的 agent、接哪一套 MCP,都只是上層的選擇,地基已經穩了。
AI agent 上線前的顧客數據體檢 5 問
如果你正準備、或已經導入 AI agent,下面這份清單可以拿來自評。這是本文提出的「AI agent 上線前的顧客數據體檢 5 問」,五題裡只要有一題答不出來,agent 的成效就會先打折。
| 體檢項目 | 怎麼自評 | 沒過會怎樣 |
|---|---|---|
| 1. 身分歸戶 | 同一個人在官網、門市、App、LINE,是不是被認成同一個 ID? | agent 把熟客當新客,重複又錯位的溝通 |
| 2. 數據即時度 | agent 讀到的庫存、訂單、會員狀態,是即時還是隔夜快照? | 推完售商品、回過期資訊,當場失去信任 |
| 3. 跨系統打通 | 訂單、會員、行為、到店數據,有沒有匯流到同一處? | agent 只看得到半張臉,判斷建立在碎片上 |
| 4. 跨來源視角 | 你看會員,是只看自己一個品牌或通路,還是跨品牌跨業整合過? | 把跨品牌活躍客誤判成流失,發錯訊息 |
| 5. 數據治理責任 | 有沒有人為這份顧客數據的乾淨度與更新負責? | 數據慢慢腐壞,agent 的錯誤跟著放大 |
第四題特別值得展開。很多品牌的會員資料只看得到自己的通路,看不到顧客在別處的消費。這時候做 OMO 歸戶,把線上與門市的同一位會員接起來,再補上跨業的消費輪廓,是讓 agent 從「單眼」變「雙眼」最划算的一步,這也是 CDMP 這類數據中台在會員整合上的核心價值。其餘四題,品牌大多可以靠盤點現有系統先自己做一輪初步檢查,不需要等到導入任何工具。
這份清單的用法很單純:在你被某個 agent 的展示打動、準備簽約之前,先回來把這五題答一遍。地基沒打好就急著蓋樓,蓋得愈快,塌得愈快。
三個陌生人,其實是同一位老朋友
回到開頭那個畫面。那位在三個系統裡被拆成三個陌生人的老顧客,其實是品牌往來三年的老朋友。讓 AI agent 認不出他的,從來不是 agent 不夠聰明,是沒有人先幫它把那三份資料接成一個人。
強大的 agent 配上殘缺的數據,只是一台很貴的擺設;把數據底座顧好,就算只是一個普通的 agent,也能踏實地幹活。這件事的好消息是,台灣零售與餐飲品牌其實不缺數據。十年累積的會員、訂單、OMO 跨通路紀錄,本來就是餵 agent 最好的料,差的只是有沒有把它們整理成一份 agent 讀得懂的樣子。模型每隔幾個月就會更新一次,但你那份顧客數據的完整度,是少數會隨時間愈長愈值錢的資產。把它顧好,後面接上來的每一個 agent,都會替你把這份價值放大。
品牌最常問的 AI agent 數據問題
Q1:AI agent 數據指的是什麼? A1:指 AI agent 在運作時讀取與依賴的顧客數據,包含會員身分、訂單與消費紀錄、線上與門市行為、站外興趣等。它的完整度、即時度與整合度,直接決定 agent 判斷的準確程度。Agent 再強,也只能在它讀到的數據範圍內做判斷。
Q2:AI agent 數據和 CDP、CRM、DMP 有什麼關係? A2:CRM 記錄會員與品牌的互動史,CDP 把跨來源的第一方數據歸戶成單一顧客樣貌,DMP 補上站外的興趣標籤。AI agent 要用的數據,通常需要這三者整合後的成果,也就是一份統一、即時、可被即時調用的顧客數據底座。
Q3:我的品牌數據量不大,也需要做這件事嗎? A3:需要,而且更划算。數據量不大時,問題往往不在量,在「散」。先把身分歸戶、把幾個關鍵系統打通,就能讓 agent 的判斷明顯變準。整理數據和品牌規模無關,和數據有沒有被接起來有關。
Q4:把顧客數據整理到能餵 agent,大概要多久? A4:依系統複雜度而定,但通常可以分階段。先做身分歸戶與關鍵系統打通,讓 agent 有一份可用的基礎數據;再逐步補上即時更新與站外輪廓。重點是先讓 agent 讀到一份對的數據,而不是等到所有數據都完美才開始。
Q5:MCP 出現後,是不是接上 agent 就能直接用數據了? A5:MCP 解決的是 agent 怎麼安全接到數據源的接線問題,它是管線,不負責數據本身乾不乾淨。如果源頭的顧客數據身分沒統一、跨系統散落,MCP 只會讓 agent 更快讀到有問題的數據。先把數據源整理好,MCP 才有意義。
Q6:導入 AI agent 最常見的數據誤解是什麼? A6:最常見的是以為換更強的模型就能解決問題。實際上,多數 agent 出錯不是推理能力不足,是身分沒統一、數據過時、跨系統散落這三個數據斷點。先解決數據,再談模型。