בקצרה

שני אנשים ששואלים את ChatGPT שאלה דומה מקבלים תשובות שונות, ולכן בדיקה ידנית מזדמנת לא נותנת לכם תמונה אמינה על נוכחות המותג. מסגרת מדידה רצינית בנויה על קבוצות פרומפט מובנות לפי כוונת קנייה, ועל מעקב מגמה לאורך זמן, לא על תחושת בטן. הנה איך בונים אותה, ומה למדוד בכל שלב.

השאלה שאני שומעת הכי הרבה מצוותי שיווק בחודשים האחרונים היא לא "איך נופיע ב-ChatGPT", אלא משהו בסיסי יותר: "איך אני בכלל יודע אם אנחנו מופיעים שם?". זו שאלת מדידה, וכמו כל שאלת מדידה, התשובה מתחילה בלהבין למה הדרך האינטואיטיבית לא עובדת.

הדרך האינטואיטיבית היא לפתוח את ChatGPT, לשאול "מה הכלים הכי טובים ל-X", ולראות אם אתם שם. הבעיה: שני משתמשים ששואלים שאלה דומה עשויים לקבל תשובות שונות מהותית. בדיקה ידנית או הצצה מזדמנת לא יכולות לספק תובנה אמינה על הביצועים שלכם. אם אתם מסיקים מסקנה מתשובה אחת, אתם מודדים רעש, לא אות.

למה spot-check נכשל, במונחי מדידה

במדידת ביצועים, מדגם של אחד הוא לא מדגם. תשובות מנועי ה-AI משתנות בין משתמשים, בין נוסחים, ובין זמנים. כשאתם בודקים פרומפט בודד פעם בשבוע, אתם לא יכולים להפריד בין שינוי אמיתי בנוכחות המותג לבין השונות הטבעית של המערכת. זו בדיוק הטעות הנפוצה של בלבול בין רעש לסיגנל, ואני רואה אותה חוזרת בכל צוות שמתחיל למדוד AEO בלי מתודולוגיה. הפתרון אינו לבדוק יותר פעמים באקראי, אלא לבנות מבנה קבוע.

המסגרת: קבוצות פרומפט לפי כוונת קנייה

במקום פרומפטים אקראיים, צוותים שמודדים נכון בונים קבוצות פרומפט מובנות, מיושרות לכוונת קנייה אמיתית. כל קבוצה מייצגת שלב אחר במסע הלקוח, ואתם מריצים אותה באופן עקבי לאורך זמן ועל פני אזורים. ארבע הקבוצות שמכסות את רוב המקרים:

01

הערכות (Evaluations)

"מה הכלים הטובים ל-X". בודק אם אתם נכללים בסט השיקול הראשוני.

02

חלופות (Alternatives)

"חלופות ל-[מתחרה]". בודק אם אתם עולים כשמישהו כבר מכיר את הקטגוריה.

03

השוואות (Comparisons)

"X מול Y". בודק איך אתם מתוארים ביחס למתחרה ישיר.

04

תרחישי שימוש (Use Cases)

"איך פותרים X". בודק אם אתם מצוטטים בהקשר של בעיה, לא רק שם מותג.

מה למדוד בכל הרצה

פעם שיש מבנה, צריך להחליט על המדדים. שלושה מספיקים כדי להתחיל, ושלושתם ניתנים למעקב לאורך זמן. ראשית, האם הופעתם בכלל: כן או לא, לכל פרומפט בקבוצה. שנית, המיקום בתשובה: האם אתם ההמלצה הראשית, חלופה, או אזכור משני. שלישית, המגמה: האם הנוכחות מצטברת או נשחקת בין הרצה להרצה. המדד השלישי הוא היחיד שבאמת חשוב להחלטות, וגם היחיד ש-spot-check לא יכול לתת לכם. אם אתם כבר עוקבים אחרי דוח הביצועים של Search Console למנועים גנרטיביים, זה משלים את התמונה מהצד של החיפוש.

מקור אחד שכדאי להוסיף למעקב: Reddit

נתון אחד ששווה לדעת כשבונים מדידה. נתח הציטוטים של Reddit עבר 5% מכלל הציטוטים ב-ChatGPT בינואר 2026. יותר מזה, לפי הדיווחים, דומיינים עם נוכחות אזכורים גבוהה ב-Reddit נהנים מסיכוי גבוה פי ארבעה להיות מצוטטים על ידי מערכות AI, לעומת אלה עם פעילות קהילתית מינימלית. המשמעות למדידה: אם אתם רוצים להבין למה אתם מצוטטים או לא, כדאי לעקוב לא רק אחרי התשובות עצמן אלא גם אחרי הנוכחות שלכם במקורות שה-AI שואב מהם. מי שרוצה את הצד הכלי של זה, השווינו את כלי ה-Share of Voice שמבצעים חלק מהמעקב הזה אוטומטית.

מה עושים עם זה

פעולה אחת ליום הבא: הגדירו עשרה פרומפטים קבועים, מחולקים לארבע קבוצות הכוונה, והריצו אותם פעם בשבוע באותו יום ובאותו אופן. תעדו לכל פרומפט שלושה דברים בלבד: הופעתם או לא, המיקום בתשובה, והשינוי מהשבוע הקודם. אחרי ארבעה שבועות תהיה לכם מגמה אמיתית במקום תחושה. זה לא דורש כלי בתשלום כדי להתחיל, רק עקביות. הנתונים מראים שעקביות במדידה היא מה שמפריד בין צוות שיודע אם הוא משתפר לבין צוות שמנחש.

📲 כל כתבה חדשה, ישר לטלגרם

בלי אלגוריתם ובלי פיד. עדכון אחד בערוץ בכל פעם שעולה כתבה.

להצטרפות לערוץ