הצטרפו לקבוצות שלנו לקבלת עדכונים מרוכזים פעם בשבוע:

ווטסאפ:
http://wa.dwh.co.il
טלגרם:
http://telegram.dwh.co.il

עידוד מכירות, דוגמא מספרית להתנסות

More
17 years 10 months ago #1413 by Edith Ohri
שלום לכולם,

עקב התענינות חוזרת בתכנה ללימוד, החלטתי לאפשר להביא לכאן דוגמא מספרית, ולעבד אותה בצורה פתוחה להשוואה של תוצאות.

למעונינים, זו ההזדמנות להעלות סט של נתונים לבדיקה והתנסות!
התוצאות יוצגו עם אפשרות הורדה. כדי לאפשר בדיקה והשוואה.

שאלות אפשר להפנות כאן או אלי ישירות,
אדית edit@actcom.co.il


בברכה
אדית

Please התחברות to join the conversation.

More
17 years 10 months ago #1616 by Edith Ohri
שלום לכולם

אני מכינה דוגמא שתוצג כאן בימים הקרובים.
המטרה היא חיזוי לקוחות כתוצאה ממבצע פרסום, ולימוד לקחים.

הפעם אתמקד בבעיה של ריבוי מישתנים וסיבוך. תראו שלמרות קוטן המדגם, לא פשוט לנתח אותו.  האתגר המעשי הוא, לנצל את הנתונים שמגיעים מהשטח, כמו שהם ובלי לחכות להצטברות. כאשר הרעיון הוא, ללמוד ולשפר את ניהול המבצע אם אפשר, תוך כדי עבודה.

המתכונת המוצעת היא להציג כאן:
1. סט של נתוני מבצע מכירות, ועוד סט של נתוני מבחן.
2. תיאור השדות, תיאור המקרה.
3. הקריטריון להצלחת חיזוי.
4. במשך שבוע אקבל תוצאות שיישלחו אלי.
5. אחרי שבוע, אפרסם את התוצאות השונות. בעילום שם או בציון שם בעל הפתרון כבחירתו.
6. סיכום.


אשמח לקבל הצעותוהערות לגבי המתכונת.

אדית
edit@actcom.co.il


בברכה
אדית

Please התחברות to join the conversation.

More
17 years 10 months ago #1618 by Edith Ohri
שלום לכם,

קובץ ZIP של הדוגמא מצורף למטה.

הקובץ מכיל:
34 רשומות מידע מחנויות שהשתתפו במבצע קידום מכירות.
הגדרת שדות.
קובץ מבחן, שחסר בו השדה Customers. צריך להשלים שדה זה, לפי המידע של 34 רשומות מידע חנויות.

מטרת המקרה לדוגמא היא ללמוד דברים חדשים מהנתונים, לגבי סיבות וסימני הצלחה של מבצעים.
הצלחה נמדדת ע"י מספר קונים.
כמו כן, כהצלחה נחשב גם השפעה נמשכת של המבצע, גידול רב בקונים עקב פעולת קידום-מכירות, ועוד סוגי תועלת שאולי אפשר ללמוד עליהם מתוך הנתונים.


תיאור המקרה
הנתונים מכילים דיווחי חנויות על הענין של לקוחות במוצר שנמצא בקידום מכירות.
החנויות מפוזרות בכל הארץ ואפשר להניח שאין ביניהן תלות.
החנויות דומות בגודל ובסוג שלהן.
זהו מבצע הפרסום הראשון למוצר.
המבצע מורכב מ-3 אירועי קידום מכירות, בהפרש זמן של כשבוע ביניהם. חנויות הורשו להתחיל את המבצע בעיתוי גמיש (בטווח של שבועיים).
כללית, מניחים שהצלחת המבצע היא ביחס ישר למספר אירועי קידום המכירות שלו, ושמידת ההצלחה יורדת עם הזמן אחרי תום המבצע.
המקרה מדגיש את הסיבוכיות של נתוני שטח, והחיוניות של כריית נתונים לצורך ניתוחם.


אשמח לקבל תגובותיכם לגבי הדוגמא והתוצאות, באתר או ישירות,
בהצלחה לכולם!


אדית

edit@actcom.co.il


בברכה
אדית

Please התחברות to join the conversation.

More
17 years 9 months ago #1666 by Edith Ohri
שלום לכולם,
אני עומדת לסכם את התשובות.
אם למישהו יש עוד מסר בקנה בשבילי, העבירו כמו שזה. 

עדכון בינתיים, השיטות שבהם השתמשו עד כה הן:
1. רגרסיה לינארית
2. רגרסיה לא לינארית
3. קלסטרינג
4. כריית נתונים עם GT


אדית

users.actcom.co.il/~edit#GT




בברכה
אדית

Please התחברות to join the conversation.

More
17 years 9 months ago #1668 by Edith Ohri
[size=12pt]להלן התוצאות שהושגו ב-5 שיטות שונות, לחיזוי מס' קונים:[/size]

(תוצאות האמת נימצאות בגליון ה- Test בקובץ ה-ZIP המצורף למטה)

אתאר כאן בקיצור מה השיטות עושות ולאיזה דיוק הן מגיעות.


1. סגמנטציה
מחלקים את הרשומות לשלושה חלקים (סגמנטים):

רשומות שיש בהן 56 לקוחות ומעלה: תאריכים אחרי 3 שבועות ומעלה מתחילת המבצע, ולפחות 2 פעולות קידום מכירות; הגורם הקובע הוא מס' הימים שעברו מפעולת קידום המכירות האחרונה.

רשומות שיש בהן עד 48 לקוחות: מדווחות באופן טיפוסי בחודש יולי, אחרי לא יותר מ-10 ימים מתחילת קידום המכירות, 1 או 2 פעולת קידום מכירות. שני גורמים משפיעים -  תאריך, ומס' ימים מקידום המכירות האחרון.

רשומות שיש בהן בין 49 ל-55 לקוחות: מכילות את כל הרשומות שלא הוגדרו לעיל. זהו סגמנט אחיד, ללא גורמים משפיעים, ומספר הלקוחות בו הוא ערך קבוע - 53.

חיזוי מספר הקונים לפי סגמנטציה נותן דיוק של +- 18% (מתוצאות האמת).


2. ניצול הדמיון שבין רשומות המבחן לרשומות הלימוד
זו שיטה פשוטה. מוצאים בקובץ הלימוד רשומות בעלות נתוני פתיחה דומים לאלה שרוצים לחזות, ומחשבים את מס' הלקוחות הממוצע שלהן. אינטואיטיבית, נראה כאילו שיטה זו נותנת את החיזוי המדויק ביותר. תיכף נראה האם זה כך.
חיזוי מספר הקונים בשיטה הדמיון מגיע לדיוק של 17%.


3. רגרסיה מרובת המישתנים
חיזוי מספר הקונים עם רגרסיה של 4 מישתנים לא משפרת את הדיוק שהושג בשיטה ה'פרימיטיבית' - 17%.


4. רגרסיה עם מישתנה לא לינארי
מישהו הביא השערה, לפיה הגורם המשפיע העקרי הוא 'הזמן מתחילת המבצע' והגורם מתנהג בצורה לא לינארית, כתלות ממעלה שנייה, כלומר עקומה שיש לה שיא ואחריו ירידה. מתקבל מאד על הדעת שזו תהיה השפעתו של מבצע מכירות. להלן התוצאה.
חיזוי בעזרת רגרסיה לא-לינארית נותן דיוק של 16%.

הסבר: חיזוי עם מישתנה יחיד מצליח יותר מחיזוי עם 4 מישתנים, משום שבין ארבעת המישתנים קים קשר סמוי שמפריע (התאריך קשור לשלב המבצע, ועוד).


5. GT data mining (זה הפתרון שאני הבאתי)
GT מוצא שישנם שני דפוסי התנהגות: דפוס אחד נמוך תוצאות, שאופיני למבצע קידום מכירות ראשון, עד 3 ימים מההתחלה או שבועיים אחרי ההתחלה. דפוס שני בעל תוצאות גבוהות, מכיל את כל יתר הרשומות. הגורם המשפיע בשני הדפוסים הוא 'הזמן מקידום המכירות האחרון', וההשפעה שלו היא לא-לינארית, ממעלה שנייה.

חיזוי מספר הקונים לפי GT נותן דיוק של 15%.

ה'טריק' שמאחורי התוצאה המשופרת הוא בהגדרת קבוצות אחידות יחסית, שיש להן סיבות להתנהג בצורה טיפוסית.


בהמשך אציג כל אחת מהשיטות בנפרד.

אדית

edit@actcom.co.il


בברכה
אדית

Please התחברות to join the conversation.

More
17 years 9 months ago #1705 by MatatovNissim
שלום , עדית !!!

אומנם יש הבדל בין תוצאות . לא נראה לי שבמקרה מציאותי מישהו יעדיף את 1%דיוק יותר גבוה של GT על דרך המובנת של רגרסיה או ניתוח אשכולות. זה לאור שלפעמים לקוחות רוצים לדעת איך הגיעו לתוצאות.

חוץ מזה אני מניח ש GT בדרך ישירה או עקיפה עושה בחינה של כמה אלגוריתמים או משתמשת בחיפוש במרחב פרמטרים של אלגוריתם מסוים . לכן GT מגיעה לתוצאות יותר . לא נראה לי שמישהו בחן בחירה בין כמה מודלים או שילוב של כמה מודלים שבהחלט יכול להיות גרעין של מערכת GT.

Please התחברות to join the conversation.

More
17 years 9 months ago #1707 by Edith Ohri
ניסים, שלום
וברוך הבא לפורום


אתה צודק שבמציאות 1% הבדל הוא לא משמעותי.
אבל זו דוגמא קטנה פשוטה מאד, לכן ההבדלים קטנים. במציאות מדובר על היקף נתונים גדול, ושם ההבדלים באיכות החיזוי גדולים.
בדוגמא הזאת, סט המבחן מכיל חנויות שיש להן נתוני פתיחה זהים ותוצאות שונות! הדיוק הגבוה ביותר בחיזוי שאפשר להגיע בה הוא 11%. המאמץ הוא לרדת מ-18% ולהתקרב כמה שיותר ל-11%. כל אחוז נחשב, והאחוזים האחרונים הם הכי קשים.


בעוד מספר ימים אגיע להסבר של GT , ומקווה לענות שם ביתר פירוט. עד כה התעסקתי רק עם השיטות המסורתיות - סגמנטציה, רגרסיה וכו'.
סיבת היתרון של GT היא, על קצה המזלג, שהוא מבצע סגמנטציה במרחב הרב מימדי, במקום לפי שדה מטרה בלבד (ראה בסוף של ' סגמנטציה ' ).

דרך אגב, גם מיקרוסופט חושבים שכדאי לבדוק מספר מודלים ולבחור את היעיל מביניהם. זה רעיון שימושי. אבל תסכים איתי, שאם יש פתרון עדיף, כדאי ללכת ישר אליו (כמובן, שההוכחה היא עלי בקשר לעדיפות וכל היתר).

אדית


בברכה
אדית

Please התחברות to join the conversation.

Moderators: Edith Ohri
Time to create page: 0.269 seconds