דע
מאין
דאטה

ככה הצלחנו לייצר דאטה תפעולי לארגון חברתי יש מאין. מפגש מרתק בין Genius Data Science לארגון חברתי התנדבותי "אחוקים בדרכים" הוליד פרוייקט מרתק בו הצלחנו לייצר עבורם מסד נתונים מלא ועדכני יש מאין.

 

ככה הכל התחיל

כך התחיל הסיפור, יום בהיר מתברר לי שחבר קרוב שלי מנהל (בשקט האופיני לו) את עמותת "אחוקים בדרכים". למי שלא מכיר אחוקים הינה עמותה של מתנדבים מקסימים שעוזרים לאנשים שנתקעו עם הרכב באנשהוא ואין להם את היכולת לפתור את הבעיה בעצמם. לדוגמה, באמצע נסיעה האוטו מקרטע ואת או אתה נחרדים לגלות שהגלגל התפנצ'ר, ללא ספק זו באסה. אבל הבאסה הגדולה יותר היא שאין לך מפתח ברגים או ג'ק. בדיוק למקרים כאלה נועד אחוקים בדרכים. אתה מחייג אליהם, הם מפיצים את המשימה בקבוצת ווצאפ יעודית באזור הגיאוגרפי בו אתה תקוע, ואחד מהמתנדבים הנפלאים לוקח את המשימה ויוצא לעזור בהתנדבות מלאה. דבר נפלא בעיני!

החבר פנה אלי וביקש שנסייע להם לנתח את הנתונים, לכמת את המשימות שהם מבצעים, באלו תחומים הם עוזרים, כמה זמן בממוצע לוקח למשימה להתבצע בהצלחה וכו' וכו'.

הבעיה היחידה שהייתה היא שאין דאטה! העמותה פועלת בהתנדבות מלאה, ואין SQL או DB ממוסד בו הנתונים נמצאים. לא אמרנו נואש והחלטנו שנהיה יצירתיים ונמצא פתרון.

שלב ראשון: מאין דאטה?

החלטנו לנתח את השיח בקבוצות הווצאפ של המתנדבים ומשם נחלץ את כל המידע הרלוונטי. בשלב ראשון היינו צריכים לחלץ את כל השיח שבקבוצות לקבצים שאפשר לעבוד איתם. למי שלא יודע יש אופציה לחלץ את הטקסט מתוך הווצאפ לפורמט txt ואז זה נראה ככה

כתבנו תוכנית קטנה שהופכת את הפורמט הארור הזה לבמבנה טבלאי שמורכב מ-3 עמודות: תאריך, שעה, והטקסט. עכשיו כבר יש לנו בסיס לתחילת עבודה. בעצם כל התכתבות בקבוצה קיבלה שורה עם חותמת זמן של תאריך ושעה.

לסיכום: הדאטה בו השתשמנו לקוח משיח של 7 קבוצות ווצאפ שונות שמכילות 20980 התכתבויות.

שלב שני: ניתוח טקסט עברית

עברנו לשלב הבא של ניתוח הטקסט. על מה מדברים שם בקבוצה, איזה משימות עולות, מי לוקח משימות ומתי. השתמשנו בתוכנה שלנו Genius OTC שמיועדת לניתוח סקרי שביעות רצון, פסקי דין ובעצם ניתוח של כל מידע טקסטואלי בעברית ושפות נוספות.

בדקנו את שכיחות המילים והביטויים שמופיעים בטקסטים ואת הקשר בינהם. די מהר גילינו שהמשימות המרכזיות הם:

  • סיוע בתקלת פנצ'ר

  • סיוע בהנעת רכב (כבלים)

  • סיוע ברכב נעול כשהמפתח נמצא בפנים

  • חילוץ רכב שהתחפר בחול

  • סיוע בדלק

  • אחר – ברובם עזרה בתיקוני בית קלים לאנשים מעוטי יכולת.

ניתחנו את הטקסט והצלחנו באמצעות מילות מפתח ושימוש בכללי שפה לזהות את גילגולה של משימה שיש בה שלשה שלבים: בקשה למשימה, מישהו שלוקח את המשימה. והודעה שהמשימה בוצעה.

מצאנו שבמשך השנה החולפת אחוקים בדרכים נדרשו לסייע ל-5521 משימות שונות. אלו מספר המשימות שזהינו באופן וודאי. ככל הנראה ישנם משימות נוספות שיש עליהם מידע חלקי.

כשמסתכלים על התפלגות המשימות מקבלים את התוצאה הבאה:

שלב שלישי: ניתוח התוכן והפקת תובנות.

אחרי שיש לנו את התפלגות המשימות, התחלנו לבדוק זמני תגובה של המתנדבים. חיברנו את הקבצים באמצעות IBM SPSS נעזרנו במשתנה הזמן וחישבנו סדרות של בקשה למשימה, לקיחת משימה, ומשימה שבוצעה. כעת גילינו 2 דברים מדהימים. 1. משימות לסייע לגברת או לאדם מבוגר נענות מהר יותר ממשימות שלא פורט בהם מי מבקש המשימה. 2. משימות לסייע בהנעת רכב באמצעות כבלים גם כן נענות מהר יותר ממשימות לתקן פנצר. (אתם יכולים לשער למה?)

בנוסף ראינו שרוב המשימות נענות ומתבצעות תוך חצי שעה!!!

יחד עם זאת, בגרף השמאלי ניתן לראות שחיקה מסוימת של המתנדבים, אם בשנת 2017 72% מהמשימות נחטפו תוך 5 דקות, בשנת 2019 רק 46% נחטפו תוך 5 דק.

העמקנו את הבדיקה ובדקנו את גילגולה של משימה בהשוואה בין המשימות השונות. לא הופתענו כשגילנו שאת המשימה לתקן פנצ'ר המתנדבים פחות אוהבים אלא אם כן מדובר באישה או אדם מבוגר.

גילינו עוד הרבה דברים מענינים כמו מיהם המתדנבים החרוצים, טופ 5 בכל חודש, מי נמצא בקבוצה ולא לוקח בכלל משימות ועוד ועוד.

לסיכומו של פרויקט

בסופו של פרויקט פיתחנו עבור "אחוקים בדרכים" פתרון פשוט לאיסוף מידע חשוב ויקר ערך מתוך טקסט ושיח חופשי בקבוצות ווצאפ ובכך ביננו להם בסיס נתונים מקיף. באמצעות ניתוח טקסט יצרנו דאטה מאין. בנוסף, הצגנו מדדים למדידת פעילות המתנדבים, ובכך סייענו לספק ציוד יקר למתנדבים הפעילים ביותר.