|
נספח: רקע סטטיסטי
נספח: רקע סטטיסטי
התפלגות "פואסון" לניתוח נתוני תאונות דרכים
תאונת דרכים היא אירוע המושפע מגורמים רבים ובעל אופי אקראי, שיכול לקרות בהסתברות מסוימת בכל מקום ובכל עת. הניתוח הסטטיסטי של תאונות דרכים מתבסס על כך שתאונות הדרכים הן אירוע אקראי, הקורה במקום מסוים בהסתברות נמוכה מאד, ורק כאשר הן מתרחשות במספרים גדולים, ניתן לנתח את הופעתן בכלים הסטטיסטיים.
בחרנו לבסס את הניתוח על סמך ההנחה שתאונות הדרכים מתנהגות לפי התפלגות "פואסון"-(Poisson). ההתפלגות מבוססת על שתי הנחות עבודה פשוטות:
-
האירוע הנמדד יכול להתרחש בפרק זמן נתון בהסתברות מסוימת;
-
אם נבחר פרק זמן מספיק קצר, באותו פרק זמן לא יתרחש האירוע יותר מפעם אחת.
משמעות הנחה זו ניתנת להדגמה בצורה הפשוטה הבאה: אם לדוגמא קיימת הסתברות של 0.005% להתרחשותה של תאונת דרכים במקום מסוים בכל אחת משעות היממה, ואין אפשרות שתתרחש יותר מתאונה אחת באותו מקום באותה השעה. על בסיס הנחה פשוטה זו, ניתן לחשב את ההסתברות להתרחשות כל מספר של תאונות במשך יממה, שבוע, חודש או שנה, מכל קטגוריה, ולחשב על בסיס זה את הסטטיסטים הנדרשים לביצוע מבחני המובהקות. בהמשך לדוגמה לעיל, ההסתברות שלא תקרה אף תאונה במשך שנה באותו מקום היא 0.65, שתקרה תאונה אחת – 0.28, ושתקרינה 2 תאונות – 0.06.
היתרון הגדול של השימוש בהתפלגות "פואסון" הוא התכונה שסטיית התקן שלה שווה לשורש של הממוצע1 . תכונה מיוחדת זו מונעת את הצורך לאמוד את סטיית התקן של ההתפלגות מתוך נתוני המדגם, אשר ברוב המקרים יהיה קטן מדי (לשמחתנו) ולא יאפשר קבלת אומדן סביר של סטיית התקן.
הצדקה נוספת לשימוש בהתפלגות פואסון היא התכונה שהתפלגות זו מהווה קירוב טוב להתפלגות הבינומית כאשר P £ 0.05. כלומר, אם ההסתברות לארוע "תקרה תאונה" קטנה מ-0.05 (תנאי זה מתקיים ללא ספק אם נתייחס לתקופה מספיק קצרה). כמובן שכאשר הנתונים הנמדדים והנאמדים מתפרסים על פני תקופה של שנה, חוק המספרים הגדולים עובד ומאפשר לבצע את כל חישובי המודל הסטטיסטי תוך התבססות על הקירוב הנורמלי להתפלגות "פואסון".
בעיית המובהקות הסטטיסטית של ניתוח מגמות בתאונות הדרכים
גם אם מראים הנתונים כי בתחום מסוים חלה בשנת 2004 ירידה לעומת השנה הקודמת או לעומת הממוצע של מספר שנים אחרונות, יש לבחון האם ירידה זו מובהקת באופן סטטיסטי2 . אם התוצאה איננה מובהקת, יש להמנע מהסקות מסקנות נחרצות מנתונים אלו.
ככל שנרצה למקד את הדיון בנושא מסוים, ניתקל בבעיה של מספרים קטנים ושונות גדולה ומכאן לחוסר אפשרות להסיק מסקנות מהניתוח הסטטיסטי. אם לבעיה זו מתלווה חוסר מגמה ברורה על פני השנים, אין הכלים הסטטיסטיים מאפשרים להגיע למסקנה כלשהי מהנתונים, כפי שאמנם קורה במקרים רבים שינותחו בהמשך.
על מנת להתגבר על בעיה זו, נעשה שימוש בניתוחים מסוימים בנתונים הכוללים הרוגים וגם פצועים קשה, למרות הסתייגויות ביחס לאמינותם של נתונים אלו (ראה הסבר למעלה).
סיבה נוספת לכך שהניתוח עוסק בתאונות קטלניות וקשות היא הגדרת יעד המאבק בתאונות הדרכים: הפחתת מספר ההרוגים והפצועים קשה בתאונות דרכים.
תופעת הנסיגה אל הממוצע
קושי נוסף בניתוח סטטיסטי של מדגמים קטנים הוא בעיית הנסיגה אל הממוצע.
מהות התופעה: כאשר דוגמים מדגמים קטנים באופן אקראי, והדגימה הראשונה "מייצרת" ממוצע גבוה באופן חריג, בדרך כלל תהיה הדגימה הבאה נמוכה יותר וקרובה יותר אל הממוצע (כלל זה מתקיים גם בכוון ההפוך).
לדוגמה, כאשר מתגלה מספר תאונות בצומת בשנה מסוימת גבוה מהממוצע, סביר שבשנה הבאה אחריה יהיה מספר התאונות קרוב יותר לממוצע, גם אם לא יעשה כל טיפול בצומת. כאשר משתמשים בסטטיסטיקה של מספר גדול של תאונות בקטע דרך כהצדקה להקצאת משאבים לטיפול באותו קטע (בין אם מדובר בשיפורי תשתית או באמצעי אכיפה), חשוב לנטרל את ההשפעה האפשרית של אפקט הנסיגה אל הממוצע, כדי שלא נייחס לטיפול השפעה שאינה קיימת.
גם בבדיקת האפקטיביות של אמצעים שננקטו (ניתוח "אחרי"), יש לבצע תיקון שיביא בחשבון את אפקט הנסיגה לממוצע, כדי שלא נגזים בייחוס השינוי הנצפה לטיפול שנעשה.
1 מבוטא בנוסחה כלהלן: μx = E(x) = λ; σx = / λ
2 מובהקות סטטיסטית מוגדרת כהסתברות נמוכה לקבל תוצאה כזאת, כאשר אין כל סיבה ממשית לכך למעט "מזל". בהמשך נתייחס לשינויים כמובהקים כאשר 0.05 > P;
|
עוד בנושא
חוברת זו מהווה תמונת מצב של הבטיחות בדרכים בישראל: ההיפגעות בתאונות דרכים, מדדי תנועה ובטיחות, הנזק הכלכלי של תאונות הדרכים, השוואות בינלאומיות, ופעולות שונות למדידת מצב הבטיחות ברכב.
התפלגות "פואסון" לניתוח נתוני תאונות דרכים בעיית המובהקות הסטטיסטית של ניתוח מגמות בתאונות הדרכים הפחתת מספר ההרוגים והפצועים קשה בתאונות דרכים
תופעת הנסיגה אל הממוצע
|
|
|