ההבדל בין עץ החלטות ליער אקראי

תוכן עניינים:

Anonim

ה ההבדל העיקרי בין עץ ההחלטה ליער אקראי הוא זה עץ החלטות הוא גרף המשתמש בשיטת הסתעפות כדי להמחיש כל תוצאה אפשרית של החלטה בעוד יער אקראי הוא קבוצה של עצי החלטה שנותנת את התוצאה הסופית על סמך התפוקות של כל עצי ההחלטה שלה.

למידת מכונה היא יישום של בינה מלאכותית, המעניקה למערכת את היכולת ללמוד ולשפר על סמך ניסיון העבר. עץ החלטות ויער אקראי הן שתי טכניקות בלמידת מכונה. עץ החלטות ממפה את התוצאות האפשריות של סדרה של אפשרויות קשורות. הוא פופולרי מכיוון שהוא פשוט וקל יותר להבנה. כאשר מערך הנתונים הופך להיות גדול בהרבה, עץ החלטות יחיד אינו מספיק כדי למצוא את התחזית. יער אקראי, שהוא אוסף של עצי החלטה, מהווה אלטרנטיבה לנושא זה. תפוקת היער האקראי מבוססת על התפוקות של כל עצי ההחלטה שלו.

עץ החלטות, למידת מכונה, יער אקראי

מהו עץ החלטות

עץ החלטות הוא תרשים של צורת עץ המשמש לקביעת דרך הפעולה. כל ענף של העץ מייצג החלטה, התרחשות או תגובה אפשרית.

ישנם מספר מונחים הקשורים לעץ החלטות. אנטרופיה היא מדידת חוסר הצפי במערך הנתונים. לאחר פיצול מערך הנתונים, רמת האנטרופיה יורדת עם ירידה בחוסר הצפי. רווח המידע הוא הירידה באנטרופיה לאחר יריקה במערך הנתונים. חשוב לפצל את הנתונים כך שרווח המידע יהיה גבוה יותר. ההחלטות הסופיות או הסיווגים נקראים צמתים של עלים. הצומת העליון או הצומת הראשי נקרא צומת השורש. יש לפצל את מערך הנתונים עד שהאנטרופיה הסופית הופכת לאפס.

עץ החלטות פשוט הוא כדלקמן.

איור 1: עץ החלטות

עץ ההחלטות מעל מסווג קבוצת פירות. ישנם 4 ענבים, 2 תפוחים ו -2 תפוזים. כאשר בוחנים את הקוטר של פחות מ -5, הענבים מסווגים לצד אחד ואילו תפוזים ותפוחים בצד השני. לא ניתן לסווג ענבים יותר מכיוון שיש לו אפס אנטרופיה. כאשר מסווגים לפי הצבע, כלומר אם האדום הפרי אדום או לא, התפוחים מסווגים לצד אחד ואילו התפוזים מסווגים לצד השני. לפיכך, עץ החלטה זה מסווג תפוח, ענב או תפוז בדיוק של 100%.

בסך הכל, עץ ההחלטות פשוט להבנה, קל יותר לפרשנות ולחזות. זה לא דורש הרבה הכנת נתונים. הוא יכול להתמודד עם נתונים מספריים וקטגוריים כאחד. מצד שני, הרעש בנתונים עלול לגרום להתאמת יתר. יתר על כן, המודל יכול גם להיות בלתי יציב בשל וריאציות קטנות.

מהו יער אקראי

יער אקראי היא שיטה הפועלת על ידי בניית עצי החלטה מרובים במהלך שלב ההכשרה. ההחלטות של רוב העצים הן ההחלטה הסופית של היער האקראי. דוגמא פשוטה היא כדלקמן.

נניח שיש סט של פירות (דובדבנים, תפוחים ותפוזים). להלן שלושת עצי ההחלטה המסווגים את שלושת סוגי הפירות הללו.

איור 2: עץ החלטות 1

איור 3: עץ החלטות 2

איור 4: עץ החלטות 3

פרי חדש שקוטרו 3 ניתן לדגם. צבעו של פרי זה כתום, וגדל בקיץ. עץ ההחלטה הראשון יסווג אותו כתפוז. עץ ההחלטה השני יסווג אותו כדובדבן ואילו עץ ההחלטה השלישי יסווג אותו כתפוז. כאשר בוחנים את כל שלושת העצים, יש שתי יציאות לתפוז. לכן הפלט הסופי של היער האקראי הוא כתום.

בסך הכל, היער האקראי מספק תוצאות מדויקות על מערך נתונים גדול יותר. זה גם מקטין את הסיכון להתאמת יתר.

ההבדל בין עץ החלטות ליער אקראי

הַגדָרָה

עץ החלטות הוא כלי תומך בהחלטות המשתמש בגרף דמוי עץ או במודל של החלטות ובהשלכות האפשריות שלהן, כולל תוצאות אירוע מקרי, עלויות משאבים ותועלת. יערות אקראיים היא שיטת למידה של האנסמבל הפועלת על ידי בניית ריבוי עצי החלטה בזמן האימון והוצאת הכיתה בהתאם לעצים האישיים.

התאמת יתר

קיימת אפשרות להתאמת יתר בעץ ההחלטות. השימוש בעצים מרובים ביער האקראי מפחית את הסיכון להתאמת יתר.

דיוק

יער אקראי נותן תוצאות מדויקות יותר מעץ החלטות.

מוּרכָּבוּת

עץ החלטות פשוט וקל יותר להבנה, לפרשנות ולחזות מאשר יער אקראי, שהוא יחסית יותר מורכב.

סיכום

ההבדל בין עץ החלטה ליער אקראי הוא שעץ החלטות הוא גרף שמשתמש בשיטת הסתעפות כדי להמחיש כל תוצאה אפשרית של החלטה בעוד יער אקראי הוא קבוצה של עצי החלטה שנותנת את התוצאה הסופית בהתבסס על התפוקות של כל עצי ההחלטה שלה.

התייחסות:

1. אלגוריתם יער אקראי - יער אקראי מוסבר | Forest Random in Machine Learning, Simplilearn, 12 במרץ 2018, זמין כאן.

ההבדל בין עץ החלטות ליער אקראי