جزوه هرس درختان
دانلود فایل
 
 
 
 
 
 
 
 
 
قبل و بعد از هرس
هرس یک تکنیک فشرده‌سازی داده جزوه هرس درختان در الگوریتم‌های جستجو و یادگیری ماشینی است که با حذف بخش‌هایی از درخت که برای طبقه‌بندی نمونه‌ها غیر بحرانی و زائد هستند ، اندازه درخت‌های تصمیم را کاهش می‌دهد . هرس پیچیدگی طبقه بندی نهایی را کاهش می دهد و در نتیجه دقت پیش بینی را با کاهش بیش از حد برازش بهبود می بخشد .
یکی از سوالاتی که در الگوریتم درخت تصمیم مطرح می شود جزوه هرس درختان اندازه بهینه درخت نهایی است. درختی که بیش از حد بزرگ است خطر تطبیق بیش از حد داده های آموزشی و تعمیم ضعیف به نمونه های جدید را دارد. یک درخت کوچک ممکن است اطلاعات ساختاری مهمی را در مورد فضای نمونه دریافت نکند. با این حال، تشخیص اینکه چه زمانی یک الگوریتم درختی باید متوقف شود دشوار است، زیرا غیرممکن است که بگوییم اضافه کردن یک گره اضافی به طور چشمگیری خطا را کاهش می دهد یا خیر. این مشکل به عنوان اثر افق شناخته می شود . یک استراتژی متداول این است که درخت را تا زمانی که هر گره حاوی تعداد کمی نمونه باشد رشد می‌دهد، سپس از هرس برای حذف گره‌هایی که اطلاعات اضافی ارائه نمی‌کنند استفاده کنید. [۱]
هرس باید اندازه درخت یادگیرنده را بدون کاهش دقت پیش‌بینی که توسط مجموعه اعتبارسنجی متقابل اندازه‌گیری می‌شود، کاهش دهد . تکنیک های زیادی برای هرس درختان وجود دارد که از نظر اندازه گیری برای بهینه سازی عملکرد متفاوت هستند. جزوه هرس درختان

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *