معرفی تکنیک دسته بندی k-NN

1402/06/14

دسترسی سریع


معرفی تکنیک دسته بندی k-NN

هنگام تلاش برای حل مسائل جدید، افراد معمولا به راه­ حل های مسائل مشابه که قبلا حل شده­ اند مراجعه می­کنند. (k-nearest neighbor k-NN) یک تکنیک دسته­ بندی است که از نسخه­ ای از این متد استفاده می­کند. در این روش تصمیم­ گیری اینکه یک مورد جدید در کدام دسته قرار گیرد با بررسی تعدادی(k) از شبیه­ ترین موارد یا همسایه­ ها انجام می­شود. تعداد موارد برای هر کلاس شمرده می­شوند، و مورد جدید به دسته­ ای که تعداد بیشتری از همسایه­ ها به آن تعلق دارند نسبت داده می­شود.

Capture

محدوده همسایگی (بیشتر همسایه ها در دسته X قرار گرفته‌‌‌‌‌ ‌اند.

اولین مورد برای بکاربردن k-NN یافتن معیاری برای فاصله بین صفات در داده­ ها و محاسبه آن است. در حالیکه این عمل برای داده­ های عددی آسان است، متغیرهای دسته­ای نیاز به برخورد خاصی دارند. هنگامیکه فاصله بین مواد مختلف را توانستیم اندازه گیریم، می­توانیم از مجموعه مواردی که قبلا دسته ­بندی شده­اند را بعنوان پایه دسته­ بندی موارد جدید استفاده کنیم، فاصله همسایگی را تعیین کنیم، و تعیین کنیم که خود همسایه ­ها را چگونه بشماریم.

K-NN بار محاسباتی زیادی را روی کامپیوتر قرار می­دهد زیرا زمان محاسبه بصورت فاکتوریلی از تمام نقاط افزایش می­یابد. درحالیکه به‌کاربردن درخت تصمیم یا شبکه عصبی برای یک مورد جدید فرایند سریعی است، K-NN نیاز به محاسبه جدیدی برای هر مورد جدید دارد. برای افزایش سرعت K-NN معمولا تمام داده­ها در حافظه نگه­داری می­شوند.

فهم مدلهای K-NN هنگامی‌که تعداد متغیرهای پیش­بینی کننده کم است بسیار ساده است. آن‌ها همچنین برای ساخت مدلهای شامل انواع داده غیر‌استاندارد هستند، مانند متن بسیار مفیدند. تنها نیاز برای انواع داده جدید وجود معیار مناسب است.

نظرات

هیچ نظری وجود ندارد.


افزودن نظر

Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved