یادگیری ماشینی شاخهای از علوم کامپیوتر است که به گفته آرتور ساموئل در ۱۹۵۹، به کامپیوترها توانایی یاد گرفتن میدهد، بدون آن که صراحتا برای آن برنامهریزی شده باشند. یادگیری ماشینی از مطالعه شناسایی الگوها و نظریه یادگیری محاسباتی تکامل یافته و به طور کلی به مطالعه و ساخت الگوریتمهایی میپردازد که میتوانند از دادههای موجود یاد بگیرند و بر روی دادهها پیشبینی انجام دهند. در این مجموعه پستها که هنوز معلوم نیست تا کی ادامه داشته باشید، قصد دارم دربارهی الگوریتمهای رایج یادگیری ماشینی که پیادهسازی آنها در R آسان است و یا پکیجهای خوبی در R دارند بنویسم. ایدهی کلی این مجموعه آشنایی با آن بخش از یادگیری ماشینی است که در مبحث تحلیل داده کاربرد دارند و قرار نیست به کاربردهای پیچیدهتر آن برسد. این پستها را با الگوریتمهای کلسیفایر مانند K-NN در پست بعدی شروع میکنیم، در ادامه به الگوریتمهای پیشبینی مانند مدلهای رگرسیونی خواهیم رسید و در نهایت به انواع دیگر الگوریتمهای یادگیری ماشینی میرسیم. هدف این پستها ارایهی یک توضیح فارسی برای الگوریتم، کد R آن و یک دیتاست به عنوان مثال است. اگر پیشنهادی برای این مجموعه دارید، یا دیتاستی مناسب برای این مجموعه سراغ دارید خوشحال میشود در نظرات همین مطلب آن را به اشتراک بگذارید.
یادگیری ماشینی در R — بخش اول، مقدمه
27
ژوئن