الگوریتم ماشین بردار پشتیبان (Support Vector Machine) چیست؟

مهسا مژدهی

4 سال پیش

ماشین بردار پشتیبان (Support Vector Machine) یا به‌اختصار SVM یک مدل یادگیری ماشین با ناظر (supervised Learning) است که با توجه به داده‌های برچسب‌دار آموزشی (یادگیری با ناظر)، یک هایپرپلین (Hyperplane) بهینه را ارائه می‌کند تا داده‌های جدید را به دسته‌های مختلف طبقه‌بندی کند.

فهرست مطالب پنهان‌کردن فهرست

1. یادگیری ماشین چیست؟‌
2. ماشین بردار پشتیبان (Support Vector Machine) چیست؟
3. کاربردهای ماشین بردار پشتیبان
4. ماشین بردار پشتیبان چطور کار می‌کند؟
1. 4.1. حصار خود را کجا بسازیم؟
2. 4.2. چگونه بدانیم هایپرپلین را کجا باید بکشیم؟
5. ماشین بردار پشتیبان و داده‌های غیرخطی
6. بررسی چند مفهوم رایج در الگوریتم ماشین بردار پشتیبان
7. چالش‌ها و محدودیت‌های SVM
8. قسمتی از جزوه کلاس برای آموزش الگوریتم SVM
9. قطعه کد الگوریتم ماشین بردار پشتیبان
1. 9.1. پارامترهای ورودی کد SVM
2. 9.2. کد SVM
10. جمع‌بندی درباره‌ی ماشین بردار پشتیبان (Support Vector Machine)

یادگیری ماشین چیست؟‌

یادگیری ماشین زیرشاخه‌ای از هوش مصنوعی است که بر توسعه الگوریتم‌هایی تمرکز دارد که می‌توانند از داده‌ها یاد بگیرند و بر اساس آن یادگیری، پیش‌بینی یا تصمیم بگیرند. هدف یادگیری ماشین این است که کامپیوترها را قادر سازد تا از تجربه یاد بگیرند و بدون برنامه ریزی صریح، پیشرفت کنند.

سه نوع اصلی یادگیری ماشین وجود دارد:

یادگیری تحت نظارت (Supervised Learning)، یادگیری بدون نظارت (Unsupervised Learning) و یادگیری تقویتی (Reinforcement Learning) . در یادگیری نظارت شده، الگوریتم بر روی یک مجموعه داده برچسب‌گذاری شده آموزش داده می‌شود، به شکلی که داده‌های ورودی با خروجی صحیح مرتبط می‌شوند. الگوریتم یاد می‌گیرد که با به حداقل رساندن خطا بین خروجی پیش بینی شده و خروجی واقعی، ورودی را به خروجی نگاشت کند. این نوع یادگیری برای کارهایی مانند طبقه بندی (Classification) ، رگرسیون (Regression) و پیش‌بینی استفاده می‌شود.

به عنوان مثال، در یک تسک طبقه‌بندی، داده‌های ورودی ممکن است تصاویری از ارقام دست نویس باشند، و برچسب‌های خروجی ممکن است خود ارقام باشند. این الگوریتم بر روی یک مجموعه داده برچسب‌گذاری شده از بسیاری از این تصاویر و برچسب‌های مرتبط آموزش داده می‌شود و یاد می‌گیرد که الگوهای موجود در داده‌های ورودی را که با هر برچسب خروجی مرتبط هستند، تشخیص دهد. هنگامی که الگوریتم آموزش داده شد، می توان از آن برای طبقه بندی تصاویر جدید و دیده نشده بر اساس الگوهای آموخته شده استفاده کرد.

یادگیری تحت نظارت به طور گسترده در بسیاری از برنامه‌های کاربردی دنیای واقعی، مانند تشخیص تصویر، تشخیص گفتار، پردازش زبان طبیعی و سیستم های توصیه‌گر استفاده می‌شود. با این حال، برای آموزش الگوریتم به مقدار زیادی داده برچسب‌گذاری شده نیاز دارد که دستیابی به آن زمان‌بر و پرهزینه است.

الگوریتم ماشین بردار پشتیبان یا SVM هم نوعی یادگیری ماشین تحت نظارت یاSupervised Learning است که قصد داریم در این مطلب به معرفی آن بپردازیم.

ماشین بردار پشتیبان (Support Vector Machine) چیست؟

ماشین بردار پشتیبان یا Support Vector Machine که به‌اختصار به آن SVM گفته می‌شود یک الگوریتم یادگیری ماشین با ناظر است که نمونه‌‌ی داده‌هایی را به‌صورتی نقاطی در فضا نشان داده شده است، با استفاده از یک خط یا هایپرپلین (Hyperplane)، از هم جدا می‌کند. این جداسازی به‌گونه‌ای است که نقاط داده‌ای که در یک طرف خط هستند مشابه‌به‌هم و در یک گروه قرار می‌گیرند. نمونه‌داده‌های جدید هم بعد از اضافه‌شدن به همان فضا در یکی از دسته‌های موجود قرار خواهند گرفت.

کاربردهای ماشین بردار پشتیبان

الگوریتم ماشین بردار پشتیبان (SVM) با قابلیت تشخیص دقیق الگوها و دسته‌بندی‌های پیچیده، در حوزه‌های گوناگونی کاربرد دارد. برخی از کاربردهای برجسته‌ی این الگوریتم در زندگی واقعی عبارت‌اند از:

مطالعات زمین‌شناسی: استفاده از SVM برای تعیین ساختارهای زیرزمینی.
پیش‌بینی مایع شدن خاک: کمک به ارزیابی پتانسیل مایع شدن خاک در هنگام زلزله‌ها.
بیوانفورماتیک: تشخیص ساختارهای پروتئینی و شناسایی توالی‌های همولوژیک.
تشخیص حالت چهره: کاربرد در تشخیص و طبقه‌بندی حالات چهره‌ در تصاویر.
طبقه‌بندی بافت در تصاویر: توانایی تفکیک و تشخیص انواع بافت‌ها در تصاویر.
تشخیص Stenography: شناسایی اطلاعات پنهان در تصاویر دیجیتال.
پزشکی: استفاده در تشخیص و پیش‌بینی بیماری‌ها، مانند سرطان.

ماشین بردار پشتیبان چطور کار می‌کند؟

برای درک نحوه‌ی عملکرد ماشین بردار پشتیبان (SVM) بیایید مثال خرگوش و ببر را در نظر بگیریم. بیایید اکنون یک سناریوی کوچک را در نظر بگیریم و وانمود کنیم صاحب مزرعه‌ای هستیم و بنا به دلایلی می‌خواهیم حصاری برای محافظت از خرگوش‌های خود دربرابر ببرها ایجاد کنیم.

حصار خود را کجا بسازیم؟

یکی از راه‌حل‌های این مشکل این است که یک طبقه‌بندی براساس موقعیت خرگوش‌ها و ببرها ایجاد کنیم. می‌توانیم گروه خرگوش‌ها را به‌عنوان یک گروه و گروه ببرها را به‌عنوان گروه دیگر طبقه‌بندی کنیم.

در حال حاضر، اگر سعی کنیم یک مرز میان خرگوش‌ها و ببرها بکشیم، یک خط مستقیم خواهد شد (لطفاً به تصویر بعدی نگاه کنید). ماشین بردار پشتیبان (SVM) نیز دقیقاً به‌این شکل عمل می‌کند؛ یک مرز تصمیم‌گیری ترسیم می‌کند که درواقع یک هایپرپلین میان دو کلاس است تا آن‌ها را از هم جدا و طبقه‌بندی کند.

چگونه بدانیم هایپرپلین را کجا باید بکشیم؟

اصل اساسی ماشین بردار پشتیبان این است که یک هایپرپلین ترسیم کنیم که دو کلاس را به‌بهترین شکل از یکدیگر جدا کند. حال درمورد مثال ما دو کلاس خرگوش و ببر هستند؛ بنابراین ما با ترسیم یک هایپرپلین رندوم شروع می‌کنیم و سپس فاصله‌ی میان هایپرپلین و نزدیک‌ترین نقاط داده‌ی هر کلاس را بررسی می‌کنیم.

این نقاط داده نزدیک به هایپرپلین بردارهای پشتیبان (Support Vectors) نامیده می‌شوند؛ به‌همین دلیل است که به این الگوریتم ماشین بردار پشتیبان (SVM) گفته می‌شود. اساساً هایپرپلین براساس این بردارهای پشتیبان ترسیم می‌شود. به‌طور معمول هایپرپلینی که بیشترین فاصله از بردارهای پشتیبان را داشته باشد بهینه‌ترین هایپرپلین است. این فاصله‌ی میان هایپرپلین و بردارهای پشتیبان حاشیه(Margin) نامیده می‌شود.

حال بیایید فرض کنیم یک نقطه‌ی داده‌ی جدید اضافه کنیم (در این مثال ببر دیگری اضافه شده است). اکنون می ‌خواهم یک هایپرپلین بکشیم تا این دو کلاس را به‌بهترین شکل از هم جدا کند؛ بنابراین، با ترسیم هایپرپلین، همان‌طور که در تصویر بالا نشان داده شده است، شروع می کنیم؛ سپس فاصله‌ی میان این هایپرپلین و بردارهای پشتیبان را بررسی می کنیم که آیا حاشیه‌ی این هایپرپلین حداکثر است یا خیر. در این شکل حاشیه‌ی خیلی هم زیاد نیست.

در سناریوی دوم، یک هایپرپلین متفاوت، مانند تصویر زیر، ترسیم می ‌کنیم و سپس فاصله‌ی میان هایپرپلین و بردارهای پشتیبان را بررسی می‌کنیم که آیا حاشیه‌ی این هایپرپلین حداکثر است یا خیر.

می‌بینیم که حاشیه در مقایسه با هایپرپلین قبلی بسیار زیاد است؛ بنابراین ما این هایپرپلین را انتخاب می‌کنیم.

ماشین بردار پشتیبان و داده‌های غیرخطی

در مثال قبل دیدیم که داده‌های ما تا کنون به‌صورت خطی تفکیک‌پذیر بودند، یعنی می‌توانستیم یک خط مستقیم برای جداکردن دو کلاس بکشیم، اما اگر نقاط داده‌ی ما به‌شکل زیر باشد، چه کنیم؟ این دو کلاس با یک خط مستقیم از هم جدا نمی‌شوند.

در الگوریتم ماشین بردار پشتیبان، هنگام ساختن یک هایپرپلین برای نقاط داده‌ی تفکیک‌پذیر خطی کار آسانی است، اما وقتی داده‌ها غیرخطی تفکیک‌پذیر باشند، کار بسیار چالش‌برانگیز خواهد بود.

هنگامی‌که نقاط داده را نمی‌توان با یک خط مستقیم یا یک هایپرپلین مستقیم جدا کرد، مسئله غیرخطی نامیده می‌شود. در چنین شرایطی کرنل‌های ماشین بردار پشتیبان (SVM) وارد عمل می‌شوند و ابعاد فضا را افزایش می‌دهند تا نقاط داده به‌صورت خطی تفکیک‌پذیر شوند.

پس اگر داده‌های اولیه ما به‌شکل بالا باشند، لازم است که ما بعد سوم را اضافه کنیم. تابه‌حال ما دو بعد داشتیم: x و y. حال یک بعد z جدید ایجاد می‌کنیم که به‌این شکل محاسبه می‌شود: z = x² + y² (اگر دقت کنید این معادله یک دایره است).

این کار به ما فضایی سه‌بعدی می‌دهد که به‌این شکل می‌توان آن را در اینجا نشان داد:

اما ماشین بردار پشتیبان الان چطور تفکیک را انجام می‌دهد؟ اجازه بدهید با هم ببینم:

پس نقاط داده‌ی ما در حال حاضر به‌راحتی با یک خط تفکیک شدند. آنچه باقی مانده ترسیم مجدد آن به‌شکل دوبعدی است:

در حال حاضر کار طبقه‌بندی داده‌ها به پایان رسیده است. درواقع به این فرایند که توضیح داده شد حقه‌ی کرنل (Kernel Trick) گفته می‌شود.

بررسی چند مفهوم رایج در الگوریتم ماشین بردار پشتیبان

حاشیه (Margin)

حاشیه در SVM به فضایی بین دسته‌های داده‌های طبقه‌بندی شده اشاره دارد. فرض کنید حاشیه مانند منطقه‌ای امن بین دو گروه است که می‌خواهیم جدا کنیم؛ هدف این است که این منطقه را تا جای ممکن گسترده کنیم تا حتی اگر داده‌های جدیدی اضافه شوند، با اطمینان بیشتری بتوانیم آن‌ها را طبقه‌بندی کنیم. حاشیه بزرگ‌تر نشان‌دهنده جداسازی قوی‌تر و در نتیجه، مدل دقیق‌تری است.

هایپرپلین (Hyperplane)

هایپرپلین در SVM، خط یا صفحه‌ای است که داده‌ها را به دو دسته جدا می‌کند. در فضای دوبعدی، این یک خط مستقیم است؛ اما در فضاهای با ابعاد بالاتر، به صفحه‌ای بزرگ‌تر تبدیل می‌شود که می‌تواند داده‌ها را در ابعاد مختلف جدا کند. هایپرپلین بهینه آن صفحه‌ای است که بزرگترین حاشیه را بین دسته‌های مختلف داده‌ها ایجاد می‌کند.

فضای ویژگی (Feature Space)

فضای ویژگی به بعد یا دامنه‌ای گفته می‌شود که در آن داده‌ها نمایش داده می‌شوند و تجزیه و تحلیل می‌شوند. در SVM، تبدیل داده‌ها به فضای ویژگی بالاتر این امکان را فراهم می‌کند که داده‌هایی که در ابعاد اصلی خود قابل جداسازی خطی نیستند، به شکلی تبدیل شوند که بتوان آن‌ها را به طور خطی جدا کرد.

انواع کرنل‌ها

کرنل‌ها در SVM به ما اجازه می‌دهند تا داده‌هایی که به‌صورت خطی جداسازی‌پذیر نیستند را به فضای ویژگی بالاتری انتقال دهیم که در آن جداسازی ممکن است. انواع مختلفی از کرنل‌ها وجود دارند که هرکدام برای داده‌ها و مسائل مختلف مناسب هستند. کرنل خطی، کرنل چندجمله‌ای، کرنل رادیال بیس (RBF) و کرنل سیگموئید از جمله رایج‌ترین کرنل‌ها هستند.

چالش‌ها و محدودیت‌های SVM

استفاده از الگوریتم ماشین بردار پشتیبان (SVM) در یادگیری ماشین دارای مزایای بسیاری است، اما مانند هر روش دیگر، چالش‌ها و محدودیت‌های خاص خود را دارد. در اینجا، به برخی از این محدودیت‌ها و چالش‌ها می‌پردازیم:

انتخاب کرنل

یکی از چالش‌های عمده در استفاده از SVM، انتخاب نوع کرنل مناسب است. اگر کرنل انتخابی با ماهیت داده‌ها همخوانی نداشته باشد، مدل نهایی نمی‌تواند الگوهای پیچیده را یاد بگیرد و این موضوع می‌تواند به کاهش دقت پیش‌بینی‌ها منجر شود.

مقیاس‌بندی ویژگی‌ها

الگوریتم SVM به مقیاس ویژگی‌ها حساس است. ویژگی‌هایی که در مقیاس‌های بزرگتر قرار دارند می‌توانند تأثیر نامتناسبی بر مدل نهایی داشته باشند و باعث می‌شوند که مرز تصمیم‌گیری بیش از حد به سمت ویژگی‌های با مقیاس بزرگتر کج شود. بنابراین، مقیاس‌بندی ویژگی‌ها قبل از آموزش مدل ضروری است.

داده‌های نامتعادل

زمانی که داده‌های آموزشی نامتعادل هستند، یعنی تعداد نمونه‌ها در یک کلاس به مراتب بیشتر از کلاس‌های دیگر است، SVM ممکن است به سمت کلاس با تعداد نمونه بیشتر سوگیری پیدا کند. این مسئله می‌تواند منجر به تشخیص نادرست کلاس‌های با تعداد نمونه کمتر شود.

محاسبات سنگین

اگرچه SVM در مجموعه داده‌هایی با ابعاد متوسط به خوبی کار می‌کند، اما با افزایش تعداد ویژگی‌ها و نمونه‌ها، زمان آموزش مدل به شدت افزایش می‌یابد. این مسئله باعث می‌شود که استفاده از SVM در داده‌های بزرگ و پیچیده به لحاظ محاسباتی ناکارآمد باشد.

تنظیم پارامترها

تعیین پارامترهای مناسب برای SVM می‌تواند چالش‌برانگیز باشد. پارامترهایی مانند C (هزینه خطا) و پارامترهای کرنل باید به دقت تنظیم شوند تا از بیش‌برازش (Overfitting) یا زیربرازش (Underfitting) جلوگیری شود.

تفسیرپذیری

در حالی که SVM می‌تواند الگوهای پیچیده را با دقت بالایی تشخیص دهد، اما تفسیر مدل‌های تولید شده توسط آن می‌تواند دشوار باشد. این مسئله به ویژه در مواردی که از کرنل‌های پیچیده استفاده شده است، بیشتر خود را نشان می‌دهد.

قسمتی از جزوه کلاس برای آموزش الگوریتم SVM

دوره جامع دیتا ساینس و ماشین لرنینگ

قطعه کد الگوریتم ماشین بردار پشتیبان

پارامترهای ورودی کد SVM

پارامترهای SVM تنظیمات مدل را کنترل می‌کنند و شامل تنظیماتی برای کرنل (مانند نوع کرنل و پارامترهای مربوط به آن)، مقدار C که نرخ خطای طبقه‌بندی را کنترل می‌کند، و پارامتر گاما برای کرنل RBF که تعیین می‌کند تا چه اندازه یک نمونه تکی می‌تواند تأثیر بگذارد، هستند. این پارامترها باید با دقت انتخاب شوند تا مدل نهایی بالاترین دقت و عمومیت‌پذیری را داشته باشد.

کد SVM

برای تمرین و آشنایی بیشتر با این الگوریتم، شما می‌توانید کد زیر را در گوگل Colab اجرا کنید.

جمع‌بندی درباره‌ی ماشین بردار پشتیبان (Support Vector Machine)

در این مطلب سعی کردیم الگوریتم ماشین بردار پشتیبان (Support Vector Machines) را که به‌اختصار به آن SVM گفته می‌شود به‌صورت کوتاه و روشن توضیح دهیم. همان‌طور که اشاره کردیم، ماشین بردار پشتیبان یک الگوریتم یادگیری ماشین با ناظر (Supervised) است.

برای آشنایی با الگوریتم یادگیری ماشین با ناظر مطلب یادگیری با ناظر (Supervised Learning) را مطالعه کنید.