در این مطلب بهسراغ پرسش های متداول یادگیری ماشین رفتهایم. بعید است که اهل تکنولوژی باشیم و تابهحال از علم داده یا دیتاساینس چیزی نشنیده باشید. این روزها همهجا «صحبت از جذابترین شغل قرن ۲۱» است. ابتدا بیایید با هم تعریفی ساده و مختصر از علم داده داشته باشیم: علم داده یعنی استفاده از دادهها برای تصمیمگیری بهتر که از تجزیهوتحلیل برای استخراج بینش، آمار برای علیت و یادگیری ماشین برای پیشبینی استفاده میکند.
پرسش های متداول یادگیری ماشین
امروزه با انجامدادن هر کاری، از جستوجو در اینترنت گرفته تا رفتن به محل کار یا گوشکردن به موسیقی و خرید آنلاین، بهنوعی در حال تولید دادههای جدید هستیم. این دادهها اگر به حال خود گذاشته شوند، ممکن است بیفایده به نظر برسند، اما علم داده اینجاست تا این دادهها را به بهدردبخورترین موجودیت جهان تکنولوژی تبدیل کند. درواقع با استفاده از تکنیکهای علم داده اطلاعات مفیدی را از این دادهها استخراج و از آن برای اهداف مختلف استفاده میکنیم.
حال که تا حدی دربارهی ماهیت اصلی علم داده صحبت کردیم، بد نیست بهسراغ پرسشهای متداول یادگیری ماشین برویم که باید پاسخشان را بدانید.
سؤال ۱. یادگیری ماشین چیست؟
این سؤال خیلی بجا و مهم است؛ دلیل آن هم این است که بهعنوان کسی که قصد دارد در این حوزه فعالیت کند، اگر مفهوم کلی یادگیری ماشین (Machine Learning) را بدانید، در هنگام پرداختن به جزئیات دقیقاً میدانید که این جزئیات با چه هدفی دنبال میشوند؛ این یعنی درک مطالب برایتان راحتتر خواهد بود.
اگر بخواهیم بهبیانی بسیار ساده یادگیری ماشین را تعریف کنیم، باید بگوییم در این حوزه قصد ما این است که به ماشین امکان یادگیری دهیم؛ بهعبارت دیگر، هوش را به ماشین انتقال دهیم. منظور از ماشین هم هر دستگاهی است که پردازنده داشته باشد، مثلاً لپتاپ یا گوشی هوشمند یا یخچال و ماشین لباسشویی هوشمند.
بهطور کلی، یادگیری ماشین یک مفهوم مثالمحور است، بهاین معنا که باید نمونههایی را در ابتدا در اختیار ماشین قرار دهیم تا از آنها یاد بگیرد و بتواند دانشی را که به دست آورده است تعمیم دهد و برای حل مسائل مشابه استفاده کند.
این دقیقاً کاری است که ما انسانها هم گاهی برای یادگیری انجام میدهیم؛ برای مثال، وقتی میخواهیم حل مسائل ریاضی را یاد بگیریم، با دیدن مسائل مشابه و راهحل آنها، بعد از مدتی میتوانیم مسئلهی جدیدی را با دانش خود حل کنیم.
مثالی برای یادگیری ماشین
حال اگر بخواهیم مثالی برای یادگیری ماشین بزنیم، میتوانیم تسک طبقهبندی یا همان Classificiation را در نظر بگیریم که در آن هدف طبقهبندی نمونههای ورودی به کلاسهای مختلف است؛ برای مثال، ما یکمیلیون عکس گربه و سگ را به ماشین میدهیم و این اطلاعات را هم در اختیارش میگذاریم که هر یک از عکسها گربه را نشان میدهد یا سگ. حال ماشین باید خود با آزمونوخطا، بهتنهایی، شروع به تجزیهوتحلیل کند تا بتواند بفهمد چرا این عکس گربه یا عکس دیگر سگ است. این مرحلهی یادگیری ماشین است؛ بعد از آن، وقتی عکس جدیدی را در اختیار ماشین قرار میدهیم، حدس میزند که با چه احتمالی آن عکس گربه یا سگ است.
پیشنهاد میکنیم با یادگیری ماشین بیشتر آشنا شوید.
سؤال ۲. تفاوت یادگیری ماشین و یادگیری عمیق چیست؟
قطعاً اگر مطالعهای هرچند مختصر در زمینه علم داده داشته باشید، با اصطلاحاتی مانند یادگیری ماشین (Machine Learning) یا یادگیری عمیق (Deep Learning) برخورد کردهاید؛ بااینحال ممکن است هنوز تفاوت میان این دو را کاملاً درک نکرده باشید. در این بخش میخواهیم خیلی ساده تفاوت این دو را بررسی کنیم.
هر دوی این تکنیکها با استفاده از نمونهها آموزش میبینند تا بتوانند تسک مدنظر را انجام دهند.
بیایید بار دیگر مثال طبقهبندی عکس گربه و سگ را در نظر بگیریم. ماشین برای تشخیص این عکسها فیچرها (Feature) یا ویژگیهایی را در نظر میگیرد یا بهعبارت دیگر، آنها از عکس استخراج میکند. این فیچرها میتوانند گوشها، چشمها یا هر چیز دیگری باشند. تفاوت یادگیری ماشین با یادگیری عمیق دقیقاً در تشخیص همین فیچرهاست. فرایند استخراج فیچر از داده را در یادگیری ماشین محقق یا مهندس داده انجام میدهد، درحالیکه در یادگیری عمیق خود ماشین باید این فیچرها را به دست آورد.
یادگیری عمیق بر پایهی شبکههای عصبی مصنوعی و بهنوعی نمونهی سادهتری از مغز انسان است؛ بههمین دلیل، بهتنهایی قادر به تشخیص این فیچرهاست.
البته لازم است این موضوع را در نظر بگیریم که برخلاف یادگیری ماشین، یادگیری عمیق به حجم دادهی بسیار زیادی احتیاج دارد.
برای آشنایی بیشتر با یادگیری عمیق و تفاوتهای اساسی آن با یادگیری ماشین مطلب تفاوت یادگیری ماشین و یادگیری عمیق را مطالعه کنید.
سؤال ۳. دانشمند داده یا دانشمند حوزهی تخصصی خود با مهارت کار با داده؟
اگر شما هم از آن دسته افرادی هستید که در رشتههای غیرمرتبط با علم داده یا غیر کامپیوتر تحصیل کردهاید، پس احتمالاً بارها این سؤال در ذهنتان شکل گرفته است که اگر شروع به یادگیری علم داده و تکنیکهای یادگیری ماشین کنید، در آینده به یک دانشمند داده تبدیل خواهید شد یا متخصصی در حوزهی مشخص که مهارت کار با داده را نیز آموخته است. در پاسخ به این سؤال باید بگوییم که کاملاً به خود شخص بستگی دارد.
ممکن است شما بعد از ورود به حوزه علم داده علاقهمند شوید و تصمیم بگیرید در این رشته عمیقتر شوید و بهطور تخصصی همین تخصص را دنبال کنید یا برعکس، تصمیم بگیرید فقط مهارتهای مشخصی را در کار با داده یاد بگیرید و درنهایت از آن دانش در حوزهی تخصصی خود از آن استفاده کنید.
این نکته هم بسیار مهم است که امکان ورود به حوزهی علم داده، با وجود تحصیل در رشتههای غیرمرتبط، هم امکانپذیر است و کار ناممکنی محسوب نمیشود.
حرف آخر
در این مقاله به پرسش های متداول یادگیری ماشین پرداختیم. اگر بعد از خواندن این مطالب تصمیم گرفتهاید یادگیری علم داده و یادگیری ماشین را شروع کنید، بهتر است زودتر کار را شروع کنید. همانطور که گفتیم علم داده جذابترین حرفهی قرن ۲۱ است و یکی از شاخههایی است که پردرآمدترین موقعیتهای شغلی را برای شما ایجاد میکند.
دپارتمان علم داده کافهتدریس، با استفاده از بهترین استادان، کلاسهای علم داده را برگزار میکند. این کلاسها در قالب ۱۶۰ ساعت آموزش کارگاهی و مبتنی بر پروژههای واقعی دیتاساینس برگزار میشود.
شما با شرکت در کلاسهای آنلاین علم داده کافهتدریس، در هر جای ایران که هستید، میتوانید علم داده را یاد بگیرید.
برای آشنایی با کلاسهای آنلاین علم داده کافهتدریس روی این لینک کلیک کنید: