با قضیه حد مرکزی چقدر آشنایی دارید؟ برای یادگیری علم داده و ورود به یکی از جذاب‌ترین و پرتقاضاترین موقعیت‌های شغلی قرن جدید شما نیاز به پیش‌نیازهایی دارید. یکی از این پیش‌نیازها آشنایی با قضیه حد مرکزی است. در این مطلب به‌ٌصورت مفصل قضیه حد مرکزی را توضیح داده‌ایم. همین‌طور می‌توانید به‌صورت رایگان ویدئوی آموزشی رضا شکرزاد با موضوع قضیه حد مرکزی را تماشا کنید.

پیش‌نیازهای یادگیری علم داده: آمار و ریاضی

علم داده یا دیتا ساینس (Data Science) در حال حاضر جذاب‌ترین شغل قرن محسوب می‌شود و پیش‌بینی می‌شود که در درازمدت شغل‌های میانی سازمان‌ها، به‌دلیل پیشرفت چشمگیر این حوزه، حذف شوند؛ بنابراین افراد زیادی تغییر جهت شغلی داده‌اند یا در حال یادگیری تغییرجهت به‌سمت علم داده هستند تا بتوانند وارد این حوزه شوند و به‌نوعی موقعیت شغلی خود را حفظ کنند.

تفاوت آمار و ریاضی و نقش آن در علم داده

برای یادگیری علم داده یکی از پیش‌نیازها داشتن دانش آمار و ریاضی است. فرض آمار و احتمال با ریاضی در این است که در آمار و احتمال ما براساس یک سری فرضیات یا Assumption مشاهدات یا Observations را انجام می‌دهیم تا درنهایت ببینیم که تا چه حد فرضیات‌مان درست یا غلط بوده است؛ درحالی‌که در ریاضی ما مجموعه‌ای از قوانین را داریم که برای همه افراد قابل‌قبول و تأیید شده است و تغییر هم نمی‌کنند. در آمار و احتمال ما براساس اعداد الگوهایی را استخراج می‌کنیم و به‌طور کلی همه‌چیز براساس پدیده‌های طبیعی شکل می‌گیرد. در آمار و احتمال عدم قطعیت وجود دارد و برعکس در ریاضی کاملاً قطعیت وجود دارد.

در آمار و احتمال ما مفهومی به‌نام نمونه داریم که درواقع جامعه‌ی کوچک‌تری از جامعه‌ی اصلی موردبررسی‌مان است. درواقع می‌توان گفت این نمونه یا Sample نماینده‌ی جامعه‌ی اصلی محسوب می‌شود. ما زمانی می‌توانیم به مفهوم آمار و احتمال مراجعه کنیم که تعداد مشاهدات‌مان قابل‌اعتماد باشد؛ یعنی تعداد مشاهدات یا نمونه‌ها در حدی باشد که بتوان روی اطلاعاتی که از آن‌ها استخراج می‌کنیم حساب کنیم.

در آمار و احتمال مفهومی داریم به‌نام قضیه حد مرکزی یا Central Limit Theorem که این موضوع هم تا حدی در علم داده کاربرد دارد و لازم است با آن آشنا باشیم. در این مطلب توضیح مختصری از این مفهوم خواهیم داشت.

قانون اعداد بزرگ

قبل از قضیه حد مرکزی باید با مفهومی به‌نام قانون اعداد بزرگ یا Law of Large Numbers آشنا شویم. این قانون در آمار و احتمال روی این موضوع تأکید می‌کند که هرچقد نمونه‌ی ما بزرگ‌تر باشد، میانگین (Mean) آن به میانگین کل جامعه نزدیک‌تر خواهد شد؛ همچنین براساس این قانون، میانگین واریانس نمونه‌ها هم در طولانی‌مدت و با بزرگ‌شدن نمونه به‌سمت واریانس جامعه می‌رود؛ بنابراین همه‌چیز در آمار و احتمال روی اعداد بزرگ می‌چرخد.

رایگان تماشا کنید: قضیه حد مرکزی

قضیه حد مرکزی یا Central Limit Theorem این موضوع را بیان می‌کند که توزیع متغیرهای تصادفی غیرنرمال با بزرگ‌ترشدن اندازه‌ی نمونه‌ها به توزیع نرمال نزدیک می‌شود. برای اینکه این مفهوم را بهتر درک کنید، ویدئوی زیر را مشاهده کنید. این ویدئو بخشی از مجموعه ویدئوهای پیش‌نیاز علم داده است که رضا شکرزاد تدریس کرده است:

برای آشنایی با دیگر پیش‌نیازهای علم داده حتماً این مطلب را مطالعه کنید:

با متغیرهای تصادفی و توزیع احتمال آشنا شوید!

یادگیری علم داده در کافه‌تدریس

اگر به علم داده علاقه‌مندید و دوست دارید با یادگیری آن فرصت‌های شغلی بی‌شمار، جذاب و پردرآمدی را در داخل و خارج از کشور به روی خود باز کنید، کلاس‌های آنلاین مقدماتی و پیشرفته‌ی علم داده به شما کمک می‌کند تا صفر تا صد این دانش را بیاموزید.

کلاس‌های آنلاین علم داده کافه‌تدریس مبتنی بر کار عملی روی پروژه‌های واقعی علم داده است و به شما امکان می‌دهد علم داده را به‌صورت عملی بیاموزید.

برای آشنایی با کلاس‌های آنلاین علم داده کافه‌تدریس و مشاوره‌ی رایگان درباره‌ی آموزش علم داده روی این لینک کلیک کنید:

کلاس‌های آنلاین علم داده کافه‌تدریس