با قضیه حد مرکزی چقدر آشنایی دارید؟ برای یادگیری علم داده و ورود به یکی از جذابترین و پرتقاضاترین موقعیتهای شغلی قرن جدید شما نیاز به پیشنیازهایی دارید. یکی از این پیشنیازها آشنایی با قضیه حد مرکزی است. در این مطلب بهٌصورت مفصل قضیه حد مرکزی را توضیح دادهایم. همینطور میتوانید بهصورت رایگان ویدئوی آموزشی رضا شکرزاد با موضوع قضیه حد مرکزی را تماشا کنید.
پیشنیازهای یادگیری علم داده: آمار و ریاضی
علم داده یا دیتا ساینس (Data Science) در حال حاضر جذابترین شغل قرن محسوب میشود و پیشبینی میشود که در درازمدت شغلهای میانی سازمانها، بهدلیل پیشرفت چشمگیر این حوزه، حذف شوند؛ بنابراین افراد زیادی تغییر جهت شغلی دادهاند یا در حال یادگیری تغییرجهت بهسمت علم داده هستند تا بتوانند وارد این حوزه شوند و بهنوعی موقعیت شغلی خود را حفظ کنند.
تفاوت آمار و ریاضی و نقش آن در علم داده
برای یادگیری علم داده یکی از پیشنیازها داشتن دانش آمار و ریاضی است. فرض آمار و احتمال با ریاضی در این است که در آمار و احتمال ما براساس یک سری فرضیات یا Assumption مشاهدات یا Observations را انجام میدهیم تا درنهایت ببینیم که تا چه حد فرضیاتمان درست یا غلط بوده است؛ درحالیکه در ریاضی ما مجموعهای از قوانین را داریم که برای همه افراد قابلقبول و تأیید شده است و تغییر هم نمیکنند. در آمار و احتمال ما براساس اعداد الگوهایی را استخراج میکنیم و بهطور کلی همهچیز براساس پدیدههای طبیعی شکل میگیرد. در آمار و احتمال عدم قطعیت وجود دارد و برعکس در ریاضی کاملاً قطعیت وجود دارد.
در آمار و احتمال ما مفهومی بهنام نمونه داریم که درواقع جامعهی کوچکتری از جامعهی اصلی موردبررسیمان است. درواقع میتوان گفت این نمونه یا Sample نمایندهی جامعهی اصلی محسوب میشود. ما زمانی میتوانیم به مفهوم آمار و احتمال مراجعه کنیم که تعداد مشاهداتمان قابلاعتماد باشد؛ یعنی تعداد مشاهدات یا نمونهها در حدی باشد که بتوان روی اطلاعاتی که از آنها استخراج میکنیم حساب کنیم.
در آمار و احتمال مفهومی داریم بهنام قضیه حد مرکزی یا Central Limit Theorem که این موضوع هم تا حدی در علم داده کاربرد دارد و لازم است با آن آشنا باشیم. در این مطلب توضیح مختصری از این مفهوم خواهیم داشت.
قانون اعداد بزرگ
قبل از قضیه حد مرکزی باید با مفهومی بهنام قانون اعداد بزرگ یا Law of Large Numbers آشنا شویم. این قانون در آمار و احتمال روی این موضوع تأکید میکند که هرچقد نمونهی ما بزرگتر باشد، میانگین (Mean) آن به میانگین کل جامعه نزدیکتر خواهد شد؛ همچنین براساس این قانون، میانگین واریانس نمونهها هم در طولانیمدت و با بزرگشدن نمونه بهسمت واریانس جامعه میرود؛ بنابراین همهچیز در آمار و احتمال روی اعداد بزرگ میچرخد.
رایگان تماشا کنید: قضیه حد مرکزی
قضیه حد مرکزی یا Central Limit Theorem این موضوع را بیان میکند که توزیع متغیرهای تصادفی غیرنرمال با بزرگترشدن اندازهی نمونهها به توزیع نرمال نزدیک میشود. برای اینکه این مفهوم را بهتر درک کنید، ویدئوی زیر را مشاهده کنید. این ویدئو بخشی از مجموعه ویدئوهای پیشنیاز علم داده است که رضا شکرزاد تدریس کرده است:
پیشنهاد میکنیم با متغیرهای تصادفی و توزیع احتمال هم آشنا شوید.
یادگیری علم داده در کافهتدریس
اگر به علم داده علاقهمندید و دوست دارید با یادگیری آن فرصتهای شغلی بیشمار، جذاب و پردرآمدی را در داخل و خارج از کشور به روی خود باز کنید، کلاسهای آنلاین مقدماتی و پیشرفتهی علم داده به شما کمک میکند تا صفر تا صد این دانش را بیاموزید.
کلاسهای آنلاین علم داده کافهتدریس مبتنی بر کار عملی روی پروژههای واقعی علم داده است و به شما امکان میدهد علم داده را بهصورت عملی بیاموزید.
برای آشنایی با کلاسهای آنلاین علم داده کافهتدریس و مشاورهی رایگان دربارهی آموزش علم داده روی این لینک کلیک کنید: