بایدهای بایدهای دیتا ساینتیست شدن چیست؟ اگر تابهحال بارها به سراغ یادگیری علم داده رفتهاید، اما احساس کردهاید کار خیلی دشواری است و از پسش برنخواهید آمد، بهتر است این مطلب را تا انتها مطالعه کنید و بار دیگر درمورد تصمیم خود فکر کنید.
بایدهای دیتا ساینتیست شدن چیست؟
اگر دوست دارید دانشمند داده شوید و در حوزههای مختلف دیتا ساینس مشغول به کار شوید، پیش از اینکه هر تصمیمی بگیرید با این بایدهای دیتا ساینتیست شدن آشنا شوید:
۱. علم داده اصطلاح مبهم است؛ بر همین اساس با آن برخورد کنید!
علم داده تقریباً میتواند هر کار کمّی را دربرگیرد. دو دانشمند داده در شرکتهای مختلف یا حتی در یک شرکت میتوانند کارهای کاملاً متفاوتی را انجام دهند. این رشته بهتدریج به عنوانهای شغلی خاصتری، مانند مهندس داده، تحلیلگر داده، مهندس یادگیری ماشین و غیره، تبدیل شده است. این روند تخصصیشدن قطعاً در آینده سرعت بیشتری خواهد گرفت؛ بنابراین، وقتی درمورد علم داده صحبت میکنید یا برای مشاغل درخواست میکنید، سعی کنید این را در نظر بگیرید که تعریف خاص علم داده برای آن موقعیت شغلی چیست و مطمئن شوید با تعریف شما مطابقت دارد.
بهطور کلی، اینکه بدانیم در نقش یک دانشمند داده خاص انجامدادن چه وظایفی از ما انتظار میرود، بسیار اهمیت دارد. آیا به نوشتن کدی نیاز دارید که در یک سیستم تولیدی کار میکند؟ آیا به ایجاد پایپلاین (Pipeline) داده نیاز دارید؟ آیا تجزیهوتحلیل دادههای آفلاین را انجام خواهید داد و اگر چنین است، چه نوع تحلیلهایی مدنظر است؟
پیبردن به اینکه چه وظایفی را بر عهده خواهید داشت اغلب بهتر از خواندن شرح موقعیت شغلی است که در آگهی نوشته شده است؛ زیرا شرح شغل بیشتر برای جذب طیف وسیعی از نامزدها برای یک موقعیت نوشته میشود تا اینکه واقعاً به جزئیات آنچه شغل مستلزم آن است بپردازد.
۲. سندروم ایمپاستر بخشی طبیعی از کار است!
هر دانشمند داده سندروم ایمپاستر را تجربه میکند؛ زیرا همیشه چیزهایی وجود دارد که نمیداند. همانطور که گفتیم، این حوزه تعریف مبهمی دارد؛ بنابراین تعداد بسیار زیادی از موضوعات وجود دارد که میتوان آنها را تحت تعریف «علم داده» قرار داد.
اگر وبلاگها یا سایت Quora را مطالعه کنید، این احساس را به شما القا میکند که باید در سطح جهانی در کارتان خوب و حرفهای باشید و همهی مهارتهای یک مختصص آمار، دکتری استنفورد، یک مهندس Google-calibur و یک متخصص کسبوکار درجهیک McKinsey، را با هم داشته باشید. واقعیت این است که هیچکس در همهی حوزهها دانش کاملی ندارد.
حتی اگر بهنحوی جادویی در همهی مهارتها عالی بودید، فقط از زیرمجموعهای از آن مهارتها برای هر پروژه استفاده میکردید و مهارتهایی را که استفاده نمیکردید بهمرور از دست میدادید.
تنها کاری که برای تبدیلشدن به یک دانشمند داده خوب باید انجام دهید این است که راهی برای استفاده از دادهها پیدا کنید که درنهایت مفید واقع شوند. برای این کار هم راههای مختلفی وجود دارد.
مشکلی ندارد اگر هر از گاهی احساس سندروم ایمپاستر داشته باشید؛ فقط این را بدانید که این موضوع کاملاً طبیعی است و اجازه ندهید شما را ناامید کند؛ درعوض، سعی کنید موقعیتهایی را که در آن چیز جدیدی برای یادگیری دارید بهعنوان فرصتهای رشد در نظر بگیرید. زمانی هم که با شخص دیگری روبهرو شدید که کاری را که شما انجام میدهید بلد نیست، این احساسی را که الان دارید در ذهن داشته باشید.
۳. مجبور نیستید همه ابزارها را بشناسید!
Hadoop، Spark، Yarn، Julia، Kafka، Airflow، Scalding، Redshift، Hive، TensorFlow، Kubernetes و غیره؛ تعداد زیادی زبانهای برنامهنویسی، فریمورکها (Frameworks) و ابزارهای متنوع دیگری برای کار در حوزه علم داده وجود دارد و این اسامی فقط بخشی از آنهاست. شاید در ابتدا به نظر برسد باید همهی آنها را بشناسید تا یک دانشمند داده واقعی باشید. خوشبختانه، میتوانید با خیال راحت ۹۹ درصد از ابزارهای علم داده را نادیده بگیرید.
درنهایت، شرکت شما مجموعهای از ابزارهای خاص خود را خواهد داشت. همه افراد شرکت بهمرور استفاده از این ابزارها را یاد خواهند گرفت و درمورد اکثر ابزارهای دیگر کاملاً بیاطلاع خواهند بود؛ بهعلاوه، هیچ شرکت خوبی اهمیت نمیدهد که قبلاً از مجموعهابزارهای خاص آنها استفاده کرده باشید یا نه، مگر اینکه برای یک موقعیت شغلی واقعاً تخصصی اقدام کرده باشید.
برای قبولی در مصاحبه فقط باید اطلاعات کافی داشته باشید؛ مجموعه کوچکی از ابزارهایی را که برای شما مناسب هستند انتخاب و با آنها کار کنید.
پیشنهاد میکنیم پرسشهای متداول علم داده را مطالعه کنید.
۴. ابزارهای اولیه خود را به خوبی یاد بگیرید!
این اصل یکی از بایدهای دیتاساینتیست شدن است. لازم نیست همهی ابزارهای مورداستفاده در حوزهی علم داده را بشناسید و با آنها کار کرده باشید، اما باید به ابزارهای اساسی که روزانه از آنها استفاده میکنید عمیقاً مسلط شوید.
۵. شما در یک حوزه متخصص هستید، نه فقط در روشهای کار با داده!
دانشمندان داده زمانی بیشترین تأثیر را میگذارند که دانش عمیق حوزهای را که در آن کار میکنند با ابزارهای آماری و مهندسی مناسب برای تصمیمگیری بهتر یا محصولات دادهای مفید ترکیب کنند.
اکثر دانشمندان داده بهاندازهی کافی بهسمت مسیر تحلیل تجاری متمایل نیستند. آنان عاشق استفاده از تکنیکهای تحلیل داده هستند، اما روی یادگیری درمورد حوزهی کاری خود سرمایهگذاری زمانی کمتری میکنند. آنان به کنفرانسهای یادگیری ماشین میروند، اما بهندرت در کنفرانسهایی مانند بازاریابی یا ریسک شرکت میکنند. بسیاری از دانشمندان داده حتی متوجه نیستند که حوزهی مشخصی دارند که در آن مشغولبهکار هستند؛ بنابراین سعی کنید وقت بیشتری را به این کار اختصاص دهید.
میتوانید از شرکای تجاری خود یا با صحبت با تیمهای مشابه در شرکتهای دیگر درمورد حوزهی خود اطلاعات کسب کنید و بدانید که این بخشی از وظایف شماست.
پیشنهاد میکنیم پرسشهای متداول یادگیری ماشین را مطالعه کنید.
۶. تفکر انتقادی را فراموش نکنید!
این اصل هم از بایدهای دیتاساینتیست شدن است. بخش مهمی از هر شغلی تعیین این است که چه چیزی مهم است و چه چیزی مهم نیست. ممکن است تجزیهوتحلیل کاملی انجام دهید، اما بعدها مشخص شود مشکل اشتباهی را حل کردهاید یا بینش شما اجرایی نیست. اینجا دیگر مهم نیست چقدر تجزیهوتحلیل شما خوب بوده است؛ بنابراین لازم است وقت خود را برای فکرکردن دربارهی موضوعات گستردهتر صرف کنید؛ مثلاً مهمترین چالشهای تیم شما چیست و چرا؟ آیا نقشهراه فعلی شما بهترین راه برای کمک به تیمتان است یا باید برنامهی خود را تغییر دهید؟
پاسخ به این سؤالات میتواند در طول زمان تغییر کند؛ بنابراین مهم است که بهطور منظم آنها را بررسی کنید.
جمعبندی دربارهی بایدهای دیتا ساینتیست شدن
اگر به ورود به دنیای علم داده علاقهمند هستید و بارها پیشنیازهای این حوزه را در وبسایتهای مختلف بررسی کردهاید و نگران شدهاید که آیا از پس آن برخواهید آمد یا نه، فراموش نکنید که شرکتها از شما انتظار ندارند که تمامی ابزارهای موجود را بلد باشید و با آنها کار کرده کنید؛ کافی است روی چند ابزار خاص متمرکز شوید و شروع به یادگیری کنید.
پیشنهاد میکنیم درباره درآمد دیتا ساینتیست ها بخوانید.
یادگیری دیتا ساینس با کلاسهای آنلاین آموزش علم داده کافه تدریس
اگر شما هم دوست دارید به دنیای جذاب علم داده وارد شوید، پیشنهاد ما شرکت در کلاسهای آنلاین آموزش علم داده کافهتدریس است.
کلاسهای آنلاین علم داده کافهتدریس بهصورت کاملاً تعاملی و پویا و بهشکل کارگاهی و کار روی پروژههای واقعی علم داده برگزار میشود.
شرکت در کلاسهای مقدماتی و پیشرفته علم داده کافهتدریس به شما امکان میدهد از هر نقطهی جغرافیایی به بهروزترین و جامعترین آموزش دیتا ساینس دسترسی داشته باشید و صفر تا صد این دانش را بیاموزید.
برای آشنایی با کلاسهای آنلاین آموزش علم داده کافهتدریس و مشاورهی رایگان برای شروع یادگیری دیتا ساینس روی این لینک کلیک کنید: