پردازش تصویر چیست و چه کاربردهایی دارد؟ یادگیری عمیق در چند سال اخیر بر حوزه‌های مختلف فناوری تأثیر شگرفی گذاشته است. یکی از داغ‌ترین موضوع‌هایی که در این صنعت مطرح است بینایی ماشین یا Computer Vision است، یعنی توانایی رایانه‌ها برای درک تصاویر و ویدئوها به‌تنهایی و بدون کمک انسان. ماشین‌های خودران، بیومتریک و تشخیص چهره، همگی، برای عملکرد خود به بینایی ماشین متکی هستند. هسته‌ی اصلی بینایی ماشین، پردازش تصویر یا Image Processing است. در این مطلب به توضیح پردازش تصویر و کاربردهای آن خواهیم پرداخت. اما قبل از هر چیزی بهتر است بدانیم معنای دقیق تصویر چیست؟

پردازش تصویر چیست و کاربردهای آن کجاست!

تصویر چیست؟

قبل از اینکه به پردازش تصویر بپردازیم، ابتدا باید بفهمیم دقیقاً چه چیزی یک تصویر را تشکیل می دهد. یک تصویر با ابعاد آن (ارتفاع و عرض) براساس تعداد پیکسل‌ها نشان داده می‌شود؛ برای مثال، اگر ابعاد یک تصویر ۵۰۰ در ۴۰۰ (عرض در ارتفاع) باشد، تعداد کل پیکسل‌های تصویر ۲۰۰هزارتاست.

پیکسل نقطه‌ای از تصویر است که سایه، تیرگی یا رنگ خاصی به خود می‌گیرد. معمولاً در یکی از این موارد نشان داده می شود:

خاکستری

پیکسل یک عدد صحیح با مقدار بین صفر تا ۲۵۵ است که درواقع صفر کاملاً سیاه و ۲۵۵ کاملاً سفید است.

RGB

در این حالت یک پیکسل از ۳ عدد صحیح بین صفر تا ۲۵۵ ساخته شده است. اعداد صحیح نشان‌دهنده‌ی شدت قرمز، سبز و آبی هستند.

RGBA

یک نوع RGB است که یک فیلد آلفا به آن اضافه شده است که نشان‌دهنده‌ی میزان تاری یا همان opacity تصویر است.

حال که با تصویر آشنا شدیم و متوجه شدیم که یک تصویر از چه اجزایی تشکیل می‌شود، به سراغ موضوع اصلی، یعنی پردازش تصویر یا همان Image Processing، می‌رویم.

پردازش تصویر چیست؟

پردازش تصویر فرایند تبدیل یک تصویر به یک فرم دیجیتال وانجام‌دادن عملیات خاصی روی آن، برای به‌دست‌آوردن اطلاعات مفید از آن است. سیستم پردازش تصویر معمولاً هنگام استفاده از روش‌های پردازش سیگنال همه‌ی تصاویر را به‌عنوان سیگنال‌های دوبعدی در نظر می‌گیرد.  درواقع پردازش تصویر یک نوع پردازش سیگنال است که در آن ورودی یک تصویر است و خروجی ممکن است تصویر یا ویژگی‌های مرتبط با آن تصویر باشد.

برای آشنایی با بینایی ماشین این مطلب را مطالعه کنید:

بینایی ماشین (Computer Vision) چیست و چه کاربردهایی دارد؟

انواع پردازش تصویر

اما پردازش تصویر چند نوع دارد؟‌ در ادامه به این سؤال پاسخ خواهیم داد. به‌طور کلی پنج نوع پردازش تصویر وجود دارد:

  • تجسم یا Visualization: یافتن اشیایی که در تصویر قابل‌مشاهده نیستند.
  • شناسایی یا  Recognition: تشخیص اشیا در تصویر.
  • شارپ‌کردن و بازیابی یا Sharpening & Restroration: ایجاد یک تصویر بهبودیافته از تصویر اصلی.
  • شناسایی الگو یا Pattern Recognition: اندازه‌گیری الگوهای مختلف اطراف اشیا در تصویر.
  • بازیابی یا Retrieval: جست‌وجوی تصاویر از پایگاه داده بزرگی از تصاویر دیجیتال که مشابه تصویر اصلی هستند.

مرحله‌های اساسی پردازش تصویر

مرحله‌های اساسی پردازش تصویر از این قرار است:

تهیه تصویر

جمع‌آوری تصویر اولین گام در کار پردازش تصویر است. این مرحله به‌عنوان پیش‌پردازش در پردازش تصویر نیز شناخته می‌شود که شامل بازیابی تصویر از یک منبع است.

بهبود کیفیت عکس

بهبود کیفیت تصویر فرایند برجسته‌کردن برخی از ویژگی‌های مدنظر در تصویر است که خیلی واضح نیستند. این عملیات می‌تواند شامل تغییر روشنایی یا کنتراست عکس (Contrast) و غیره باشد.

بهبود کیفیت عکس

بازیابی تصویر یا Image Restoration

بازیابی تصویر فرایند بهبود ظاهر یک تصویر است. این نکته مهم است که برخلاف بهبود تصویر، بازیابی تصویر با استفاده از مدل‌های ریاضی یا احتمالی خاصی انجام می‌شود.

پردازش تصویر رنگی

پردازش تصاویر رنگی شامل تعدادی تکنیک مدل‌سازی رنگ می‌شود. این مرحله به‌دلیل استفاده قابل‌توجه از تصاویر دیجیتال در اینترنت اهمیت پیدا کرده است.

فشرده‌سازی

فشرده‌سازی یا Compression فرایندی است که برای کاهش فضای ذخیره‌سازی موردنیاز برای ذخیره‌ی یک تصویر یا پهنای باند موردنیاز برای انتقال آن استفاده می‌شود. این کار به‌ویژه زمانی انجام می‌شود که تصویر برای استفاده در اینترنت باشد.

پردازش مورفولوژیکی

پردازش مورفولوژیکی مجموعه‌ای از عملیات پردازش برای شکل‌دادن تصاویر براساس شکل آن‌هاست. در پردازش مورفولوژیکی تصاویر پیکسل‌ها به تصاویر اضافه یا از آن حذف می‌شوند. ساختار و شکل اشیا تجزیه‌وتحلیل می‌شود تا بتوان آن‌ها را شناسایی کرد.

بخش‌بندی یا Segmentation

بخش‌بندی یکی از دشوارترین مرحله‌های پردازش تصویر است  که تقسیم یک تصویر به اجزا یا اشیای تشکیل‌دهنده‌ی آن را شامل است. اگر علاقه‌مند به مطالعه‌ی بیشتر درباره‌ی بخش‌بندی تصویر هستید، پیشنهاد می‌کنیم این مطلب را مطالعه کنید:

بخش‌بندی تصویر یا Image Segmentation چیست؟

نمایش-و-شرح-یا-Representation-Description

نمایش و شرح یا Representation & Description

پس از اینکه یک تصویر در فرایند بخش‌بندی به بخش‌های مختلف تقسیم شد، هر بخش به فرمی مناسب نمایش داده می‌شود تا برای پردازش کامپیوتری مناسب باشد. درواقع تصاویر را در محاسبات می‌توان با استفاده از روش‌های مختلفی نشان داد. نمایش عکس به کدکردن دیجیتالی اطلاعات آن و همچنین نحوه‌ی ذخیره‌ی اطلاعات، مانند اطلاعات رنگ  تصویر، اشاره می‌کند. شرح یا Description به استخراج اطلاعات کمّی می‌پردازد که به تمایز یک کلاس از کلاس‌های دیگر کمک می‌کند.

شناسایی یا Recognition

در عملیات شناسایی براساس توضیحات یک شیء برچسبی به آن اختصاص داده می‌شود.

کاربردهای پردازش تصویر

تا اینجا با پردازش تصویر و مرحله‌های انجام‌دادن آن آشنا شدیم. حال لازم است بدانیم که پردازش تصویر در چه جاهایی استفاده می‌شود.

بازیابی تصاویر پزشکی

پردازش تصویر به‌طور گسترده‌ای در تحقیقات پزشکی استفاده شده و برنامه‌های درمانی کارآمدتر و دقیق‌تری را امکان‌پذیر کرده است؛ برای مثال، می‌توان از آن برای تشخیص زودهنگام سرطان سینه با استفاده از یک الگوریتم پیچیده‌ی تشخیص گره در اسکن آن استفاده کرد. از آنجا که استفاده‌ی پزشکی مستلزم پردازشگرهای تصویر آموزش‌دیده‌ی پیشرفته است، این برنامه‌ها قبل از اینکه برای استفاده پذیرفته شوند، به ارزیابی چشمگیری نیاز دارند.

فناوری‌های سنجش ترافیک

در سنسورهای ترافیک از سیستم پردازش تصویر ویدئویی یا VIPS استفاده می‌کنیم. این  سیستم شامل یک سیستم تصویربرداری، یک سیستم مخابراتی و یک سیستم پردازش تصویر است. هنگام ضبط ویدئو یک VIPS چندین منطقه‌ی تشخیص دارد که هر زمان که وسیله‌ی نقلیه به آن منطقه وارد می‌شود سیگنال «روشن» و سپس هر زمان که وسیله‌ی نقلیه از منطقه‌ی تشخیص خارج می شود، سیگنال «خاموش» صادر می‌کند؛ علاوه‌براین، این سیستم می‌تواند پلاک خودرو را به‌صورت خودکار ضبط کند، نوع وسیله‌ی نقلیه را تشخیص دهد، سرعت راننده را در بزرگراه کنترل کند و موارد دیگر این‌‌چنینی.

فناوری‌های سنجش ترافیک
در سمت چپ تصویر‌برداری عادی ترافیک را می‌بینید، درحالی‌که سمت راست یک تصویر VIPS  را با مناطق تشخیص قابل مشاهده است.

بازسازی تصویر یا Image Reconstruction

از پردازش تصویر می‌توان برای بازیابی و پرکردن قسمت‌های گمشده یا خراب یک تصویر استفاده کرد. این عملیات شامل استفاده از سیستم‌های پردازش تصویر است که به‌طور گسترده با مجموعه‌داده‌های عکس موجود برای ایجاد نسخه‌های جدیدتر از عکس‌های قدیمی و آسیب‌دیده آموزش دیده‌اند.

بازسازی تصویر یا Image Reconstruction
بازسازی تصاویر آسیب‌دیده با استفاده از پردازش تصویر

شناسایی چهره یا Face Detection

یکی از رایج‌ترین کاربردهای پردازش تصویر که امروزه از آن استفاده می کنیم تشخیص چهره است. این سیستم از الگوریتم‌های یادگیری عمیق استفاده می کند که در آن ابتدا دستگاه با ویژگی‌های خاص صورت انسان، مانند شکل صورت، فاصله‌ی میان چشم‌ها و غیره، آموزش داده می‌شود. پس از آموزش این ویژگی‌های صورت انسان به دستگاه، هر جسمی را که در تصویر به‌نوعی صورت انسان را تداعی کند می پذیرد. تشخیص چهره ابزاری حیاتی است که در امنیت، بیومتریک و حتی فیلترهای موجود در اکثر برنامه‌های رسانه‌های اجتماعی این روزها استفاده می‌شود.

شناسایی چهره یا Face Detection با پردازش تصویر

حرف آخر درباره‌ی پردازش تصویر و کاربردهای آن

رشد فناوری‌های یادگیری عمیق به شتاب سریع حوزه‌ی بینایی ماشین در پروژه‌های متن باز انجامیده است که این موضوع نیاز به ابزارهای پردازش تصویر را افزایش داده است. تقاضا برای استخدام متخصصان با مهارت‌های کلیدی در حوزه‌ی یادگیری عمیق هر سال با سرعت زیادی رشد می‌کند؛ بنابراین بسیاری از افراد شروع به یادگیری این مهارت کرده و مسیر شغلی و تحصیلی خود را تغییر داده‌اند. اگر شما نیز علاقه‌مند به یادگیری مهارت‌های یادگیری ماشین و یادگیری عمیق هستید، دوره‌های علم داده کافه‌تدریس را از دست ندهید:

کلاس‌های آنلاین علم داده کافه‌تدریس