پردازش تصویر چیست و چه کاربردهایی دارد؟ یادگیری عمیق در چند سال اخیر بر حوزههای مختلف فناوری تأثیر شگرفی گذاشته است. یکی از داغترین موضوعهایی که در این صنعت مطرح است بینایی ماشین یا Computer Vision است، یعنی توانایی رایانهها برای درک تصاویر و ویدئوها بهتنهایی و بدون کمک انسان. ماشینهای خودران، بیومتریک و تشخیص چهره، همگی، برای عملکرد خود به بینایی ماشین متکی هستند. هستهی اصلی بینایی ماشین، پردازش تصویر یا Image Processing است. در این مطلب به توضیح پردازش تصویر و کاربردهای آن خواهیم پرداخت. اما قبل از هر چیزی بهتر است بدانیم معنای دقیق تصویر چیست؟


تصویر چیست؟
قبل از اینکه به پردازش تصویر بپردازیم، ابتدا باید بفهمیم دقیقاً چه چیزی یک تصویر را تشکیل می دهد. یک تصویر با ابعاد آن (ارتفاع و عرض) براساس تعداد پیکسلها نشان داده میشود؛ برای مثال، اگر ابعاد یک تصویر ۵۰۰ در ۴۰۰ (عرض در ارتفاع) باشد، تعداد کل پیکسلهای تصویر ۲۰۰هزارتاست.
پیکسل نقطهای از تصویر است که سایه، تیرگی یا رنگ خاصی به خود میگیرد. معمولاً در یکی از این موارد نشان داده می شود:
خاکستری
پیکسل یک عدد صحیح با مقدار بین صفر تا ۲۵۵ است که درواقع صفر کاملاً سیاه و ۲۵۵ کاملاً سفید است.
RGB
در این حالت یک پیکسل از ۳ عدد صحیح بین صفر تا ۲۵۵ ساخته شده است. اعداد صحیح نشاندهندهی شدت قرمز، سبز و آبی هستند.
RGBA
یک نوع RGB است که یک فیلد آلفا به آن اضافه شده است که نشاندهندهی میزان تاری یا همان opacity تصویر است.
حال که با تصویر آشنا شدیم و متوجه شدیم که یک تصویر از چه اجزایی تشکیل میشود، به سراغ موضوع اصلی، یعنی پردازش تصویر یا همان Image Processing، میرویم.
پردازش تصویر چیست؟
پردازش تصویر فرایند تبدیل یک تصویر به یک فرم دیجیتال وانجامدادن عملیات خاصی روی آن، برای بهدستآوردن اطلاعات مفید از آن است. سیستم پردازش تصویر معمولاً هنگام استفاده از روشهای پردازش سیگنال همهی تصاویر را بهعنوان سیگنالهای دوبعدی در نظر میگیرد. درواقع پردازش تصویر یک نوع پردازش سیگنال است که در آن ورودی یک تصویر است و خروجی ممکن است تصویر یا ویژگیهای مرتبط با آن تصویر باشد.
برای آشنایی با بینایی ماشین این مطلب را مطالعه کنید:
بینایی ماشین (Computer Vision) چیست و چه کاربردهایی دارد؟
انواع پردازش تصویر
اما پردازش تصویر چند نوع دارد؟ در ادامه به این سؤال پاسخ خواهیم داد. بهطور کلی پنج نوع پردازش تصویر وجود دارد:
- تجسم یا Visualization: یافتن اشیایی که در تصویر قابلمشاهده نیستند.
- شناسایی یا Recognition: تشخیص اشیا در تصویر.
- شارپکردن و بازیابی یا Sharpening & Restroration: ایجاد یک تصویر بهبودیافته از تصویر اصلی.
- شناسایی الگو یا Pattern Recognition: اندازهگیری الگوهای مختلف اطراف اشیا در تصویر.
- بازیابی یا Retrieval: جستوجوی تصاویر از پایگاه داده بزرگی از تصاویر دیجیتال که مشابه تصویر اصلی هستند.
مرحلههای اساسی پردازش تصویر
مرحلههای اساسی پردازش تصویر از این قرار است:
تهیه تصویر
جمعآوری تصویر اولین گام در کار پردازش تصویر است. این مرحله بهعنوان پیشپردازش در پردازش تصویر نیز شناخته میشود که شامل بازیابی تصویر از یک منبع است.
بهبود کیفیت عکس
بهبود کیفیت تصویر فرایند برجستهکردن برخی از ویژگیهای مدنظر در تصویر است که خیلی واضح نیستند. این عملیات میتواند شامل تغییر روشنایی یا کنتراست عکس (Contrast) و غیره باشد.


بازیابی تصویر یا Image Restoration
بازیابی تصویر فرایند بهبود ظاهر یک تصویر است. این نکته مهم است که برخلاف بهبود تصویر، بازیابی تصویر با استفاده از مدلهای ریاضی یا احتمالی خاصی انجام میشود.
پردازش تصویر رنگی
پردازش تصاویر رنگی شامل تعدادی تکنیک مدلسازی رنگ میشود. این مرحله بهدلیل استفاده قابلتوجه از تصاویر دیجیتال در اینترنت اهمیت پیدا کرده است.
فشردهسازی
فشردهسازی یا Compression فرایندی است که برای کاهش فضای ذخیرهسازی موردنیاز برای ذخیرهی یک تصویر یا پهنای باند موردنیاز برای انتقال آن استفاده میشود. این کار بهویژه زمانی انجام میشود که تصویر برای استفاده در اینترنت باشد.
پردازش مورفولوژیکی
پردازش مورفولوژیکی مجموعهای از عملیات پردازش برای شکلدادن تصاویر براساس شکل آنهاست. در پردازش مورفولوژیکی تصاویر پیکسلها به تصاویر اضافه یا از آن حذف میشوند. ساختار و شکل اشیا تجزیهوتحلیل میشود تا بتوان آنها را شناسایی کرد.
بخشبندی یا Segmentation
بخشبندی یکی از دشوارترین مرحلههای پردازش تصویر است که تقسیم یک تصویر به اجزا یا اشیای تشکیلدهندهی آن را شامل است. اگر علاقهمند به مطالعهی بیشتر دربارهی بخشبندی تصویر هستید، پیشنهاد میکنیم این مطلب را مطالعه کنید:
بخشبندی تصویر یا Image Segmentation چیست؟


نمایش و شرح یا Representation & Description
پس از اینکه یک تصویر در فرایند بخشبندی به بخشهای مختلف تقسیم شد، هر بخش به فرمی مناسب نمایش داده میشود تا برای پردازش کامپیوتری مناسب باشد. درواقع تصاویر را در محاسبات میتوان با استفاده از روشهای مختلفی نشان داد. نمایش عکس به کدکردن دیجیتالی اطلاعات آن و همچنین نحوهی ذخیرهی اطلاعات، مانند اطلاعات رنگ تصویر، اشاره میکند. شرح یا Description به استخراج اطلاعات کمّی میپردازد که به تمایز یک کلاس از کلاسهای دیگر کمک میکند.
شناسایی یا Recognition
در عملیات شناسایی براساس توضیحات یک شیء برچسبی به آن اختصاص داده میشود.
کاربردهای پردازش تصویر
تا اینجا با پردازش تصویر و مرحلههای انجامدادن آن آشنا شدیم. حال لازم است بدانیم که پردازش تصویر در چه جاهایی استفاده میشود.
بازیابی تصاویر پزشکی
پردازش تصویر بهطور گستردهای در تحقیقات پزشکی استفاده شده و برنامههای درمانی کارآمدتر و دقیقتری را امکانپذیر کرده است؛ برای مثال، میتوان از آن برای تشخیص زودهنگام سرطان سینه با استفاده از یک الگوریتم پیچیدهی تشخیص گره در اسکن آن استفاده کرد. از آنجا که استفادهی پزشکی مستلزم پردازشگرهای تصویر آموزشدیدهی پیشرفته است، این برنامهها قبل از اینکه برای استفاده پذیرفته شوند، به ارزیابی چشمگیری نیاز دارند.
فناوریهای سنجش ترافیک
در سنسورهای ترافیک از سیستم پردازش تصویر ویدئویی یا VIPS استفاده میکنیم. این سیستم شامل یک سیستم تصویربرداری، یک سیستم مخابراتی و یک سیستم پردازش تصویر است. هنگام ضبط ویدئو یک VIPS چندین منطقهی تشخیص دارد که هر زمان که وسیلهی نقلیه به آن منطقه وارد میشود سیگنال «روشن» و سپس هر زمان که وسیلهی نقلیه از منطقهی تشخیص خارج می شود، سیگنال «خاموش» صادر میکند؛ علاوهبراین، این سیستم میتواند پلاک خودرو را بهصورت خودکار ضبط کند، نوع وسیلهی نقلیه را تشخیص دهد، سرعت راننده را در بزرگراه کنترل کند و موارد دیگر اینچنینی.


بازسازی تصویر یا Image Reconstruction
از پردازش تصویر میتوان برای بازیابی و پرکردن قسمتهای گمشده یا خراب یک تصویر استفاده کرد. این عملیات شامل استفاده از سیستمهای پردازش تصویر است که بهطور گسترده با مجموعهدادههای عکس موجود برای ایجاد نسخههای جدیدتر از عکسهای قدیمی و آسیبدیده آموزش دیدهاند.


شناسایی چهره یا Face Detection
یکی از رایجترین کاربردهای پردازش تصویر که امروزه از آن استفاده می کنیم تشخیص چهره است. این سیستم از الگوریتمهای یادگیری عمیق استفاده می کند که در آن ابتدا دستگاه با ویژگیهای خاص صورت انسان، مانند شکل صورت، فاصلهی میان چشمها و غیره، آموزش داده میشود. پس از آموزش این ویژگیهای صورت انسان به دستگاه، هر جسمی را که در تصویر بهنوعی صورت انسان را تداعی کند می پذیرد. تشخیص چهره ابزاری حیاتی است که در امنیت، بیومتریک و حتی فیلترهای موجود در اکثر برنامههای رسانههای اجتماعی این روزها استفاده میشود.


حرف آخر دربارهی پردازش تصویر و کاربردهای آن
رشد فناوریهای یادگیری عمیق به شتاب سریع حوزهی بینایی ماشین در پروژههای متن باز انجامیده است که این موضوع نیاز به ابزارهای پردازش تصویر را افزایش داده است. تقاضا برای استخدام متخصصان با مهارتهای کلیدی در حوزهی یادگیری عمیق هر سال با سرعت زیادی رشد میکند؛ بنابراین بسیاری از افراد شروع به یادگیری این مهارت کرده و مسیر شغلی و تحصیلی خود را تغییر دادهاند. اگر شما نیز علاقهمند به یادگیری مهارتهای یادگیری ماشین و یادگیری عمیق هستید، دورههای علم داده کافهتدریس را از دست ندهید: