پردازش تصویر چیست و چه کاربردهایی دارد؟ یادگیری عمیق در چند سال اخیر بر حوزههای مختلف فناوری تأثیر شگرفی گذاشته است. یکی از داغترین موضوعهایی که در این صنعت مطرح است بینایی ماشین یا Computer Vision است، یعنی توانایی رایانهها برای درک تصاویر و ویدئوها بهتنهایی و بدون کمک انسان. ماشینهای خودران، بیومتریک و تشخیص چهره، همگی، برای عملکرد خود به بینایی ماشین متکی هستند. هستهی اصلی بینایی ماشین، پردازش تصویر یا Image Processing است. در این مطلب به توضیح پردازش تصویر و کاربردهای آن خواهیم پرداخت. اما قبل از هر چیزی بهتر است بدانیم معنای دقیق تصویر چیست؟
تصویر چیست؟
قبل از پرداختن به پرسش پردازش تصویر چیست، ابتدا باید بفهمیم دقیقاً چه چیزی یک تصویر را تشکیل می دهد. یک تصویر با ابعاد آن (ارتفاع و عرض) براساس تعداد پیکسلها نشان داده میشود؛ برای مثال، اگر ابعاد یک تصویر ۵۰۰ در ۴۰۰ (عرض در ارتفاع) باشد، تعداد کل پیکسلهای تصویر ۲۰۰هزارتاست.
پیکسل نقطهای از تصویر است که سایه، تیرگی یا رنگ خاصی به خود میگیرد. معمولاً در یکی از این موارد نشان داده می شود:
خاکستری
پیکسل یک عدد صحیح با مقدار بین صفر تا ۲۵۵ است که درواقع صفر کاملاً سیاه و ۲۵۵ کاملاً سفید است.
RGB
در این حالت یک پیکسل از ۳ عدد صحیح بین صفر تا ۲۵۵ ساخته شده است. اعداد صحیح نشاندهندهی شدت قرمز، سبز و آبی هستند.
RGBA
یک نوع RGB است که یک فیلد آلفا به آن اضافه شده است که نشاندهندهی میزان تاری یا همان opacity تصویر است.
حال که با تصویر آشنا شدیم و متوجه شدیم که یک تصویر از چه اجزایی تشکیل میشود، به سراغ موضوع اصلی، یعنی پردازش تصویر یا همان Image Processing، میرویم.
پردازش تصویر چیست؟
پردازش تصویر فرایند تبدیل یک تصویر به یک فرم دیجیتال وانجامدادن عملیات خاصی روی آن، برای بهدستآوردن اطلاعات مفید از آن است. سیستم پردازش تصویر معمولاً هنگام استفاده از روشهای پردازش سیگنال همهی تصاویر را بهعنوان سیگنالهای دوبعدی در نظر میگیرد. درواقع پردازش تصویر یک نوع پردازش سیگنال است که در آن ورودی یک تصویر است و خروجی ممکن است تصویر یا ویژگیهای مرتبط با آن تصویر باشد.
پیشنهاد میکنیم با بینایی ماشین (Computer Vision) بیشتر آشنا شوید.
انواع پردازش تصویر
اما پردازش تصویر چند نوع دارد؟ در ادامه به این سؤال پاسخ خواهیم داد. بهطور کلی پنج نوع پردازش تصویر وجود دارد:
- تجسم یا Visualization: یافتن اشیایی که در تصویر قابلمشاهده نیستند.
- شناسایی یا Recognition: تشخیص اشیا در تصویر.
- شارپکردن و بازیابی یا Sharpening & Restroration: ایجاد یک تصویر بهبودیافته از تصویر اصلی.
- شناسایی الگو یا Pattern Recognition: اندازهگیری الگوهای مختلف اطراف اشیا در تصویر.
- بازیابی یا Retrieval: جستوجوی تصاویر از پایگاه داده بزرگی از تصاویر دیجیتال که مشابه تصویر اصلی هستند.
مرحلههای اساسی پردازش تصویر
مرحلههای اساسی پردازش تصویر از این قرار است:
تهیه تصویر
جمعآوری تصویر اولین گام در کار پردازش تصویر است. این مرحله بهعنوان پیشپردازش در پردازش تصویر نیز شناخته میشود که شامل بازیابی تصویر از یک منبع است.
بهبود کیفیت عکس
بهبود کیفیت تصویر فرایند برجستهکردن برخی از ویژگیهای مدنظر در تصویر است که خیلی واضح نیستند. این عملیات میتواند شامل تغییر روشنایی یا کنتراست عکس (Contrast) و غیره باشد.
بازیابی تصویر یا Image Restoration
بازیابی تصویر فرایند بهبود ظاهر یک تصویر است. این نکته مهم است که برخلاف بهبود تصویر، بازیابی تصویر با استفاده از مدلهای ریاضی یا احتمالی خاصی انجام میشود.
پردازش تصویر رنگی
پردازش تصاویر رنگی شامل تعدادی تکنیک مدلسازی رنگ میشود. این مرحله بهدلیل استفاده قابلتوجه از تصاویر دیجیتال در اینترنت اهمیت پیدا کرده است.
فشردهسازی
فشردهسازی یا Compression فرایندی است که برای کاهش فضای ذخیرهسازی موردنیاز برای ذخیرهی یک تصویر یا پهنای باند موردنیاز برای انتقال آن استفاده میشود. این کار بهویژه زمانی انجام میشود که تصویر برای استفاده در اینترنت باشد.
پردازش مورفولوژیکی
پردازش مورفولوژیکی مجموعهای از عملیات پردازش برای شکلدادن تصاویر براساس شکل آنهاست. در پردازش مورفولوژیکی تصاویر پیکسلها به تصاویر اضافه یا از آن حذف میشوند. ساختار و شکل اشیا تجزیهوتحلیل میشود تا بتوان آنها را شناسایی کرد.
بخشبندی یا Segmentation
بخشبندی یکی از دشوارترین مرحلههای پردازش تصویر است که تقسیم یک تصویر به اجزا یا اشیای تشکیلدهندهی آن را شامل است. اگر علاقهمند به مطالعهی بیشتر درباره بخشبندی تصویر هستید، پیشنهاد میکنیم مطلب بخشبندی تصویر یا Image Segmentation را مطالعه کنید.
نمایش و شرح یا Representation & Description
پس از اینکه یک تصویر در فرایند بخشبندی به بخشهای مختلف تقسیم شد، هر بخش به فرمی مناسب نمایش داده میشود تا برای پردازش کامپیوتری مناسب باشد. درواقع تصاویر را در محاسبات میتوان با استفاده از روشهای مختلفی نشان داد. نمایش عکس به کدکردن دیجیتالی اطلاعات آن و همچنین نحوهی ذخیرهی اطلاعات، مانند اطلاعات رنگ تصویر، اشاره میکند. شرح یا Description به استخراج اطلاعات کمّی میپردازد که به تمایز یک کلاس از کلاسهای دیگر کمک میکند.
شناسایی یا Recognition
در عملیات شناسایی براساس توضیحات یک شیء برچسبی به آن اختصاص داده میشود.
کاربردهای پردازش تصویر
تا اینجا با پردازش تصویر و مرحلههای انجامدادن آن آشنا شدیم. حال لازم است بدانیم که پردازش تصویر در چه جاهایی استفاده میشود.
فناوریهای سنجش ترافیک
در سنسورهای ترافیک از سیستم پردازش تصویر ویدئویی یا VIPS استفاده میکنیم. این سیستم شامل یک سیستم تصویربرداری، یک سیستم مخابراتی و یک سیستم پردازش تصویر است. هنگام ضبط ویدئو یک VIPS چندین منطقهی تشخیص دارد که هر زمان که وسیلهی نقلیه به آن منطقه وارد میشود سیگنال «روشن» و سپس هر زمان که وسیلهی نقلیه از منطقهی تشخیص خارج می شود، سیگنال «خاموش» صادر میکند؛ علاوهبراین، این سیستم میتواند پلاک خودرو را بهصورت خودکار ضبط کند، نوع وسیلهی نقلیه را تشخیص دهد، سرعت راننده را در بزرگراه کنترل کند و موارد دیگر اینچنینی.
بازسازی تصویر یا Image Reconstruction
از پردازش تصویر میتوان برای بازیابی و پرکردن قسمتهای گمشده یا خراب یک تصویر استفاده کرد. این عملیات شامل استفاده از سیستمهای پردازش تصویر است که بهطور گسترده با مجموعهدادههای عکس موجود برای ایجاد نسخههای جدیدتر از عکسهای قدیمی و آسیبدیده آموزش دیدهاند.
شناسایی چهره یا Face Detection
یکی از رایجترین کاربردهای پردازش تصویر که امروزه از آن استفاده می کنیم تشخیص چهره است. این سیستم از الگوریتمهای یادگیری عمیق استفاده می کند که در آن ابتدا دستگاه با ویژگیهای خاص صورت انسان، مانند شکل صورت، فاصلهی میان چشمها و غیره، آموزش داده میشود. پس از آموزش این ویژگیهای صورت انسان به دستگاه، هر جسمی را که در تصویر بهنوعی صورت انسان را تداعی کند می پذیرد. تشخیص چهره ابزاری حیاتی است که در امنیت، بیومتریک و حتی فیلترهای موجود در اکثر برنامههای رسانههای اجتماعی این روزها استفاده میشود.
پردازش تصویر در پزشکی
در چشمانداز همیشه در حال تحول مراقبتهای بهداشتی و پزشکی، پیشرفتهای فناوری راه را برای راهحلهای نوآورانه برای بهبود مراقبت از بیمار هموار کرده است. یکی از این پیشرفتها استفاده از پردازش تصویر در پزشکی است. این بخش به بررسی این موضوع میپردازد که چگونه تکنیکهای پردازش تصویر انقلابی در تصویربرداری پزشکی ایجاد کردهاند و امکان تشخیص، برنامهریزی درمان و نتایج بیمار را افزایش دادهاند.
روشهای تصویربرداری پزشکی
تصویربرداری پزشکی نقش مهمی در تشخیص و پایش بیماریها دارد. تکنیکهای پردازش تصویر در روشهای مختلف تصویربرداری استفاده میشود، از جمله:
الف) تصویربرداری با اشعه ایکس: پردازش تصویر به بهبود و تفسیر تصاویر اشعه ایکس کمک میکند و امکان تجسم بهتر استخوانها، بافتها و اندامها را فراهم میکند. این کار به تشخیص شکستگیها، تشخیص ناهنجاریها و هدایت مداخلات پزشکی کمک میکند.
ب) توموگرافی کامپیوتری (CT): سی تی اسکن تصاویر مقطعی دقیقی از بدن ایجاد میکند. الگوریتمهای پردازش تصویر، بازسازی تصویر، کاهش نویز و تقسیمبندی اندام را تسهیل میکنند و امکان تجزیه و تحلیل دقیق و تشخیص تومورها، لختههای خون و سایر شرایط را فراهم میکنند.
ج) تصویربرداری تشدید مغناطیسی (MRI): الگوریتمهای پردازش تصویر کیفیت اسکنهای MRI را بهبود میبخشند و تصاویر واضحتری از بافتهای نرم، اندامها و رگهای خونی ارائه میدهند که به تشخیص بیماریهایی مانند تومورهای مغزی، بیماریهای قلبی عروقی و اختلالات اسکلتی عضلانی کمک میکند.
د) تصویربرداری اولتراسوند: تکنیکهای پردازش تصویر تصاویر اولتراسوند را بهبود میبخشد و تشخیص ساختار بدن را بهبود می بخشد. این کار به ارزیابی رشد جنین در دوران بارداری، تشخیص بیماریهای قلبی عروقی و هدایت روشهای کم تهاجمی کمک میکند.
بهبود و بازیابی تصویر
الگوریتمهای پردازش تصویر نقش حیاتی در افزایش کیفیت و وضوح تصاویر پزشکی دارند و امکان تجسم و تفسیر بهتر را فراهم میکنند. تکنیکهایی مانند کاهش نویز، افزایش کنتراست و شارپ کردن (sharpening)، دید ساختارهای آناتومیکی را افزایش میدهند که منجر به تشخیص دقیقتر میشود. علاوه بر این، الگوریتمهای بازیابی تصویر به حذف مصنوعات ناشی از حرکت، نویز یا سایر چالشهای تصویربرداری کمک میکنند و در نتیجه تصاویر تمیزتر و قابل اطمینانتری ایجاد میکنند.
تقسیمبندی تصویر و استخراج ویژگی
پردازش تصویر، تقسیمبندی تصاویر پزشکی، جدا کردن مناطق مورد نظر از پسزمینه یا شناسایی ساختارهای آناتومیکی مختلف را امکانپذیر میسازد. تقسیم بندی به ارزیابی حجم تومور، مشخص کردن اندام ها و شناسایی ناهنجاریها کمک میکند. علاوه بر این، تکنیکهای استخراج ویژگی امکان استخراج اطلاعات مربوطه از تصاویر پزشکی را فراهم میآورد و توصیف و طبقهبندی شرایط مختلف را تسهیل میکند.
تشخیص به کمک کامپیوتر
پردازش تصویر، همراه با الگوریتمهای یادگیری ماشین، سیستمهای تشخیص به کمک رایانه را قدرتمند میکند. این سیستمها به رادیولوژیستها و پزشکان در شناسایی ناهنجاریها کمک میکنند و به تشخیص زودهنگام و تشخیص دقیق کمک میکنند. با استفاده از مجموعه دادههای بزرگ و مدلهای یادگیری عمیق، این سیستمها میتوانند الگوها را شناسایی کنند، ضایعات را طبقهبندی کنند و پشتیبانی تصمیمگیری را ارائه دهند که منجر به بهبود دقت و کارایی تشخیصی میشود.
مداخلات و جراحی هدایت شده با تصویر (Image-Guided Interventions and Surgery)
پردازش تصویر زمینه مداخلات و جراحی هدایت شده با تصویر را متحول کرده است. برنامه ریزی دقیق قبل از عمل، ناوبری و راهنمایی در طول عمل با ثبت و ترکیب تصاویر پزشکی با دادههای تصویربرداری بلادرنگ امکان پذیر میشود. این کار به جراحیهای کم تهاجمی، هدایت بیوپسی، فرسایش تومور و سایر مداخلات پیچیده کمک میکند و دقت و ایمنی بیمار را بهبود میبخشد.
تجزیه و تحلیل کمی و پایش بیماری
تکنیکهای پردازش تصویر، تجزیه و تحلیل کمی تصاویر پزشکی، تسهیل اندازهگیریهای عینی و نظارت بر پیشرفت بیماری را ممکن میسازد. با استخراج بیومارکرهای کمی (quantitative biomarkers) از تصاویر، پزشکان میتوانند پاسخ درمانی را ارزیابی کنند، رشد تومور را ردیابی کنند، پرفیوژن بافتی و پارامترهای عملکردی را ارزیابی کنند. این کار به برنامهریزی درمان شخصی، نظارت بر درمان و ارزیابی اثربخشی درمان کمک میکند.
پزشکی از راه دور
پردازش تصویر نقش مهمی در پزشکی از راه دور دارد. تصاویر پزشکی را میتوان به صورت ایمن منتقل و از راه دور پردازش کرد و امکان مشاوره از راه دور، نظرات دوم و بهبود دسترسی به موضوعات تخصصی را فراهم میکند. این امر به ویژه در مناطق محروم و موقعیتهای اورژانسی ارزشمند بوده و از تشخیص به موقع و تصمیمهای درمانی اطمینان حاصل میکند. تکنیکهای فشرده سازی تصویر همچنین به انتقال و ذخیره کارآمد تصاویر پزشکی و حفظ کیفیت تشخیصی کمک میکند.
بیومارکرهای رادیومیک و تصویربرداری
تکنیکهای پردازش تصویر برای استخراج ویژگیهای کمی از تصاویر پزشکی ضروری هستند که منجر به ایجاد زمینههای نوظهور رادیومیک میشود. Radiomics شامل تجزیه و تحلیل داده های تصویربرداری در مقیاس بزرگ برای شناسایی نشانگرهای زیستی تصویربرداری است که با ویژگی های بیماری، پاسخ درمانی و نتایج بیمار مرتبط است. این رویکرد مبتنی بر داده، پتانسیل بسیار زیادی برای پزشکی دقیق دارد و استراتژیهای درمانی شخصیشده را بر اساس ویژگیهای تصویربرداری کمی امکانپذیر میکند.
تفسیر تصویر به کمک هوش مصنوعی
ادغام پردازش تصویر و هوش مصنوعی (AI) راههای جدیدی را برای تفسیر خودکار تصاویر باز کرده است. الگوریتمهای هوش مصنوعی، از جمله یادگیری عمیق، میتوانند بر روی مجموعه دادههای بزرگ برای شناسایی الگوها، تشخیص ناهنجاریها و کمک به تشخیص بیماریها آموزش داده شوند. با تجزیه و تحلیل تصاویر پزشکی، این سیستمهای هوش مصنوعی میتوانند بینشهای ارزشمندی ارائه دهند، دقت را بهبود بخشند و از رادیولوژیستها و پزشکان در تصمیمگیری آگاهانه حمایت کنند.
حرف آخر
رشد فناوریهای یادگیری عمیق به شتاب سریع حوزهی بینایی ماشین در پروژههای متن باز انجامیده است که این موضوع نیاز به ابزارهای پردازش تصویر را افزایش داده است. تقاضا برای استخدام متخصصان با مهارتهای کلیدی در حوزهی یادگیری عمیق هر سال با سرعت زیادی رشد میکند؛ بنابراین بسیاری از افراد شروع به یادگیری این مهارت کرده و مسیر شغلی و تحصیلی خود را تغییر دادهاند. اگر شما نیز علاقهمند به یادگیری مهارتهای یادگیری ماشین و یادگیری عمیق هستید، دورههای علم داده کافهتدریس را از دست ندهید: