عوامل ادراکی سطح بالاتر، مانند توجه، حرکات چشم و انواع مختلف کدینگ مصنوعی غیر قابل قبول است
هم آوری تصویر سه بعدی بین تصاویر چپ و راست است
پوشش، اشاره به کاهش ناتوانی در تشخیص یک محرک در یک پس زمینه مکانی یا زمانی پیچیده دارد
شکل ۳-۱۰. فشرده سازی بر روی مانکن، متقارن (بالا) و نامتقارن (پایین)
شکل ۳-۱۱. بیانگر گراف آن است، نتایج PSNR متقارن در مقابل نامتقارن فشرده سازی JPEG
به عنوان مثال معیارهایی مانند PSNR و MSE دارای دقت محدود در هنگام ارزیابی کیفیت تصویر هستند، تحقیقات زیادی برای توسعه و پیشرفت بیشتر تکنیک‌های ارزیابی کیفیت تصویر بر اساس سیستم بینایی انسان صورت گرفته است. هر دو دالی و لابین[۶۶] مدلی بر اساس مراحل اولیه بینایی انسان تولید کرده اند که قادر به تعیین حضور اشتباهات فشرده سازی در مناطق مختلف یک تصویر می باشد.

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

با این حال، از آنجا که این مدل ها آستانه های متفاوتی برای مناطق جداگانه نشان داده شده در تصویر ایجاد می کنند، نمی توانند به دقت کیفیت کلی تصویر را پیش بینی کنند، زیرا سیستم بینایی انسان حساسیت کمتری به مناطق پیرامون تصویر دارد. در مرجع [۲۶] یک معیار کیفیت ذهنی که مناطق مختلف یک تصویر دوبعدی را با احتساب فاکتورهای شناخته شده برای تاثیر گذاشتن بر توجه بصری، ارزیابی می­ کند را ارائه داده­اند. معیار ارائه شده از الگوریتم کانتراست با پهنای محدود[۶۷] در مرجع [۲۷] استفاده کرده و بهبود بیشتری در مقایسه با PSNR، بر اساس تست ذهنی نشان می­دهد.
۳-۴-۳ تحقیقات انجام شده بر روی میزان مناسب فشرده­سازی بر اساس سیستم بینایی انسان
کارهای تحقیقاتی زیادی در مورد اینکه چگونه فشرده سازی از تصاویر و فیلم ها اثراتی بروی کیفیت درک شده توسط انسان می گذارد، انجام شده است. واتسون به بررسی کیفیت فیلم ویدئو پرداخته و مقیاس اختلاف قابل درک مرزی[۶۸] را بر اساس اختلال بصری ارئه می دهد. گروه کارشناسان کیفیت ویدیو[۶۹] (مرجع شماره [۲۸]) به ارزیابی اختلال بصری با بهره گرفتن از ITU-R نظریه ۵۰۰ پرداختند، که مشخص شد که نتایج PSNR بدست آمده به مراتب بدتر از سایر مدل های HVS بود.
ساشنز[۷۰] و همکارانش به بررسی چگونگی تاثیر فشرده سازیJPEG بر کیفیت تصویر، درک عمق، وضوح و تفاوت های فشار بر روی چشم، پرداختند. باز هم روش کیفیت مستمر محرک از ITU-R نظریه ۵۰۰ استفاده شد و فشرده سازی و فاصله دوربین­ها متغیر بودند. نتایج نشان می دهد که فشرده سازی JPEG دارای یک اثر منفی بر روی کیفیت تصویر و وضوح (تیزی) درک شده و باعث ایجاد فشار درچشم بود. هیچ تاثیری از فشرده­سازیJPEG بر روی درک عمق نشان داده نشده است. همچنین نتایج حاصل از فشار چشم و وضوح به خوبی با کیفیت تصویر ارتباط دارند.
تام و استلمچ[۷۱] در مرجع [۲۵] به مقایسه تصاویر استریو فشرده شده بصورت نامتقارن، با ۲۶ نفر، با بهره گرفتن از ITU نظریه ۵۰۰ پرداختند. نتایج آنها نشان داد که کیفیت ذهنی از تصویر نامتقارن بین کیفیت دیدگاه چپ و راست است. نتایج پیش بینی شده با خواص شناخته شده از دید دو چشمی سازگار بودند.
بنابراین، از آنجا که معیارهای فعلی طراحی شده برای مقایسه تصویر دوبعدی به راحتی قادر به پیش بینی کیفیت از تصاویر سه بعدی نیست، یک معیار جدید کیفیت تصاویر سه بعدی طراحی و پیاده سازی شد.
۳-۴-۴ الگوریتم ارائه شده جهت اندازه ­گیری کنتراست سه­بعدی با پهنای باند محدود [۷۲]
تحقیقات ادراک بصری بطور عمده شامل مطالعه بروی حساسیت کنتراست و تغییرات در شدت نور است. الگوریتم ارائه شده جهت اندازه ­گیری کنتراست سه­بعدی با پهنای باند محدود، حساسیت های سیستم بینایی انسان نسبت به کنتراست و تغییرات شدت نور در مناطق فرکانس های بالای مکانی را می­سنجد. این الگوریتم برای رتبه بندی زوج های تصویر سه بعدی بر اساس کیفیت تصویر می تواند مورد استفاده قرار گیرد.
معیار SBLC، از الگوریتم RANSAC واقع در مرجع [۲۹] برای استخراج لبه ها، گوشه ها و مناطق فرکانس های بالای مکانی در تصویر استفاده می­نماید. نقاط متناظر بین دیدگاه های چپ و راست این زوج استریو تطبیق داده شده اند. برای هر یک از نقاط همسان، پیکسل های اطراف آن محاسبه می شود. پیکسل های خارج از محدوده از تصویر دور انداخته می شوند. شدت نور نسبی، I، برای هر نقطه همسان شده در هر منطقه بصورت زیر محاسبه می شود،
(۳-۶)
با بهره گرفتن از این، فرمول کنتراست مایکلسون در مرجع [۲۷] برای هر دو از مناطق همسان شده مربوطه محاسبه و پس از آن متوسط مناطق همسان شده در هر دو سمت چپ و راست نمایش، C، محاسبه شده است؛ که برای تمام مناطق همسان شده تکرار شده است. به طور کلی میانگین شدت نور نسبی از کل تصویر با بهره گرفتن از معادله زیر محاسبه شده است:
(۳-۷)
کنتراست استریو باند محدود (SBLC) از میانگین نسبت C(X) به L برای هر نقطه x همسان شده محاسبه می شود.
(۳-۸)
که در آن P تعداد کل ناحیه های تطبیق یافته است، محاسبه شده است.
آزمایشات انجام شده نشان می­دهد که رتبه کیفیت تصویرمحاسبه شده توسط معیار ارائه شده و کیفیت تصویر درک شده مبتنی بر آزمایش ذهنی انسان با افزایش فشرده سازی JPEG کاهش می یابد. به علاوه آستانه کیفیت تصویر تولید شده توسط معیار SBLC به نتایج ذهنی انسان نزدیک تر، از آستانه تولید شده از PSNR می­باشد.
۳-۵ معیار عینی ارزیابی کیفیت بر اساس عمق تصویر
۳-۵-۱ بررسی کیفیت مبتنی بر عمق تصویر
با بهره گرفتن از دید یک چشمی تکمیل شده بوسیله عمق تصویر، روش DIBR می تواند دیدگاه های مجازی از صحنه از نقطه نظر دلخواه تولید کند. دیدگاه اصلی شامل اطلاعات رنگ از صحنه و عمق هر پیکسل تصویر با بهره گرفتن از شدت رنگ خاکستری برای نشان دادن اطلاعات عمق استفاده می­نماید. به طور کلی، روند DIBR شامل دو مرحله است:
خم کردن تصویر
پر کردن حفره ها
در مرحله اول، پیکسل مورد نظر از تصویر اصلی در پردازش “خم کردن تصویر” منتقل شده است. فرض کنید P یک نقطه سه بعدی است، از آنجاکه مقدار عمق در مقیاس خاکستری نسبت عکس با عمق P در صفحه طبیعی دارد، مکان P بر روی تصویر اصلی و مجازی به شرح زیر به یکدیگر مربوط می­شوند:
(۳-۹) =
که در آن d میزان انتقال پیکسل، D میزان عمق هر پیکسل از تصویر، µ و ‌‌λ ضرایب ثابت هستند. و به ترتیب مقادیر مختصات افقی پیکسل در دو تصویر اصلی و مجازی هستند.
در عبارت ۳-۹، پیکسل های مختلف در تصویر اصلی که یکسان دارند، در تصویر مجازی مکان یکسانی را اشغال می کنند. در این حالت، پیکسل با مقدار D بزرگتر از اولویت بیشتری برخوردار است. به علاوه، برخی مناطق از تصویر مجازی پر نشده و موجب ایجاد حفره تخریبی قوی می شوند. خوشبختانه، روش های مختلف پر کردن حفره برای حل این مشکل پیشنهاد شده است که شامل روش­های زیر می­باشد:
پر کردن حفره با مقدار ثابت رنگ دائمی که معمولا میانگین رنگ ​​از مرز حفره است.
درون­یابی افقی: این روش با بهره گرفتن از پیکسل بر روی مرز افقی به درون­یابی رنگ پیکسل های خالی در منطقه حفره، با نادیده گرفتن اطلاعات عمق، می ­پردازد. رابطه این روش را می توان به صورت زیر نوشت:
(۳-۱۰)
که در آن پیکسل خالی، ، به ترتیب پیکسل های مرز افقی چپ و راست، و ω وزنی است نسبت عکس با فاصله بین و دارد.
پر کردن ناحیه مورد علاقه[۷۳]: این روش مقادیر پیکسل در مرز را به درون حفره توسط حل معادله لاپلاس پخش می کند. این روش نیز در پیاده سازی اطلاعات عمق را نادیده می گیرد.
برون­یابی افقی: این روش پیکسل­های پیش زمینه را که در فرایند انحنای تصویر اشغال نشده­اند در نظر گرفته و فرض بر این است که منطقه حفره همین بخش از دست رفته پس زمینه است. در این راه، حفره با پیکسل مرزی با ارزش D کوچکتر (عمق بیشتر) پر می­ شود.
(۳-۱۱)
درون یابی افقی و عموی: در دو روش فوق فقط از پیکسل مرزی افقی برای پر کردن پیکسل­های خالی استفاده شده است.
شکل ۳-۱۲. چارچوبی از ارزیابی کیفیت عینی کامل مرجع
اکنون، اطلاعات عمودی، به خصوص پیکسل های همسایه عمودی هم در نظر گرفته می شود. در نتیجه، حفره از روش زیر پر می شود:
(۳-۱۲)
که در آن پیکسل (, )P، ω و همان پارامترهای معادله های قبل ۳-۱۰ و ۳-۱۱ هستند.
۳-۵-۲ روش ارائه شده جهت ارزیابی عینی کامل DIBR
ارزیابی ذهنی زمانبر است، در نتیچه از جانب گیرنده برای تصمیم گیری در مورد انتخاب بهترین روش پر کردن حفره مناسب نیست، اما معیارهای بسیار ساده تر و قابل اجرا تری وجود دارد. راهکار ارائه شده در این راستا روش ارزیابی عینی با مرجع کامل است (به شکل ۳-۱۲ مراجعه کنید).
جهت استفاده از مرجع در ارزیابی عینی، دو تصویر از دو دیدگاه مختلف باید مورد استفاده قرار گیرد، یکی به عنوان مرجع اصلی و دیگری مرجع مجازی که برای انتقال دنباله زوج های تصویر سه بعدی اصلی در سیستم تلویزیون سه بعدی، مناسب است. گیرنده، تصویر مجازی را با بهره گرفتن از رابطه اول، می­سازد که λ، µ می توانند طوری تعیین شوند که تصویر مجازی همان نقطه دید تصویر مرجع را داشته باشد.
با بهره گرفتن از تصویر اصلی، تصویر بازیابی شده و تصویر مرجع، کیفیت بازیابی از دو جنبه قابل بررسی است:
اولا تصویر بازیابی شده باید تا حد امکان برابر با مرجع باشد. از این رو در این جنبه، می­توان از معیارهای ارزیابی عینی تصویر دوبعدی، با تمرکز بر تفاوت بین تصویر بازیابی شده و مرجع، استفاده نمود.
ثانیا هر دو تصویر بازیابی شده و اصلی می­بایست به گونه ­ای باشند که درک عمق موثر از تصویر فراهم شود؛ به عبارت دیگر، روش پر کردن حفره بر این فرض استوار است که اطلاعات موجود از جمله ویژگی های پیش زمینه نباید تحریف شود.
در حال حاضر، میانگین مربعات خطا و نسبت قله سیگنال به نویز که ساده و از نظر فیزیکی منطقی هستند، اغلب به عنوان مرجع کامل معیارهای کیفیت عینی استفاده می شوند. با این حال، به دلیل در نظرگرفتن خطا تنها در هر پیکسل مورد انتقاد قرار گرفته اند. به عنوان یک ارزیابی عینی بهبود یافته، یک معیار شباهت ساختاری که شباهت ساختاری محلی دو تصویر را به جای خطاهای درک شده اندازه گیری می­نمابد، پیشنهاد شده است.
با توجه به این که روش پر کردن حفره به طور عمده از اطلاعات پیکسل افقی استفاده می­ کند و اینکه ناحیه خالی همیشه ناحیه کوچکی را تحت پوشش قرار می دهد، تنها اندازه گیری مقایسه روشنایی محلی محاسبه و از تفاوت های ساختاری SSIM چشم پوشی می شود.

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...