📁 برق و مخابرات (آموزش_و_پژوهش)کد:28953امتیاز:4.8📅 بروزرسانی: هفته پیش

تشخیص حروف صدا دار از روی تصاویر لب

دانلود فایل اصلی

برای دریافت فایل کامل روی دکمه زیر کلیک کنید

دانلود و مشاهده جزئیات
ℹ️
برای مشاهده محصول و توضیحات به ادامه مطلب بروید

توضیحات

تشخیص حروف صدا دار از روی تصاویر لب
فرمت فایل:PDF
تعداد صفحه:132
فهرست مطالب :
(به هم ریختگی و نامرتبی متن ها به دلیل فرمت آن ها در سایت میباشد در فایل اصلی مرتب و واضح میباشد)
چكيده . ................................................................ 1
مقدمه . ...................................................................... 2
فصل اول .............................................................. 3
مروري بر روشها ............................................................... 3
مقدمه . ................................................................... 4
-1 مروري بر تحقيقات انجام شده .................................................. 5
-1 استخراج مشخصههاي ديداري براي لبخواني .......................................... 7 -1
-1 روش پايين به بالا . .......................................................... 7 -1 -1
-1-1 كانتور فعال ....................................................... 8 -1 -1
-2-1 لبخواني با كمك اطلاعات شدت نور . ..................................... 8 -1 -1
-3-1 آناليز فضاي رنگ .................................................................. 9 -1 -1
-2 روش بالا به پايين . ............................................................. 10 -1 -1
-1-2 روش مبتني برالگوهاي انعطاف پذير......................................... 11 -1 -1
-2-2 مدل سازيهاي شكل فعال ..................................................... 11 -1 -1
-3-2 آشكارسازي لب مبتني بر مدل دگرديسپذير........................................ 11 -1 -1
-4-2 تكنيكهاي مبتني بر زمينه تصادفي ماركوف ................................... 13 -1 -1
-5-2 روشهاي مبتني بر خوشهبندي فازي ............................................. 14 -1 -1
-2 دستهبندي و تشخيص كلمات ........................................... 16 -1
- تشخيص واكه با كمك شبكههاي عصبي .............................................. 16
-3 معرفي سيستم ارائه شده ......................................... 18 -1
فصل دوم . ......................................................................... 20
مكانيابي و بازنمايي ناحيه لب . ..................................................... 20
مقدمه . ....................................................................... 21
-1 مكانيابي لب ............................................... 22
-1 تشخيص چهره .......................................................... 24 -1
-2 مكانيابي لب ................................................ 24 -1
-2 مسائل مرتبط با رنگ . ......................................................... 26
-1 توصيف انواع مدل هاي رنگ ............................................ 27 -2
27 .................................................................. Huncell - مدل
قرمز، سبز، آبي) ............................................................. 28 ) RGB - مدل
29 ........................................................ RGB - مدل نرماليزه شده
30 ............................................................................ . CMY - مدل
30 ..................................................................................... . XYZ - مدل
31 ........................................................................................ xyz - مدل
-1 فضاي رنگ ادراكي .......................................................... 31 -1 -2
32 .................................................................................. YUV - مدل
32 ....................................................................... HSI - مدل
-2 فضاي رنگ يكنواخت ادراكي . ........................................... 34 -1 -2
-3 مراحل پيشپردازش تصوير لب ..................................................... 38
فصل سوم . ............................................................ 41
استخراج ناحيه مربوط به لب . ............................................................. 41
مقدمه . ........................................................................... 42
1 –خوشهبندي . ............................................. 43 -3
46 ............................................. K-Means -1 الگوريتم -1 -3
ميانگين فازي . ..................................................... 47 -c -2 الگوريتم -1 -3
48 .............................................FCM و K-Means -3 مقايسه الگوريتم -1 -3
ميانگين فازي با ارتباط مكاني ...................... 53 -c -4 الگوريتم -1 -3
-5 پس پردازش ............................................................. 58 -1 -3
-1-5 شكلشناسي ......................................................... 58 -1 -3
-2-5 قرينهسازي . ....................................................................... 60 -1 -3
-3-5 روشنايي ............................................................................ 61 -1 -3
-4-5 شكلدهي . ................................................................ 61 -1 -3
-2 تبديل موجك .......................................................................... 63 -3
- الگوريتم مبتني بر تبديل موجك . ............................................... 65
فصل چهارم ................................................................ 69
استخراج ويژگيهاي مناسب و طبقهبندي آنها ................................................. 69
مقدمه . ................................................................................... 70
-1 استخراج مشخصههاي ديداري ................................................................ 71 -4
-1 جداسازي ناحيه لب .................................................................... 71 -1 -4
-2 مشخصههاي ديداري مورد استفاده ......................................................... 72 -1 -4
-1-2 پارامترهاي معمول( پارامترهاي طولي) .................................................. 73 -1 -4
-2-2 پارامترهاي جديد(پارامترهاي زاويهاي) ............................................ 74 -1 -4
-2 دستهبندي و تشخيص كلمات ................................................................. 75 -4
-1 پرسپترون . .......................................................................... 75 -2 -4
-2 تصديق تقاطعي . ............................................................ 77 -2 -4
فصل پنجم . ....................................................................... 82
نتايج و مشاهدات تجربي .................................................................. 82
-1 بانكهاي داده . ....................................................................... 83 -5
-2 تعيين خطاي بخشبندي . .................................................................... 86 -5
-3 استفاده از پارامترهاي طولي . ....................................... 87 -5
-4 وزندهي خروجي شبكهها به منظور افزايش دقت . ............................... 89 -5
فصل ششم . ............................................................ 91
نتيجهگيري و پيشنهادات . .................................................. 91
نتيجهگيري . ....................................................................... 92
منابع و ماخذ ............................................................... 95
فهرست منابع فارسي . ................................................................... 95
فهرست منابع لاتين . ........................................................................... 96
چكيده انگليسي . ............................................................................... 100
چکیده :
از ديرباز تشخيص و بازشناسي صحبت به عنوان اولين وسيله ارتباطي بين انسان ها از اهميت بسياري
برخوردار بوده است. تاكنون تكنيكهاي بازشناسي صحبت با استفاده از پردازش صوت با تنوع بسيار و با موفقيت
نسبي بكار گرفته شدهاند. اما وجود نويز در برخي شرايط، عامل اصلي بروز اشتباهات اساسي در تشخيص بوده
است كه در اين گونه موارد استفاده از پردازش تصوير و به ويژه بررسي شكل لبها و حركت آنها ميتواند ب راي
ارتقاء نتايج مورد استفاده قرار گيرد. فرآيند لبخواني و به عبارت ديگر تشخيص ديداري گفتار دو مرحله اصلي
قابل بررسي دارد. مرحله اول جداسازي ناحيه دهان و بطور كلي استخراج مشخصه هاي ديداري و مرحله دوم
دستهبندي و تشخيص كلمات ميباشد. در اين پروژه براي استخراج مشخصه هاي ديداري دو روش استفاده
و در روش دوم از روش مبتني بر تبديل موجك بهره جسته ايم . در SFCM نمودهايم. در روش اول از الگوريتم
مرحله بعد توسط پارامترهاي تعريف شده، يكسري ويژگي مربوط به تصاوير لب را استخراج مي نماييم . در آخر
توسط شبكه عصبي به دستهبندي ويژگيها و تشخيص واكهها ميپردازيم.
كلمات كليدي: لبخواني، بخشبندي، استخراج ويژگي، دستهبندي، تبديل موجك
مقدمه
كارايي ضعيف سيستمهاي تشخيص صوت و سيستمهاي تصديق گوينده در محيطهاي نويزي سبب شد تا
محققان به فكر استفاده از اطلاعات ديداري در اين سيستمها باشند به همين دليل آناليز تصاوير لب، توجه
زيادي را به خود جلب نمود. اولين گام در آناليز تصاوير لب، استخراج 1 ناحيه مربوط به لب در تصاوير مي باشد .
افزايش علاقه در استخراج اين اطلاعات توسط بخشبندي تصاوير لب سبب بوجود آمدن روش هاي گوناگون و
بهبود عملكرد سيستمهاي صوتي - تصويري در تشخيص صوت گرديد . بزرگترين مشكل در سيستم ه اي
لبخواني 2 توصيف كمي لب ميباشد. معمولاً روشهاي توصيف لب را به دو دسته، يكي روشهاي سطح پايين
(روشهاي مبتني بر تصوير) و ديگري روشهاي سطح بالا (روشهاي مبتني بر مدل) تقسيم مينمايند . دقت و
مقاوم بودن در اين فرآيند، مهمترين كليد براي پردازشهاي مراحل بعدي ميباشد زيرا هر چه اين مرحله با
دقت بيشتري انجام شود و بخشبندي ناحيه لب در تصاوير بهتر صورت گيرد مدل نمودن لب راحت تر خواهد
بود و با سهولت بيشتري ميتوان ويژگيهاي لب را استخراج نمود. گام بعدي بعد از استخراج ويژگي هاي لب،
دسته بندي و تشخيص ويژگي ها ميباشد. در پروژه جاري ما نيز به بررسي تك تك اين مراحل و ارائه راهكار
براي بهبود اين مراحل ميپردازيم.
از ديرباز تشخيص و بازشناسي صحبت به عنوان اولين وسيله ارتباطي بين انسان ها از اهميت بسياري
برخوردار بوده است. تاكنون تكنيكهاي بازشناسي صحبت با استفاده از پردازش صوت با تنوع بسيار و با موفقيت
نسبي بكار گرفته شدهاند[ 1]. اما وجود نويز در برخي شرايط عامل اصلي بروز اشتباهات اساسي در تشخيص
بوده است كه در اين گونه موارد استفاده از پردازش تصوير و به ويژه بررسي شكل لبها و حركت آنها مي تواند
براي ارتقاء نتايج مورد استفاده قرار گيرد[ 2]. استخراج اطلاعات ديداري از تصاوير لب كمك شاياني به تشخيص
صوت و تصديق گوينده بويژه در محيطهاي نويزي را فراهم آورده است به همين دليل توجه زيادي را به خود
جلب نموده است در اين فصل يك مروركلي بر روي روشهاي انجام شده تا به حال صورت خواهيم داد و در
مورد دستهبنديهاي موجود براي روشها صحبت خواهيم كرد.
مروري بر تحقيقات انجام شده
فرآيند لبخواني و به عبارت ديگر تشخيص ديداري گفتار دو مرحله اصلي ق اب ل بررسي دارد . مرحله اول
جداسازي ناحيه دهان و بطور كلي استخراج مشخصههاي ديداري و مرحله دوم دستهبندي و تشخيص كلمات
ميباشد. لذا محققين زيادي نيز در سالهاي متمادي و در مراحل مختلف تحقيقات خود به اين دو مرحله توجه
داشته و به صورت مستقل و يا همزمان به بررسي در زمينه استخراج مشخصه هاي ديداري و يا دسته بندي
كلمات پرداختهاند. در اين فصل ما به بررسي تحقيقات انجام شده در زمينه لبخواني ميپردازيم.
و...

دسته‌بندی‌های سایت

📂 ... pdf (رمان،شعر،داستان)...📂 ... PowerPoint پاورپوینت...📂 معارف اسلامی (آموزش_و_پژوهش)...📂 معماری (آموزش_و_پژوهش)...📂 کامپیوتر...📂 روانشناسی و مشاوره (آموزش_و_پژوهش)...📂 ... پروژه های تحصیلی و آموزشی...📂 مدیریت (آموزش_و_پژوهش)...📂 🔺... پژوهش ها و محتوای مجازی...📂 حقوق (آموزش_و_پژوهش)...📂 حسابداری (آموزش_و_پژوهش)...📂 امتحانات نهایی...📂 اقتصاد (آموزش_و_پژوهش)...📂 برق و مخابرات (آموزش_و_پژوهش)...📂 تاریخ (آموزش_و_پژوهش)...📂 کامپیوتر و IT (آموزش_و_پژوهش)...📂 ادبیات (آموزش_و_پژوهش)...📂 علوم تربیتی (آموزش_و_پژوهش)...📂 پزشکی (آموزش_و_پژوهش)...📂 ... psdو (نمونه قرارداد،طرح،الگو)...📂 مکانیک (آموزش_و_پژوهش)...📂 گوناگون...📂 جغرافیا (آموزش_و_پژوهش)...📂 هنر و گرافیک (آموزش_و_پژوهش)...📂 عمران و نقشه برداری (آموزش_و_پژوهش)...📂 بهداشت (آموزش_و_پژوهش)...📂 تربیت بدنی (آموزش_و_پژوهش)...📂 مواد و متالورژی (آموزش_و_پژوهش)...📂 کشاورزی و محیط زیست (آموزش_و_پژوهش)...📂 علوم اجتماعی (آموزش_و_پژوهش)...📂 علوم سیاسی (آموزش_و_پژوهش)...📂 شهرسازی (آموزش_و_پژوهش)...📂 شیمی (آموزش_و_پژوهش)...📂 صنایع (آموزش_و_پژوهش)...📂 استخدامی...📂 ... پروژه های صنعتی و احداث...📂 فیزیک (آموزش_و_پژوهش)...📂 هنر و گرافیک (کارآموزی_و_گزارشات)...📂 پیام نور...📂 ریاضی (آموزش_و_پژوهش)...📂 معماری (کارآموزی_و_گزارشات)...📂 موبایل و اندروید...📂 برق و مخابرات (کارآموزی_و_گزارشات)...📂 مدیریت (مقالات_و_تحقیقات)...📂 امار و احتمال (آموزش_و_پژوهش)...📂 عمران و نقشه برداری (کارآموزی_و_گزارشات)...📂 زبانهای خارجه (آموزش_و_پژوهش)...📂 صنایع غذایی (آموزش_و_پژوهش)...📂 فلسفه و منطق (آموزش_و_پژوهش)...📂 عمران و نقشه برداری (مقالات_و_تحقیقات)...📂 ... پروژه های تولیدی و اشتغال...📂 زیست شناسی (آموزش_و_پژوهش)...📂 مکانیک (کارآموزی_و_گزارشات)...📂 کامپیوتر و IT (کارآموزی_و_گزارشات)...📂 صنایع (کارآموزی_و_گزارشات)...📂 پرستاری (آموزش_و_پژوهش)...📂 ... پروژه های غذایی و کشاورزی...📂 حسابداری (کارآموزی_و_گزارشات)...📂 روانشناسی و مشاوره (مقالات_و_تحقیقات)...📂 زمین شناسی (آموزش_و_پژوهش)...📂 ... پروژه های تحقیق و ترجمه مقاله...📂 مدیریت (کارآموزی_و_گزارشات)...📂 علوم تربیتی (کارآموزی_و_گزارشات)...📂 کشاورزی و محیط زیست (کارآموزی_و_گزارشات)...📂 کنکور سراسری...📂 بیمه و بانکداری (آموزش_و_پژوهش)...📂 نفت (آموزش_و_پژوهش)...📂 عمران و نقشه برداری (نظام_مهندسی)...📂 برق و مخابرات (مقالات_و_تحقیقات)...📂 کامپیوتر و IT (مقالات_و_تحقیقات)...📂 کنکور ارشد و دکتری...📂 مهندسی پزشکی (آموزش_و_پژوهش)...📂 دیگر...📂 شیمی (کارآموزی_و_گزارشات)...📂 ... پروژه های پرورش و دامپروری...📂 علوم دامی (آموزش_و_پژوهش)...📂 ... پروژه های تاسیس و خدمات...📂 پزشکی (مقالات_و_تحقیقات)...📂 حقوق (کارآموزی_و_گزارشات)...📂 مهندسی معدن (آموزش_و_پژوهش)...📂 حسابداری (مقالات_و_تحقیقات)...📂 تغذیه (آموزش_و_پژوهش)...📂 بانک ها...📂 🔺قالب و پلاگین...📂 علوم اجتماعی (مقالات_و_تحقیقات)...📂 C و C++...📂 پزشکی و پرستاری (کارآموزی_و_گزارشات)...📂 دندانپزشکی (آموزش_و_پژوهش)...📂 سی شارپ...📂 ... پروژه های پزشکی و دارو...📂 معماری (نظام_مهندسی)...📂 مامایی (آموزش_و_پژوهش)...📂 ویژوال بیسیک...📂 نظام مهندسی...📂 نفت (کارآموزی_و_گزارشات)...📂 نساجی (آموزش_و_پژوهش)...📂 کشاورزی و محیط زیست (مقالات_و_تحقیقات)...📂 طراحی وب...📂 انیمیشین و وکتور (آموزش_و_پژوهش)...📂 داروسازی (آموزش_و_پژوهش)...📂 مهندسی شیلات (آموزش_و_پژوهش)...📂 Android...📂 ICDL...📂 کشاورزی و محیط زیست (کتب_و_جزوات)...📂 مهندسی آب (کتب_و_جزوات)...📂 Matlab...📂 مکانیک (نظام_مهندسی)...📂 مهندسی بهداشت (کتب_و_جزوات)...📂 کتابداری (آموزش_و_پژوهش)...📂 مواد و متالوژی و معدن (کارآموزی_و_گزارشات)...📂 آیین نامه رانندگی...📂 PHP...📂 داروسازی (کارآموزی_و_گزارشات)...📂 ... پروژه های کارآموزی و کارورزی...📂 دستگاه های اجرایی...📂 مهندسی آب و هواشناسي (کارآموزی_و_گزارشات)...📂 برق و مخابرات (نظام_مهندسی)...📂 ... پروژه های کارآفرینی و توجیهی...📂 وردپرس...📂 شرکت گاز...📂 اسمبلی...📂 Visual Basic.net...📂 وزارت نیرو...📂 شرکت نفت...📂 HTML...📂 ASP.net...📂 دلفی...📂 مصاحبه حضوری...📂 طراحی (کتب_و_جزوات)...📂 شهرداری...📂 علوم نجوم (آموزش_و_پژوهش)...📂 پایتون...📂 🔺زبان برنامه نویسی و اسکریپت...📂 SQL Server...📂 جاوا...📂 اسکریپت...

جستجو در بین فایل‌ها