FarzanehTech

۷ قدم تا درک بینایی ماشین

یادگیری و محاسبه این قابلیت را به ماشین می دهد تا محتوای تصاویر را بهتر درک کند و سیستم های مجازی ایجاد کرده که به درستی هوش را درک می کنند. مقدار عظیم از محتوای تصویر و ویدیو، جامعه علمی را وادار می کند تا الگوها را از میان آنها تشخیص دهند تا جزییاتی را آشکار کنند که ما از آن بی خبریم. بینایی ماشین مدلهای ریاضیاتی از تصاویر تولید می کند، گرافیک کامپیوتری چیزی از مدلها را روی تصاویر رسم کرده و در نهایت پردازش تصویر آن تصویر را به عنوان ورودی گرفته و بعد از پردازش یک تصویر را خروجی می دهد.

چشم انداز بینایی ماشین یک مفهوم همپوشانی در زمینه مفاهیمی از جمله هوش مصنوعی، پردازش تصویر رقمی، یادگیری ماشین، یادگیری ژرف، شناسایی الگو، مدل‌های گرافیکی احتمالی، محاسبات علمی و بسیاری از ریاضیات است. بنابراین، این پست را به عنوان نقطه شروع برای قرار گرفتن در این زمینه بگذارید. من سعی می‌کنم که تا حد امکان در این پست پوشش داده شود، اما هنوز موضوعات پیشرفته بسیاری وجود دارد و برخی چیزهایی باحال ممکن است از قلم بیفتند(شاید برای پست‌های بعدی).

 

قدم اول - بررسی پیشینه

طبق معمول، اصول اولیه را با یک دوره کارشناسی در مورد احتمال، آمار، جبر خطی، حساب (هر دو: دیفرانسیل و انتگرال) بگذرانید. یک مقدمه کوتاهی برای محاسبات ماتریسی مفید می‌باشد. همچنین، تجربه من می‌گوید که اگر کسی پیش زمینه‌ای از پردازش سیگنال داشته باشد، مفاهیم را به راحتی می‌تواند درک کند.

برای پیاده سازی، من ترجیح می دهم یک پس زمینه در MATLAB و پایتون داشته باشم. نگاهی به senddex (یک کانال یوتیوبی) برای همه چیزهایی که برای برنامه نویسی علمی در پایتون نیاز دارید بیندازید. به یاد داشته باشید که بینایی ماشین همه‌اش درباره برنامه نویسی محاسباتی است.

ممکن است بخواهید نگاهی به مدلهای گرافیکی احتمالی داشته باشید (هرچند موضوع بسیار پیشرفته‌ای است). همیشه می توانید بعدا دوباره به آن بازگردید.

قدم دوم - پردازش تصویر رقمی

فیلم‌های آموزشی پروفسور گیلرمو از دانشگاه دوک را ببینید. سرفصل‌ها بسیار متنوع و با تمرینات بسیاری همراه است. شما می توانید فیلم ها را در یوتیوب پیدا کنید یا منتظر جلسه بعدی در Coursera از سپتامبر ۲۰۱۶ باشید.

نگاهی به کتاب پردازش تصویر دیجیتالی نوشته گونزالز بیندازید. مثال‌هایی از مفاهیم درس که در MATLAB نوشته شده، را ببینید.

قدم سوم - بینایی ماشین

وقتی کار با پردازش تصویر رقمی تمام شد، گام بعدی این است که مدل های ریاضی را که اساس فرمولاسیون انواع برنامه های کاربردی تصویر و ویدئو هستند را درک کنید. دوره پروفسور مبارک از دانشگاه فلوریدا در زمینه بینایی ماشین را ببینید که به عنوان یک دوره مقدماتی مناسب که همه مفاهیم اساسی مورد نیاز برای ساختن طراحی پیشرفته را پوشش می دهد.

چارت حوزه بینایی ماشین

الگوریتم‌ها و مفاهیم و پروژه‌های کلاس بینایی ماشین گا تِک پروفسور جیمز را پیاده سازی کنید. این پروژه‌ها در MATLAB هستند. از روی این‌ها نپرید. زمانی درک عمیقی از الگوریتم ها و معادلات پیدا می‌کنید که آنها را از ابتدا پیاده سازی کنید.

قدم چهارم - بینایی ماشین پیشرفته

پس از سه مرحله اول، اکنون موجب رسیدن به مواد پیشرفته خواهید بود.

Coursera یک استنتاج گسسته در بنیایی مصنوعی پیشنهاد می‌کند که به شما یک مدل گرافیکی احتمالاتی و ریاضی محض از بینایی ماشین می‌دهد. اگرچه Coursera این درس را از وب سایت حذف کرده است، اما باید بتوانید آن را در جایی از اینترنت پیدا کنید. به نظر می رسد که چیزها به نظر جالب توجه هستند و مطمئنا به شما می آموزند که چگونه مدل‌های پیچیده و ساده برای سیستم های بینایی ماشین ساخته می‌شوند. این دوره همچنین باید یک مرحله پیاپی برای رسیدن به مقالات علمی باشد.

قدم پنجم - رفتن به پایتون و دنیای متن باز

بگذارید وارد پایتون بشیم.

بسته های بسیاری مانند OpenCV، PIL، vlfeat و موارد مشابه وجود دارد. اکنون زمان مناسب برای استفاده از بسته های ساخته شده توسط دیگران در پروژه‌های خودتان رسیده است. نیازی به پیاده سازی همه چیز از ابتدا نمی‌باشد.

می‌توانید بسیاری از وبلاگ‌ها و ویدیو‌های خوب را برای شروع با برنامه نویسی بنیایی ماشین با Python پیدا کنید. من این کتاب را توصیه می‌کنم؛ باید بیش از اندازه کافی باشد. بروید و از آن لذت ببرید! ببینید چگونه MATLAB و پایتون شما را به پیاده سازی الگوریتم ها می‌برند.

قدم ششم - یادگیری ماشین و شبکه های عصبی کانولوشن

مطالب بسیاری زیادی برای شروع با یادگیری ماشین وجود دارد.

اینجا، اینجا و اینجا را ببینید.

از حالا به بعد بهتر است به پایتون چسبید. گذری سریع به ساختن سیستم‌های یادگیری ماشین با پایتون و یادگیری ماشین با پایتون داشته باشید.

با در اختیار داشتن تمام تمرینهای یادگیری عمیق، در حال حاضر وارد این کار تحقیقی بینایی ماشین شوید: استفاده از شبکه‌های عصبی کانولوشن. درس CS231 دانشگاه استنفورد: شبکه‌های عصبی کانولوشن برای تشخیص بصری یک دوره جامع در این زمینه است. اگرچه ویدیوها از وب سایت رسمی حذف شده اند، اما شما به راحتی می توانید در یوتیوب آنها را با همین عنوان پیدا کنید.

تصویر بینایی ماشین

قدم هفتم - چطور می‌توان بیشتر بررسی کرد

شما ممکن است فکر کنید که من قبلا شما را با اطلاعات زیاد سردرگم کرده‌ام. اما، چیزهای زیادی برای کشف وجود دارد.

یک رویکرد خوب باید نگاهی به برخی از دوره های سمینار فارغ التحصیل توسط سانجی فیدلر از دانشگاه تورنتو و جیمز هیس برای درک مسیرهای تحقیق در بینایی ماشین از طریق مقالات دانشگاهی غنی باشد.

یکی دیگر از رویکردهای احتمالی پیروی از مقالات مهم از کنفرانس های برتر مانند CVPR، ICCV، ECCV، BMVC است. همچنین می‌توانید وبلاگ هایی مانند pyimagesearch.com یا computervisionblog.com یا aishack.in را دنبال کنید. سخنرانی‌ها و ارایه‌های بی پایان در زمینه بینایی ماشین و حوزه مرتبط را در videolectures.net ببینید!

به طور خلاصه، شما تاریخچه بینایی ماشین را از فیلترها، آشکارسازها و توصیفگرها، مدل‌های دوربین، ردیاب‌های مربوط به کارهایی مانند شناسایی، تقسیم بندی و پیشرفت‌های جدید در شبکه های عصبی و یادگیری ژرف را پوشش داده اید. در پست بعدی، لیستی از وبلاگهای برتر را دنبال خواهم کرد و پست بعدی آن را در مورد مقالات مهم تمام وقت برای خواندن درباره بینایی ماشین خواهم نوشت.

منبع: kdnuggets.com

پاسخی بگذارید

بستن منو