بینایی رایانه چیست:

بینایی رایانه (Computer Vision) و یا به عبارتی بینایی کامپیوتر تبدیل داده‌ها از تصویر یا دوربین به یک تصمیم (اینکه عملی صورت پذیرد) و یا نمایش جدید (از آن تصویر که مفهومی را برساند) می‌باشد. چنین تبدیلی برای دستیابی به هدفی خاص انجام می‌شود.

یک نمایش جدید ممکن است تغییر تصویر رنگی به سیاه-سفید (Grayscale) یا حذف لرزش دوربین از ویدیو معنی دهد. هدف بینایی کامپیوتر نوشتن برنامه‌هایی است که تصاویر را تفسیر می‌کنند به این معنی که در تصویر چه اتفاقی در حال رخ دادن است. اساساً بینایی کامپیوتر درباره فهمیدن اطلاعاتی است که درون تصویر وجود دارند.

 

در بینایی کامپیوتر، ما تلاش می‌کنیم تا برعکس عمل کنیم، به عبارتی برای اینکه دنیا را آنطور که ما می‌بینیم در یک یا چند تصویر شرح دهیم و ویژگی‌های آن مانند ریخت[۱]، روشنایی[۲] و توزیع رنگ را بازسازی کنیم، می‌خواهیم از این ویژگی‌ها به تصمیمی برسیم. از کاربردهای بینایی کامپیوتر می‌توان به تشخیص کاراکتر چاپی[۳]، سیستم‌های ناظر، شناسایی اثر انگشت و بیومتریک اشاره کرد [۲].

[۱] Shape

[۲] Illumination

[۳] Optical Character Recognition (OCR)

 

رسیدن از تصویر (یا ویدیو) به ادراک

ارتباط بینایی رایانه با سایر علوم:

بینایی (کامپیورت) یا ویژن (Vision) علمی مابین یادگیری ماشین، علوم شناختی، علوم اعصاب، گرافیک و بازیابی اطلاعات می‌باشد.

ارتباط بینایی (رایانه) با سایر علوم

در نهایت هدف بینایی رایانه ایجاد پلی بین پیکسل‌ها (Pixels) با معنی و مفهوم می‌باشد.

 

مبدأ شروع بینایی رایانه:

شروع و اساس بینایی کامپیوتر، پروژه یک دانشجوی دوره لیسانس از دانشگاه ام-ای-تی (MIT) به نام سیمور (Seymour Papert) در تابستان سال ۱۹۶۶ بود. به گفته پرفسور فی-فی لی (استاد دانشگاه استنفورد و راهبر آزمایشگاه بینایی ماشین استنفورد)، «یک پرفسور در سال ۱۹۹۶ در آزمایشگاه هوش مصنوعی (AI) تصمیم گرفت که وقت آن رسیده تا مشکل ویژن را حل کنیم. ویژن کاری بسیار ساده هست، ما چشمانمان را باز می‌کنیم و چیزها را می‌بینیم پس بیایم این مشکل را هم در یک تعطیلات تابستانی حل کنیم». در زیر تصویر پروپوزال دانشجوی ام-ای-تی در آن تابستان قابل مشاهده است.

تصویر پروپوزال دانشجوی MIT برای حل مشکل بینایی کامپیوتر
تصویر پروپوزال دانشجوی MIT برای حل مشکل بینایی کامپیوتر