OCR استخراج متن از تصویر چیست + ویدئوی آموزشی

0 193

OCR استخراج متن از تصویر چیست + ویدئوی آموزشی OCR استخراج متن فارسی از تصویر : اجازه دهید قبل از شروع یکتعریف ساده ای از این تکنولوژی ارائه بدم تا بریم بخش های بعدی ,  فرض کنید چندین صفحه مطلب به دست شما رسیده و می خواهید نسخه متنی آن را داشته باشید تا بتوانید ان را ویرایش کنید ,  اولین گزینه که به ذهنتان میرسد این است که بشینید و همه آن مطالب را تایپ کنید ولی تکنولوژی OCRبه شما کمک خواهد کرد که بدون نیاز به تایپ کردن همه صفحات و تنها در عرض چند ثانیه همه متون موجود در آن صفحات را به متن قابل ویرایش تبدیل کنید .

OCR استخراج متن از تصویر :

OCR یا Optical character recognition به روشی گفته میشود که در این روش تجهیزات کامپیوتری قادر خواهند بود تا حروف و متون را در تصاویر و یا اسناد چاپ شده تشخیص داده و انها را به حروف و متون قابل ویرایش تبدیل نماید از این روش در داده کاوی text mining و تبدیل متن به صدا text to speech نیز استفاده میشود .

تاریخچه OCR استخراج متن از تصویر :

تاریخچه اولین استفاده از این تکنولوژی به سال 1914 به امانوئل گولدبرگ برمیگردد که برای اولین بار ماشینی اختراع کرد که حروف را تشخیص و به علایم تلگراف تبدیل می نمود پیشتر نیز در سال 1974 ریان کورزولی با استفاده از این روش دستگاهی را ابداع کرد که میتوانست حروف را تشخیص وانها را با صدای بلند برای افراد نابینا بخواند .در سال 2000 این تکنولوژی برای اولین بار بصورت عمومی و تحت وب در اختیار عموم قرار گرفت و هم اکنون این تکنولوژی برای اکثر زبان های دنیا در دسترس میباشد .

این مطلب هم میتواند برای شما مفید باشد   آیا واقعا امواج وای فای برای ما مضر است + داستان کاکتوس گذاشتن کنار مودم

کاربردهای عمومی OCR :

  1. استفاده در فروشگاهها , مراکز خرید , فرودگاهها و…. برای استخراج سریع اطلاعات ازمدارک
  2. تشخیص پلاک خودروها
  3. تبدیل سریع متون چاپی به متن قابل ویرایش بدون نیاز به تایپ
  4. کمک به افراد نابینا و افرادی که مشکل بینایی دارند بطوریکه متن را با صدا برای انها میخواند

انواع OCR:

Optical character recognition (OCR)

Intelligent character recognition (ICR)

Intelligent word recognition (IWR)

تفاوت  روش های هوشمند با روش های معمولی OCR این است که در روش معمولی  OCR متن های موجود به صورت کامپیوتری چاپ شده اند و تشخیص انها راحتتر میباشد ولی روش هوشمند  IWR یا ICR برای متونی استفاده میشود که بصورت دستی نوشته شده باشند

 

پروسه کاری OCR برای استخراج متن از تصویر :

  1.  De-skew  : یعنی اگر در صورتی که سند اسکن شده درست اسکن نشده باشد این تکنیک صفحات را مرتب و منظم خواهد کرد
  2. Despeckle : تشخیص لبه های های صفحات و حذف نقاط زائد
  3. Binarisation : تبدیل تصاویر از رنگی به سیاه و سفید این عمل موجب میشود تا کار تشخیص راحتتر شود چون در این حالت صرفا دو رنگ موجود خواهد بود رنگ متن سیاه و رنگ پیش زمینه سفید
  4. Layout analysis : تجزیه تحلیل سطرها فاصله سطرها و پاراگراف ها
  5. Line and word detection : تشخیص خطوط و حروف
  6. Script recognition : تشخیص متن و کلمات
  7. Normalise aspect ratio and scale : نرمال سازی متن و حروف و تنظیم سایز آنها

امروزه با پیشرفت این تکنولوژی دیگر نیازی به تایپ نمانده و شما به راحتی میتوانید متون چاپی را در اسرغ وقت به متن تبدیل کنیدسرویس ها و برنامه های فراوانی برای این امر در دسترس میباشند که یکی از بهترین و رایگان ترین انها که زبان فارسی را نیز پشتیبانی میکند گوگل درایو میباشد که برای نحوه اشنایی کار با این سرویس رایگان میتوانید ویدئوی آموزشی زیر را تماشا کنید

ارسال یک دیدگاه

آدرس ایمیل شما منتشر نخواهد شد.