ما هو التعرف على الأحرف الضوئية (التعرف على الشخصية البصرية)؟
OCR (التعرف على الأحرف البصرية) هو استخدام التكنولوجيا لتمييز أحرف النص المطبوعة أو المكتوبة بخط اليد داخل الصور الرقمية للمستندات المادية ، مثل وثيقة الورق الممسوحة ضوئيًا. تتضمن العملية الأساسية لـ OCR فحص نص المستند وترجمة الأحرف إلى شفرة التي يمكن استخدامها ل معالجة البيانات. يشار أحيانًا إلى التعرف على النص على OCR باسم التعرف على النص.
تتكون أنظمة OCR من مجموعة من الأجهزة والبرامج المستخدمة لتحويل المستندات الفعلية إلى نص قابل للقراءة الآلي. الأجهزة ، مثل بصري الماسح الضوئي أو متخصص لوحة الدائرةيستخدم لنسخ أو قراءة النص بينما يتولى البرنامج عادة المعالجة المتقدمة. يمكن للبرنامج أيضًا الاستفادة من منظمة العفو الدولية لتنفيذ أساليب أكثر تقدمًا للتعرف على الشخصية الذكية (ICR) ، مثل تحديد اللغات أو أنماط الكتابة اليدوية.
يستخدم OCR الأكثر شيوعًا لتحويل النسخ الورقية من الوثائق القانونية أو التاريخية إلى PDFs. بمجرد أن تكون الوثيقة في هذا نسخة ناعمة، يمكن للمستخدمين تعديل وتنسيق وبحثه كما لو تم إنشاؤه مع معالج النصوص.
كيف يعمل التعرف على الشخصيات البصرية
تتمثل الخطوة الأولى في OCR في استخدام الماسح الضوئي لمعالجة النموذج الفعلي للمستند. بمجرد أن يتم نسخ جميع الصفحات ، يقوم برنامج OCR بتحويل المستند إلى إصدار من ألوان أو أبيض وأسود. الصورة الممسوحة ضوئيا أو صورة نقطية يتم تحليله للمناطق الخفيفة والظلام ، حيث يتم تحديد المناطق المظلمة على أنها شخصيات تحتاج إلى الاعتراف والمناطق الخفيفة كخلفية.
ثم تتم معالجة المناطق المظلمة أكثر للعثور على الحروف الأبجدية أو الأرقام الرقمية. يمكن أن تختلف برامج OCR في تقنياتها ، ولكنها تتضمن عادةً استهداف حرف أو كلمة أو كتلة من النص في وقت واحد. ثم يتم تحديد الأحرف باستخدام واحد من اثنين الخوارزميات:
- التعرف على الأنماط. برامج التعرف الضوئي على الحروف هي أمثلة على النص في مختلف الخطوط وتنسيقات ، ثم يستخدمونها التعرف على الأنماط لمقارنة ومعرفة الشخصيات في المستند الممسوحة ضوئيًا.
- اكتشاف الميزة. تطبق برامج OCR القواعد المتعلقة بميزات خطاب أو رقم معين للتعرف على الأحرف في المستند الممسوح ضوئيًا. يمكن أن تشمل الميزات عدد الخطوط الزاوية أو الخطوط المتقاطعة أو المنحنيات في حرف للمقارنة. على سبيل المثال ، قد يتم تخزين الحرف الرأسمالي “A” كخطين قطريين يجتمعان مع خط أفقي عبر الوسط.
عندما يتم تحديد حرف ، يتم تحويله إلى ASCII رمز يمكن أن تستخدمه أنظمة الكمبيوتر للتعامل مع المزيد من التلاعب. يجب على المستخدمين تصحيح الأخطاء الأساسية ، التدقيق ، والتأكد من معالجة التخطيطات المعقدة بشكل صحيح قبل حفظ المستند للاستخدام في المستقبل.

حالات استخدام التعرف على الأحرف البصرية
يمكن استخدام OCR لمجموعة متنوعة من التطبيقات ، بما في ذلك ما يلي:
- مسح المستندات المطبوعة في إصدارات يمكن تحريرها مع معالجات النصوص ، مثل Microsoft Word أو مستندات جوجل.
- فهرسة مادة الطباعة ل محركات البحث.
- أتمتة إدخال البيانات، والاستخراج والمعالجة.
- فك تشفير المستندات في نص يمكن قراءته بصوت عالٍ لإعاقة المستخدمين أو العمياء بصريًا.
- أرشفة المعلومات التاريخية ، مثل الصحف أو المجلات أو كتب الهاتف ، إلى تنسيقات قابلة للبحث.
- إيداع إيداع إلكترونيًا دون الحاجة إلى صراف بنك.
- وضع مستندات قانونية مهمة وموقعة في إلكتروني قاعدة البيانات.
- التعرف على النص ، مثل لوحات الترخيص ، مع كاميرا أو برنامج.
- فرز رسائل لتسليم البريد.
- ترجمة الكلمات داخل صورة إلى لغة محددة.
فوائد التعرف على الشخصية البصرية
المزايا الرئيسية لتكنولوجيا OCR هي ما يلي:
- يوفر الوقت
- يقلل الأخطاء.
- يقلل الجهد ؛ و
- تتيح الإجراءات غير الممكنة مع النسخ المادية ، مثل ضغط في ملفات ZIP ، تسليط الضوء على الكلمات الرئيسية ، والدمج في موقع ويب وإرفاق بريد إلكتروني.
أثناء التقاط صور للمستندات ، يمكّنهم من أرشفة رقميًا ، يوفر OCR الوظائف الإضافية لتحرير هذه المستندات والبحث عنها.
https://www.youtube.com/watch؟v=Q5U_VEMCY-M
يقوم OCR بسحب النص من الصور ، ولكن معالجة المستندات الذكية (IDP) تسير أبعد من ذلك – فهم المعنى والسياق. اكتشف المفتاح الاختلافات بين OCR مقابل IDP ولماذا يهم.




