আলোকভিত্তিক অক্ষর শনাক্তকরণ
আলোকভিত্তিক অক্ষর শনাক্তকরণ হাতে লেখা বা টাইপযন্ত্রে টাইপকৃত লেখার ছবিকে (সাধারণত স্ক্যানার দিয়ে স্ক্যান করা) কম্পিউটারে সম্পাদনাযোগ্য লেখায় অনূদিত করার যান্ত্রিক বা ইলেকট্রনিক পদ্ধতিকে বুঝায়। ইংরেজি ভাষায় এটিকে "অপটিক্যাল ক্যারেক্টার রিকগনিশন" (সংক্ষেপে "ওসিআর") নামে ডাকা হয়। কম্পিউটার বিজ্ঞানের যে শাখাগুলি আলোকভিত্তিক অক্ষর শনাক্তকরণের সাথে সম্পর্কিত সেগুলি হচ্ছে: বিন্যাস শনাক্তকরণ (প্যাটার্ন রিকগনিশন), কৃত্রিম বুদ্ধিমত্তা এবং যান্ত্রিক দর্শন (মেশিন ভিশন)।
বাংলা আলোকভিত্তিক অক্ষর শনাক্তকরণ
[সম্পাদনা]বাংলাতে গুগল টেসারাকটের আলোকভিত্তিক অক্ষর শনাক্তকরণ আছে সেটি আগে খুবই দুর্বল এবং ছাপা হরফের জন্য প্রযোজ্য ছিল। কিন্তু বর্তমানে গুগল ড্রাইভ ও গুগল ডক গুগল টেসারাকটের যে আলোকভিত্তিক অক্ষর শনাক্তকরণ প্রযুক্তি ব্যবহার করে তা বেশ উন্নত, ফলাফলও বেশ সঠিক। ২০০৭ সালে সি.আর.বি.এল.পি ল্যাব বাংলার জন্য এটি বানানোর একটি প্রচেষ্টা শুরু করে গুগলের সহায়তায়। এর পর বাংলাদেশ ও ভারতে অনেক বিশ্ববিদ্যালয় এবং গবেষণাগারে এটির গবেষণার কাজ এখনো চলছে।
বাংলা ভাষা হল জটিল ভাষা, এতে যুক্তাক্ষর এবং মাত্রার ব্যবহার আছে, বাংলার ন্যায় হিন্দিতেও এবং বিশ্বের আরও অনেক ভাষাতে যুক্তাক্ষর এবং জটিলতা আছে। তাই অনেক সময় কম্পিউটারের পক্ষে সেটিকে বুঝতে কঠিন হয়।
তথ্যসূত্র
[সম্পাদনা]বহিঃসংযোগ
[সম্পাদনা]- ICDAR ওয়েব্যাক মেশিনে আর্কাইভকৃত ১৩ জুলাই ২০০৯ তারিখে, a comprehensive conference on all aspects of document recognition
- Linux OCR: A review of free optical character recognition software
Text is available under the CC BY-SA 4.0 license; additional terms may apply.
Images, videos and audio are available under their respective licenses.