भारती लिपि (Bharati Script) और OCR योजना – IIT मद्रास की पहल

Richa KishoreScience Tech

भारतीय प्रौद्योगिकी संस्थान – मद्रास के शोधकर्ताओं ने डॉ. श्रीनिवास चक्रवर्ती के नेतृत्व में भारती लिपि (Bharati Script) नामक एक लिपि बनाई है जो नौ भारतीय भाषाओं के लिए प्रयोग की जा सकती है.

साथ ही, भारती में लिपिबद्ध प्रलेखों को पढ़ने के लिए एक बहुभाषीय आँखों से अक्षर पहचानने (Optical Character Recognition – OCR) योजना भी तैयार की गई है.

OCR योजना क्या है?

  • इसके अन्दर सबसे पहले प्रलेख को दो भागों में अलग किया जाता है – टेक्स्ट और नॉन-टेक्स्ट.
  • तत्पश्चात् टेक्स्ट को अनुच्छेदों, वाक्यों, शब्दों और अक्षरों में बाँट दिया जाता है.
  • प्रत्येक अक्षर को ASCII अथवा यूनिकोड फॉर्मेट के अक्षर के रूप में पहचाना जाता है.
  • प्रत्येक अक्षर के अन्दर विभिन्न अवयव होते हैं, जैसे – आधारभूत व्यंजन, व्यंजन परिवर्तक, स्वर आदि.

भारती लिपि क्या है?

यह भारतीय भाषाओं के लिए एक वैकल्पिक लिपि है. इस लिपि में अनेक भारतीय लिपियों का समावेश हुआ है, जैसे – देवनागरी, बांग्ला, गुरुमुखी, गुजराती, ओड़िया, तेलगु, कन्नड़, मलयालम और तमिल.

bharati script

भारती लिपि (Bharati Script) की अक्षरमाला

भारती लिपि के अक्षर (characters) लम्बवत् तीन स्तरों में सजाये जाते हैं. इसमें किसी भी अक्षर के मूल में जो व्यंजन है उसे बीच में रखा जाता है और इससे सम्बंधित परिवर्तक (modifier) ऊपरी और निचले स्तर पर दर्शाए जाते हैं.

भारतीय लिपि में 17 स्वर और 22 व्यंजन होते हैं. आशा की जाती है कि पूरे देश के लिए एक समान लिपि होने से देश में वाद-संवाद में आने वाली अड़चनें दूर हो सकती हैं.

Spread the love
Read them too :
[related_posts_by_tax]