Wednesday, March 26, 2008

भारतीय उपमहाद्वीप, स्थानीयकरण आंदोलन और मुक्त स्रोत




भारत के प्रसिद्ध कन्नड़ लेखक यू.आर.अनंतमूर्ति ने एक साक्षात्कार में बताया था कि भाषाएं तहजीब की खजाना होती हैं। भाषाओं की इस तहजीब को योग्य व समर्थ बनाने की अहमियत न केवल इसे जीवित रखने में बल्कि इसे पल्लवित पुष्पित करना आज के डिजीटल दुनिया में कम जरूरी नहीं रह गया है। यदि कोई भाषा डिजिटल जमाने यानी प्रगति का भाग नहीं होती है, तो वह भाषा पुरानी हो जाएगी, अपना वजूद खो देगी, उसका अस्तित्व खतरे में पड़ जाएगा और कुछ मायनों में वह गुजरे जमाने की वस्तु बन जायेगी। भाषा का अन्त का मतलब है सभ्यता की मौत। धन्यवाद है फ्री साफ्टवेयर विचारधारा और समकालीन ओपन सोर्स विकास प्रक्रिया, जिसने कई विभिन्न भाषाओं को नवजीवन दिया। हम कितने छोटे हैं, हमारी तादाद कितनी है, वहां यह कोई अर्थ नहीं रखता है। फ्री व ओपेन साफ्टवेयर अन्य ब्यूरोक्रेटिक प्रक्रिया से भिन्न आप सहित प्रत्येक व्यक्ति को, स्थानीय भाषा कम्प्यूटिंग को योग्य बनाने के लिए योगदान और इस कारण ग्रामीण भारत में कम्प्यूटर द्वारा तकनीक को अपनाने की प्रक्रिया को गतिशील करने के लिए सक्षम बनाता है। हम सभी महात्मा गांधी के उद्धरण की प्रशंसा किये बिना नहीं रह सकते कि ”आप जो कुछ भी करते है, वह महत्वपूर्ण नहीं भी हो सकता है, लेकिन यह बहुत महत्वपूर्ण है कि आप इसे करते हैं।” यह एक सच्चाई है कि मालिकाना समूह उन आम लोगों की आवश्यकता को पूरा करने को तत्पर नहीं होती, खासकर क्रय शक्ति की अर्थव्यवस्था में, लेकिन हम ओपेन सोर्स कम्प्यूटिंग में आम जनों के सरोकार से सम्बन्धित अवसर पैदा कर सकते हैं।

भारत में, कई समूह कम्प्यूटर पर भाषा सम्बन्धी कार्य कर रहे है. “लोकलाइजिंग फ्री सॉफ्टवेयर फॉर ए फ्री कंट्री” के नारे के साथ इंडलिनक्स (www.indlinux.org) एक व्यापक और लोकप्रिय ग्रुप है जिन्हें इस कार्य में काफी सफलता मिली है। इंडलिनक्स ऐसे लोगों का समूह है जो बिना किसी हैरानी के विश्वास जताते हैं कि सूचना तकनीक के फायदे आम भारतीयों को व्यापक तौर पर मुफ्त उपलब्ध होना चाहिए। इस संगठन ने कई नये समूहों को आगे आकर साथ-साथ कार्य करने के लिए प्रेरित किया है। पनलिनक्स (http://punlinux.sourceforge.net) बेहद कामयाब मिसाल है। दो वर्षो के दरम्यान इस समूह ने भारत की स्पदंन पूर्ण भाषा एवं संस्कृति पंजाबी में भारी मात्रा में तकनीक को स्थानीयकृत किया है। हर चीज चाहे वह फेडोरा हो, या गनोम, या केडीई या फिर ओपनऑफिस और सब कुछ सभी ! ग्रामीण भारत में फली-फूली एक संगठन की बड़ी सफल कहानी ! पनलिनक्स के किसी भी सदस्य का कोई शहरी आधार नहीं। भाषा एवं ओपेन सोर्स के लिए स्नेह का मिश्रण इस उदाहरण ने अविश्सनीय परिणामों को जन्म दिया है।

लिनक्स के भारतीयकरण के लिए कई प्रयास किये जा रहे हैं। एक बड़ी कोशिश, अंकुर (www.bengalinux.org), पहला सामूहिक कदम है बंगाली को फ्लॉस डेस्कटॉप पर लाने का। अंकुर का मुख्य लक्ष्य है जीएनयू/लिनक्स ओएस को पूरी तरह स्थानीयकृत कर उपलब्ध कराना तथा इन्हें इस क्षेत्र में अच्छी सफलता मिली है। गुजराती भाषा समुदाय को कम्प्यूटर की ताकत देने में उत्कर्ष (www.utkarsh.org) का योगदान काफी बड़ा है। यह सबसे व्यवस्थित- व्यावसायिक संगठनों में से एक है। इंडियनओएसएस (www.indianoss.org) गुजराती कम्प्यूटिंग के लिए प्रतिबद्ध दूसरा बड़ा नाम है। तमिल के कई सक्रिय समुदाय है- http://sourceforge.net/projects/zha बड़े प्रयासों में से एक है। तमिल लिनक्स (http://groups.yahoo.com/group/tamilinix) लिनक्स/यूनिक्स पर विकसित दूसरा महत्वपूर्ण समूह है. भारत में भारतीय भाषाआें में ओपनऑफिस लाने के लिए आईसीटी रिसर्च एंड ट्रेनिंग सेन्टर द्वारा भारतीयओओ परियोजना (http://trinetra.ncb.ernet.in/bharateeyaoo) पहला कदम है। यह काम डेवलेपमेंट गेटवे फाउन्डेसन के क्रियाकलाप के रूप में किया जा रहा है।

हिन्दी भाषा के लिए कई संगठन काम करते हैं। इंडलिनक्स ने भी अपना काम हिन्दी से ही शुरू किया। हिन्दी के लिए विभिन्न परियोजनाओं को एक सूत्र में बांधने के इरादे से सोर्सफोर्ज पर हिन्दी प्रोजेक्ट (http://hindi.sourceforge.net ) भी शुरू हुई है। यह मूलतः फेडोरा, गनोम, केडीई, मोजिला, और ओपनऑफिस पर केंद्रित किए हुए है। मलयालम परियोजना (http://malayalam.sarovar.org) मलयालम पैकेज के लिए टाईप सेटिंग के वास्ते माक्रोस और फोन्टस का एक सेट ऑफर करता है, जो दक्षिण भारतीय राज्य केरल के अनुमानित सवा तीन करोड़ लोगों की प्राथमिक भाषा है। सरोवर परियोजना (http://sarovar.org/projects/oriya/) ओड़िया में लिनक्स को उपलब्ध कराने का पहला चरण है। जीएनयू/लिनक्स तेलुगु लोकलाइजेशन एफर्ट (http://telugu.sarovar.org) सामान्य अनुप्रयोगों को जीएनयू/लिनक्स गनोम, केडीई, मोजिला और ओपेन आफिस सहित सबको स्थानीयकृत बनाने का लक्ष्य रखता है। स्वतंत्र मलयालम कम्प्यूटिंग (http://sarovar.org/projects/smc) मौजूदा समय में जीएनयू/लिनक्स आलेखीय अंतरफलक को मलयालम में अनूदित/स्थानीयकृत करने हेतु रोशनी प्रदान करता है। स्वतंत्र मलयालम फोंटस (http://sarovar.org/projects/smf) स्वतंत्र मलयालम कंप्यूटिंग की एक सहायक परियोजना है। इसका मकसद मलयालम फोंटस को प्रर्याप्त आजादी देना है। इंडिक ट्रांस (www.indictrans.org) भारतीय भाषाओं में लिनक्स स्थानीयकरण के लिए कार्य करता है। इंडिक-कंप्यूटिंग प्रोजेक्ट (http://indic-computing.sourceforge.net) भारतीय भाषा कंप्यूटिंग सवालों के लिए तकनीकी दस्तावेज मुहैया कराता है। और कई नाम हैं: कन्नड़ लोकलाईजेशन इनीशियेटिव (http://kannada.sourceforge.net) कन्नड़ की भाषा के लिए कार्य करता है और तमिज लिनक्स (http://www.thamizhlinux.org) तमिल भाषा में एक दूसरा प्रयास है। फ्री सॉफ्टवेयर लोकलाइजेशन इन असामीज (http://sourceforge.net/projects/luit) असमिया भाषा के लिए कार्य करता है। मराठा ओपेन सोर्स (http://groups.yahoo.com/group/MarathiOpenSource) मराठी भाषा के लिए। स्वेच्छा (www.swecha.org) जो तेलुगु भाषा के वास्ते प्रयास करता है। मैथिली जो भारत के बिहार राज्य के खास क्षेत्र में बोली जाती है और जिसे पिछले वर्षों में भारतीय संविधान की अनूसूची में शामिल किया गया है, के लिए भी एक परियोजना मैथिली कंप्यूटिंग रिसर्च सेंटर (http://maithili.sourceforge.net) नाम से शुरू हुई है। बिहार में ही मूल रूप से ज्यादा बोली जाने वाली परंतु व्यापक रूप से लोकप्रिय भोजपुरी भाषा के लिए भी काम शुरू हो चुका है. भोजपुरी कंप्यूटिंग सेंटर (http://bhojpuri.sourceforge.net) नाम से यह कोशिश पटना में रहने वाले एक समूह की कोशिशों का नतीजा है। इन सबसे समझा जा सकता है कि मुक्त श्रोत कंप्यूटिंग का कितना फैलाव हो चुका है. उदाहरणों से पता चलता है कि पारदर्शी एवं सामूहिक ऑपेन सोर्स लोकलाईजेशन और इसकी प्रणाली बड़ी सतर्क एवं जवाबदेह है। फिर भी कई भाषाओं पर काम होना अभी बचा है। भारत जैसे भाषाई वैविध्य रखने वाले देश में और प्रयास की जरूरत है।

यदि भारतीय उप महाद्वीप के वर्णन के लिए यदि कोई बीजशब्द का इस्तेमाल किया जाय तो वह निश्चित रूप से होगी विविधता। भारत में तकरीबन 500 भाषाएँ हैं जिसमें 22 भाषाएं संविधान की आठवीं अनुसूची में शामिल है। स्थिति की कल्पना इससे की जा सकती है कि सिर्फ एक छोटा सा मुल्क नेपाल जहाँ 50 से अधिक भाषाएँ हैं। देर सबेर ये सभी छोटी भाषाएँ सूचना प्रौद्योगिकी के साथ कंधे से कंधे मिला कर चलने की उम्मीद तो कर सकती है, लेकिन सिर्फ फ्री साफ्टवेयर के दर्शन के ही सहारे। भारत के पड़ोसी देशों में भी लोकलाइजेशन आंदोलन की शुरूआत हो चुकी है। पर्वतीय भाषा- गोरखाली यानी नेपाली बोलने वालों की संख्या फकत 16 लाख है। गत वर्ष नेपाली भाषा में लोकलाईजेशन के क्षेत्र में मदन पुरस्कार पुस्तकालय (www.mpp.org.np) के साथ कार्य करने वाले एक समूह ने सार्थक पहल कर महत्वपूर्ण गति प्रदान की है। इस समूह ने गनोम डेस्कटॉप को पूरी तरह स्थानीयकृत किया है. भूटानी जो भूटानी राजतंत्र की राष्ट्रभाषा है, को पूर्णत: लोकलाइज्ड किया है। Dzongkha लोकलाइजेशन प्रोजेक्ट (http://dzongkha.sourceforge.net) का उद्देश्य Dzongkha स्क्रिप्ट को लिनक्स साथ जोड़कर इसे मजबूत करना है ताकि भूटान के आम नागरिकों को सूचना एवं संचार तकनीक का लााभ मिल सके। यह परियोजना भूटान की राजकीय सरकार द्वारा लागू की गई है और यह इन्टरनेशनल डेवलपमेंट रिसर्च सेंटर (IDRC) कनाडा के पैन एशिया नेटवर्किंग (PAN) द्वारा

वित्त प्रदत्त है। सिंहाला लिनक्स प्रोजेक्ट (http://sinhala.linux.lk ) एक दूसरी परियोजना है सिंहाला में लिनक्स के स्थानीयकरण का। यह लंका लिनक्स यूजर ग्रुप (LKLUG) द्वारा प्रारंभ किया गया। पैन लोकलाइजेशन प्रोजेक्ट (www.panl10n.net) का व्यापक परिसर है। एशिया में स्थानीय भाषा क्षमता विकसित करने का यह एक क्षेत्रीय प्रयास है। यह संगठन निम्नलिखित भाषाआें के लिए कार्य करता है: बांग्ला, भूटानी, ख्मेर, लाओ, नेपाली, पश्तो, सिंहाला और उर्दू!

प्राय: सबल भाषा अल्पसंख्यक भाषा को दबाती है। लेकिन पाकिस्तान में पंजाबी भाषा के साथ इस तरह की बात नहीं है। पाकिस्तान में पंजाबी भाषा बहुसंख्यकों की भाषा है। लेकिन वहाँ की सरकार इस भाषा को मदद करती नहीं मालूम पड़ती है। इसीलिए पनलिनक्स ने शामुखी स्क्रिप्ट में पंजाबी भाषा के स्थानीयकरण के वास्ते शुरू करने की योजना बनायी है। और इसे अलग लोकेल देने हेतु आग्रह पहले ही किया जा चुका है। यह सिर्फ आपेन सोर्स की दुनिया में संभव हो सकता है। लोकतंत्र की तरह ही जहाँ हर आदमी बराबर है, प्रत्येक भाषा को कंप्यूटर की तकनीक में एक जैसा दर्जा दिया जा सकता है।

मुक्त श्रोत सॉफ्टवेयर का स्थानीयकरण पारदर्शी और समुदाय चालित प्रक्रिया है। यही वजह है कि स्थानीय आवश्यकताओं के अनुरूप साफ्टवेयर को पसंदीदा करना आसान है। कभी-कभी सांस्कृतिक विभिन्नताओं के चलते लोग पश्चिमी प्रयोक्ता अंतरफलक के साथ सुविधा महसूस नहीं करते। लेकिन कठिनाई यहीं समाप्त नहीं हो जाती। फोल्डर्स और रिसाइकिल बींस को समझने के लिए होने वाले विशिष्ट ग्रामीण भारतीय संघर्ष की कल्पना करें! खासकर व्यापक भाषा हिन्दी के मामले में और बंगाली व पंजाबी के मामले में जो दो भिन्न देशों में बोली

जाती है। एक सच्चाई है कि पूरी भाषा बुनियादी तौर पर दो पड़ोसी देशों में विभिन्न क्षेत्रों में विभक्त है। भारत की आधी से अधिक आबादी में हिन्दी बोली और समझी जाती है और इसकी अनगिनत बोलियां है। ओपन सोर्स के माहोल में लाभ-हानि के सिद्धांत को ध्यान दिये वगैर विशिष्ट जरूरतों के मुताबिक वस्तुओं को ढालना ज्यादा आसान है। ओपन सोर्स मॉडेल न सिर्फ स्थानीय आवश्यकताओं को पाने में मदद करता है, बल्कि स्थानीय भावनाओं के आदर का भी ख्याल रखता है। यहां अगर समुदाय की इच्छा हो तो वह भाषा की सांस्कृतिक अंतरों के आधार पर भाषा के लिए अलग अलग लोकेल की मांग भी कर सकती है और ऐसा कोई मुक्त श्रोत की दुनिया में अनजाना नहीं है। मुख्य रूप से ओपेन सोर्स के लोकलाइजेशन में ही भविष्य की भाषा को कंप्यूटिग करने की ताकत है।

स्थानीयकरण हेतु प्रयास को सफलीभूत व रोचक बनाने में रेड हैट का योगदान बेमिसाल है। पाँच भारतीय भाषाओं (हिन्दी, बंगाली, तमिल पंजाबी एवं गुजराती) का चयन तीन वर्ष पहले ही कर रेड हैट भारतीय आवश्यकताओं से संबंधित लोकलाइजेशन (l10n) और अंतरराष्ट्रीयकरण (i18n) कार्यों को अपने उत्पाद में बड़ी व्यापकता से सम्मलित किया है। स्थानीय भाषाओं में कंप्यूटर पर कार्य करना कभी भी इतना आसान नहीं था। रेड हैट एन्टरप्राइज लिनक्स पाँच भारतीय भाषाओं में पहले ही जारी किया जा चुका है और उसे न केवल अनुप्रयोगों के स्तर बल्कि ऑपरेटिंग सिस्टम स्तर पर भी स्थानीयकृत किया गया। रेड हैट ने इस पांचवें संस्करण से कुछ और भाषाओं में ऐसे प्रयासों को समर्थन देना शुरू कर दिया है - आसामी, कन्नड़, मलयालम, मराठी, ओड़िया, सिंहाला, और तेलुगु। भारत एवं इसकी स्थानीय भाषा कंप्यूटिंग उद्योग के प्रति रेड हैट की संवेदना एवं वचनवद्धता को दर्शाने के लिए यह काफी है।

भारत के भूतपूर्व राष्ट्रपति अब्दुल कलाम ने एक बार कहा- ”भारत में ऑपेन सोर्स कोड साफ्टवेयर को हमारे करोड़ो लोगों के हित के लिए आना और स्थायी रूप से ठहरना होगा”। भारत जैसे गरीब मुल्क में जहाँ प्रति व्यक्ति आय औसत से बहुत कम है, जनाब कलाम साहब के लब्ज इस देश के लिए महत्वपूर्ण आधार वाक्य होना चाहिये। ये सभी स्थानीयकृत कंप्यूटर ग्रामीण कंप्यूटिंग के क्षेत्र में बड़ा लाभदायक होगा। सच्चे भारत के लोग सिर्फ अपनी नेटिव लेंगवेंज बोलते हैं। उनके लिए अंग्रेजी ब्रिटानिया प्रभाव तथा शोषण की भाषा एवं संस्कृति का प्रतिनिधित्व करती है। भारत में, खासकर देहाती क्षेत्रों में रेडियो एवं टीवी के गहरे प्रभाव के कारण का विश्लेषण करने से हम समझ सकते हैं कि इसका मुख्य कारण स्थानीय भाषाओं में टी.वी. कार्यक्रमों के प्रस्तुति की उपलब्धता है। भारत में स्थानीयकरण आन्दोलन ने विदेशी कंप्यूटर को देशी में बदल दिया है - हमारा कंप्यूटर, आपका कंप्यूटर। स्थानीय भाषा आईटी बाजार विकासशील अवस्था में है और यह लगातार बढ़ रहा है। ई - गर्वनेंस एक बृहत क्षेत्र हैं जहाँ लोकलाइजेशन सॉफ्टवेयर की नितांत आवश्यकता है। हार्डवेयर की कीमत बड़ी तेजी से गिरती जा रही है और इस संदर्भ में स्थानीयकृत ऑपेन सोर्स सॉफ्टवेयर श्रेष्ठ व भरोसेमंद है।

बीते वर्ष सरकार ने सभी 22 राजकीय भाषाओं में सीडी जारी करने का व्यापक कार्यक्रम शुरू किया है। हिन्दी, तमिल तथा तेलगू भाषा की सीडी पहले ही लांच कर चुकी है। असामी, कन्नड़, मलयालम, मराठी, ओडिया, पंजाबी और उर्दू की सीडी भी जारी किया जा चुका है। साथ ही कई अन्य भाषाओं पर काम जारी हैं जिसे निकट भविष्य में ही जारी करने की योजना है। सीडी पर उपलब्ध ज्यादातर अनुप्रयोग जनरल पब्लिक लाइसेंस के तहत जारी किये गये। यह भारत में स्थानीयकरण आन्दोलन की कामयाबी की बड़ी कहानी है। यह भारत सरकार द्वारा वित्त प्रदत्त है। इसके तहत करोड़ों सीडी आम लोगों के बीच भेजे जा रहे हैं। कोई भी व्यक्ति मुफ्त की भाषा सीडी के लिए आवेदन कर सकता है। इंडिक्स (www.cdacmumbai.in/projects/indix ) भारतीय भाषाओं के लिए प्रौद्योगिकी विकास (http://tdil.mit.gov.in ) द्वारा वित्त पोषित एक और परियोजना है जो लिनक्स की सहायता के लिए भारतीय भाषा में कार्य करता है। सरकारी संगठन सीडैक (http://www.cdac.in) ने भी ऑपेन सोर्स सॉफ्टवेयर के स्थानीयकरण के लिए महत्वपूर्ण कार्य किया है और इन सरकारी प्रयासों से मूलभूत रूप से जुड़ा है।

भारत में अनेकों लोग एवं कई संगठन हैं जो ऑपेन सोर्स विचारधारा के पक्षधर रहे हैं। इसका एक प्रभावशाली व अनोखा उदाहरण है - महात्मा गांधी अर्न्तराष्ट्रीय हिन्दी विश्वविद्यालय, वर्धा जिसकी 1997 ई. में स्थापना हिन्दी का वैश्विक स्तर पर प्रचार प्रसार के लिए की गई थी। प्रख्यात हिन्दी कवि एवं भारत सरकार में संस्कृति मंत्रालय में सचिव रह चुके अशोक वाजपेयी इस विश्वविद्यालय के प्रथम कुलपति थे और उन्होंने विश्वविद्यालय को पूर्ण रूपेण ऑपेन सोर्स के जरिये चलाने का निर्णय लिया था। अपने कार्यकाल के दौरान श्री वाजपेयी ने दो किताबें (हिन्दी में) और एक द्विभाषिक पत्रिका लीला (हिन्दी और अंग्रेजी) पूर्ण रूप से ऑपेन सोर्स टेक्नालोजी के आधार पर प्रकाशित करवाए थे। स्थानीय भाषा में कार्य करने वाले साफ्टवेयर खासकर हिन्दी में ओपन सोर्स कंप्यूटर आधारित तकनीक को अपने परिसर में स्थान देना यही विश्वविद्यालय का मुख्य लक्ष्य था। इसे अोपन श्रोत का दुर्भाग्य कहेंगे कि उनके कार्यावधि के बाद स्थिति उतनी सकारात्मक नहीं रही।

दिल्ली स्थित गैर लाभकारी संस्था सराय (www.sarai.net) मुक्त सॉफ्टवेयर का उपयोग, प्रचार एवं विकास के प्रति पूर्ण रूपेण वचनबद्ध है। कुछ भारतीय भाषाओं के स्थानीयकरण में सराय ने मुख्य भूमिका अदा की है। सराय के मुताबिक फ्री साफ्टवेयर कोड पर मालिकाना नियंत्रण के वास्ते प्रजातांत्रिक विकल्प के रूप में प्रकट हुआ। सराय ने अनेकों लोगों को संग-साथ देकर एवं कई कार्यशाला खोलकर इस क्षेत्र में भाग लेने तथा इसे परिवर्धित करने के लिए प्रोत्साहित किया है और लगातार कर रहा है।

वस्तुतः मुक्त श्रोत के प्रयास बचे हुए बैबल की मीनार को पूरा करने के काम जैसा है. बाइबिल में वर्णित एक कथा के मुताबिक पहले इतनी भाषाएं नहीं थीं. सिर्फ एक भाषा थी जिसमें लोग अपनी भावना, पीड़ा, दुख-सुख, मौज-मस्ती बांटते थे। वही एक भाषा ज्ञान की भाषा थी, वही विज्ञान की भाषा थी। भाषा एक मानवता एक। समग्र मानवता ने एकबार सोचा कि क्यों न ऐसी मीनार बनाई जाए जो स्वर्ग तक जा सके ताकि स्वर्ग की हकीकत सामने आ सके. ताकि अंतिम सत्य पाया जा सके. लेकिन ईश्वर को यह कहां मंजूर था। यह तो ईश्वर की सत्ता को खुली चुनौती थी। उन्होंने सोचा कि सबसे बढ़िया तरीका है कि सबों की भाषाएं अलग-अलग कर दी जाए…और फिर सबों की भाषाएं अलग-अलग हो गईं। एक ऐसी दुनिया रच दी ईश्वर ने जिसमें कोई किसी की भाषा नहीं समझता था…मीनार वहीं रूक गई। स्वर्ग तक न पहुँचा जा सका। जिह्वा-भ्रम की वह स्थिति आज भी ज्ञान के विकेंद्रीकरण के बीच बड़ी दीवार बनकर खड़ी है। खासकर कंप्यूटर व आईटी जैसे क्षेत्रों में यह बड़ी रूकावट है। शासन व शोषण की भाषा अंग्रेजी में कंप्यूटर आम आदमी की समझ से बाहर है…वैसे में ओपन सोर्स एक रास्ता दिखाती है जिसपर हर कोई आ-जा सकता है. वहां हर भाषा समान है चाहे वह करोड़ों के द्वारा बोली जाती हो या कुछ चंद लोगों के द्वारा। गौरतलब है मुक्त श्रोत सर्वोत्तम की उत्तरजीविता के बजाय सर्वजन हिताय सर्वजन सुखाय का काम करती है. तभी तो इनके द्वारा पंजीकृत भाषाओं की सूची में पांच-दस रणनीतिक रूप से सबल भाषाएं नहीं दिखती बल्कि करीब सौ भाषाएं दिखाई देती हैं, जिसपर काम करने के लिए कोई स्वामित्ववादी कंपनियां सोच भी नहीं सकती हैं।

यह आंदोलन खुला है…इसका आप भी हिस्सा हो सकते हैं, आप भी शिरकत कर सकते हैं. बड़े स्तर पर भाषा के लिए की जा रही इस कार सेवा में आप भी योगदान दे सकते हैं। यह समुदाय समर्थित दुनिया है, जो मुक्त श्रोत सॉफ्टवेयर की दुनिया है। एक ऐसी बड़ी, व्यापक और ज्यादा भरोसेमंद दुनिया जो आपको पूरा का पूरा दरवाजा खोलकर आपको गले से लगाती है और कहती है कि आइए और हमारे साथ आप दुनिया को अंतर्वस्तु के लोकतंत्रीकरण की ओर ले जाइए, जहां तकनीक एक खास किस्म की बपौती न हो…यानी जहां ज्ञान दीवार विहीन हो…ज्ञान मुक्त हो। स्वामित्ववादी कंपनियां अपने केंद्र में लाभ को रखती है और जाहिर है अगर आप उसकी पूंजी में इजाफा नहीं कर सकते हैं… तो आप बेकार हैं, आपकी भाषा फालतू है। यही नहीं भारत जैसे औपनिवेशिक स्वरूप वाले देश में जहां अंग्रेजी आम भारतीय के लिए अनिवार्य सर दर्द बनकर साथ चल रहा है वहां वे कंपनियां यह भी सोचती हैं कि आखिर भारत में जरूरत क्या है अपने सामानों को भाषाओं में रखने की। ज्यादा से ज्यादा हम हिन्दी में दे देंगे वह भी किसी एजेंसी से अनुवाद करवाकर। उन्हें खाना पूर्ति के लिए भाषा चाहिए पर आपके और हमारे लिए भाषा हमारी सांसें हैं हमारी जिंदगी है। इसलिए अगर कोई कंप्यूटर उत्पाद का निर्माता अगर स्थानीय भाषा में करने की मशक्कत भी करता है तो हिन्दी और दो-एक महत्वपूर्ण भाषाओं में। शेष भाषाएं तकनीक की भागम-भाग में पीछे छूटती जा रही है. पन्नों के स्थान वैब पेज ले रहें हैं। किताबों का स्थान ई-पुस्तकें ले रही हैं. कहीं तकनीक सबल भाषाएं कमजोर भाषाओं को लील न ले। चिंता और चिंतन दोनों जरूरी है कि कैसे इससे बचा जाए. हम बचा सकते हैं अपनी भाषा को इस आभासी मायावी दुनिया में खोने से। और निश्चित रूप से तरीका हमें ओपन सोर्स सुझाता है… समुदाय के जनपथ पर बढ़िये और हासिल कीजिए वह सब जिसे आप कल तक सपना समझते थे।

स्थानीयकरण का कार्य काफी पहले शुरू हुआ और अब यह आन्दोलन का रूप ले चुका है। इन्टरनेट की उपलब्धता, संसाधनों का अभाव और निरक्षरता स्थानीय भाषा कंप्यूटिंग के रास्ते में कुछ बाधाएं है। सबसे बड़ी बाधा अंग्रेजी बोलने वालों की मानसिकता है जो स्थानीय भाषा में कंप्यूटिंग की कोशिशों का मजाक उड़ाता है। ऐसे लोगो के पास सरजमीनी अनुभव नहीं हैं, लेकिन अभी भी वे लोग प्रशासन एवं वित्त में बड़ी पहुंच कायम किए हुए हैं लेकिन अन्तत: उन्हे स्थानीय भाषा कंप्यूटिंग बाजार के सामने झुकना होगा। दो दशक पूर्व, दूरदर्शन उद्योग की स्थिति भारत में वर्तमान कंप्यूटर उद्योग के तरह ही थी। सकारात्मक बदलाव अवश्यम्भावी है और कंप्यूटर के क्षेत्र में भी यह बहुत दूर नहीं है। कवि अशोक वाजपेयी ने एक मर्तबा लिखा था कि ज्ञान के नि:स्वार्थ प्रसार की भारतीय परंपरा बहुत पुरानी और वैश्विक है। हम लोग कह सकते है कि फ्री सॉफ्टवयेर आन्दोलन पुरानी भारतीय परंपरा का ही पाश्चात्य संस्करण है। श्री वाजपेयी की बात बहुत ठीक है और इसीलिए भविष्य में लंबी अवधि में भारतीय मिट्टी ओपेन सोर्स सॉफ्टवेयर के वास्ते खुद को उर्वर साबित करेगी। जहाँ ज्ञान हो मुक्त नोबेल पुरस्कार प्राप्त कवि रवीन्द्र नाथ टेगौर का अपने राष्ट्र के लिए सपना था। समय अब उस स्वप्नलोक की ओर आगे बढ़ रहा है।

Localization as a movement in India


A few days back, a famous writer from Kannada, India, U R Anantmurthy, mentioned in an interview that languages are the repositories of culture. The importance of enabling this culture of languages to not merely survive but flourish in this digital age cannot be understated. If a language is not becoming part of digital advancement then the language will become outdated and endangered and in some cases might even become a thing of the past. End of a language means end of a culture. Thanks to the free software ideology and contemporary open source development methods that have given a new lease on life to many different languages, no matter how small we are, we now have the potential to fix this fundamental issue. Free and open source software, unlike other bureaucratic processes, enable each individual, including you, to contribute toward enabling local language computing and thereby expediting the process of adoption of technologies enabled by computers in rural India. We all can cherish Mahatma Gandhi's quote "Whatever you do will be insignificant but it's very important that you do it." That is why the free software movement enabled by collaborative peers in the community is of paramount importance here. It is a fact that proprietary groups cannot afford to fulfill the needs of the masses, especially in an economy with limited purchasing power, but we in the community of open source computing can rise to the occasion.

In India, so many groups are working to have their languages enabled on computers. "Localizing free software for a free country" is the slogan of IndLinux, a major and popular group having enormous success with this work. IndLinux is a group of people who believe, not so surprisingly, that the benefits of information technology must be widely and freely available to the Indian masses. They are a group of people who combine skills in written scripts, free/open source technologies, and technology journalism to make this happen.

This organization has inspired so many new groups to come forward to work together. Punlinux is one of the most successful examples. Within two years, this group has localized an enormous amount of content in Punjabi, a vibrant language and culture of India. Everything from Fedora® to GNOME to KDE to OpenOffice and all! A great success story from an organization based in rural India! None of the Punlinux members has any urban base! Mix of love for language and open source has produced unbelievable results like this one example.

There are several other efforts being made to Indianize Linux®. One major effort, Ankur, is a collaborative initiative aimed at bringing Bangla to the FLOSS (Free Libre Open Source Software) desktop. The core objective of Ankur is to make available a completely localized GNU/Linux OS and they have received notable success in this field.

Open source contribution of Utkarsh in giving the power of computers to the Gujarati speaking populace is also immense. It is one of the most professionally managed organizations. IndianOSS is another one committed to the cause of Gujarati computing.

Tamil has several active communities. http://sourceforge.net/projects/zha is one of the major efforts. TAMIL-LINux is another group involved in the development of Tamil on Linux/Unix. The BharateeyaOO project is an initiative to bring OpenOffice to India in Indian languages by the ICT Research and Training Centre (India). It is being done as part of the activities of the Development Gateway Foundation. Project Malayalam for the Malayalam Package offers a set of macros and fonts for typesetting Malayalam, which is the primary language of an estimated 33 million people in the South Indian state of Kerala. The Linux in Oriya project is the initiative for making Linux available in Oriya. The GNU/Linux Telugu Localization Effort aims at localizing most common applications on GNU/Linux to Telugu including GNOME, KDE, Mozilla, and OpenOffice. Swathantra Malayalam Computing at present is focusing on translating/localizing GNU/Linux GUI into Malayalam. Swathantra Malayalam fonts is a sub-project of Swathantra Malayalam Computing. Their aim is to make enough free (Swathantra) Malayalam fonts. Indic Trans also works in the field of Linux localization in Indian languages. The Indic-Computing Project is providing technical documentation for Indian language computing issues.

There are several more names: Kannada Localization Initiative works for Kannada language and Thamiz Linux is yet another effort from the Tamil language. Free software localization in Assamese works for Assamese, MarathiOpenSource works for Marathi language, Swecha is a GNU/Linux Telugu localization effort for Telugu language, and http://thamizha.com encompasses multiple projects such as localization of Firefox and OpenOffice among others. A project has even started for minority languages like Maithili, which is spoken in a particular part of a state of India and was incorporated in the schedule of the constitution of India in recent years. It is a fact that in some projects, the pace of work may not be as rapid, but the above examples show there is great awareness and response towards transparent and collaborative open source localization and its methodology.

If the subcontinent of India could be described in a single keyword, diversity would be it. There are about 500 languages in India in which 22 of them are considered official. It's easy enough to imagine the situation merely by knowing that in a small country like Nepal there are more than 50 languages. Sooner or later these smaller languages can hope to go hand in hand with information technology but only through the free software philosophy. The localization movement in the neighboring countries of India has also started. The language of the mountains of Gorkhali, a.k.a. Nepali, has only 1.6 million speakers. A group working with Madan Puraskar Pustakalay has shown a significant momentum in the field of localization in Nepali language last year. This group has completely localized the Gnome desktop. Dzongkha, sometimes called Bhutanese, is the national language of the Kingdom of Bhutan. The goal of Dzongkha Localization Project is to incorporate Dzongkha script into Linux to enable computing in Dzongkha to provide the benefit of information and communication technology to the Bhutanese masses. This project is implemented by the Royal Government of Bhutan and is being funded by International Development Research Center (IDRC), Canada, through its Pan Asia Networking (PAN).

The Sinhala Linux Project is another project to localize Linux in Sinhala. This was started by Lanka Linux User Group (LKLUG). The PAN Localization Project has a broader reach. It is a regional initiative to develop local language capacity in Asia. This organization is working for the following languages: Bangla, Dzongkha, Khmer, Lao, Nepali, Pashto, Sinhala, and Urdu. Generally, dominant languages suppress minority languages. But in the case of Punjabi in Pakistan it is different. In Pakistan, Punjabi is spoken by the majority but the government there does not seem to support this language. So Punlinux has planned to start the localization of Punjabi in Shamukhi script and already filed an enhancement request to create a separate locale for it. This can only be possible in the world of open source! Just like a democracy where every person is equal, in the eyes of open source, every language can be made equal in computing!

Localization of open source software is a transparent and community-driven process. That is why it is easier to customize the software according to local needs. Sometimes, due to cultural differences, people may not be comfortable with western user interfaces. But the difficulty does not stop there. Imagine the struggle of the typical rural Indian to understand metaphors like folders and recycle bins! You might as well as speak Greek, no offense to the friendly folks from Greece. It is particularly true in the case of a major language like Hindi and languages like Bengali and Punjabi that are spoken in two different countries that the whole language is basically split into different zones in two neighboring countries. Hindi is spoken and understood by more than half of the Indian population and has innumerable dialects. In the open source environment, it is easier to modify things according to specific needs irrespective of the profit-loss theory so very typical of the proprietary world. The open source model is not only helping to achieve the local need but also maintains respect for the local emotions. For example, Bengali is now divided into two separate locale (bn_BD and bn_IN) in Fedora and Mozilla after the demand from the community. Basically, localization in open source alone has the power to represent futuristic language computing.

The contribution of Red Hat making the localization effort successful and lively is enormous. By selecting five Indian languages (Hindi, Bengali, Tamil, Punjabi and Gujarati), Red Hat has given great impetus to l10n and i18n works related to Indian needs. Working on a computer with local languages was never so easy. Red Hat launched Red Hat Enterprise Linux and Fedora in those five Indian languages and localized them at not only the application level but at the operating system level also. Red Hat is going to launch similar efforts in eight more languages: Assamese (as), Kannada (kn), Malayalam (ml), Marathi (mr), Oriya (or), Sinhala (si), Telugu (te), and Urdu (ur). This is enough to demonstrate Red Hat's compassion and commitment to India and its local language computing industry.

The President of India, Abdul Kalam once said, "In India, open source code software will have to come and stay in a big way for the benefit of our billion people." In a poor country like India where per capita income is much lower than the average, words of our president and visionary Mr. Kalam should be an important bottom line. These localized computers will be very useful in the field of rural computing. The people of real India only speak their native languages. For them, English represents the language and culture of British domination and exploitations. In analyzing why radio and television has a deep-rooted impact in India, especially in the rural areas, we can understand that the main reason is the availability of television programs produced in local languages. The localization movement in India has made 'alien' computer 'desi' one--hamara computer, tumhara computer. The Local Language IT market is in a development stage and it is rising with exponential growth. E-governance is one major field where localization of software is a must. The cost of hardware is going down very fast and in this context, the future of localized open source software is great.

Last year the government started a program to launch localized CDs in all 22 official languages. Hindi, Tamil, and Telugu language CDs have already launched. Many of the applications available on the CD were released under the GNU General Public License (GPL). This is a success story of the localization movement in India. The initiative has been funded by the Indian government. It has planned to distribute 3.5 million copies of the Hindi Language CDs after the popularity. IndiX is a project funded by TDIL working on Indian language support for Linux. CDAC, a government organization, has also done important work for supporting open source software localization.

There are many people and several organizations in India that support the open source ideology. A strikingly unique example of this is the establishment of Mahatma Gandhi Antarrashtriya Hindi Vishwavidyalaya (Mahatma Gandhi International Hindi University) in 1997. An eminent Hindi poet and former Secretary in the Ministry of Culture of India, Mr. Ashok Vajpeyi was the first vice chancellor of the university and he made the decision to run the university completely on open source. During his tenure, two books (in Hindi) and a bilingual magazine (in Hindi and English) were published completely on open source technology. Having open source computer based technology which works in a native language, particularly in Hindi, was the main target of the university. (On the website it is still the same!!) It is unfortunate that the situation hasn't been so positive after the completion of his term!

The Delhi-based non-profit organization Sarai is fully committed to the use, propagation, and development of free software. Sarai has played a key role in the localization of some of the Indian languages. According to Sarai, free software emerged as a democratic alternative to proprietary control over code. Sarai has encouraged so many people to engage and enlarge this domain by giving fellowships and having several workshops.

The work of localization started long before and now it has taken the form of movement. Internet availability, lack of resources, and illiteracy are some hindrances in the path of local language computing. The major hurdle is the mentality of the English speaking elite who sneer at the local language computing efforts. The elite have not had any grass-root experience, but they are still controlling the major positions within administration and finance. But ultimately they have to stumble down against the force of the local language computing market. Two decades ago, the condition of the television industry was similar to the present computer industry in India. Positive changes are inevitable and also not very far off in the field of computers.

Poet Mr. Ashok Vajpeyi once wrote that the Indian tradition of selfless distribution of knowledge is very old and universal. We can say that the free software movement is the western version of the old Indian tradition. Mr. Vajpeyi's statement is very right and so, in the long term, Indian soil will prove itself very fertile for open source software. "Where knowledge is free" was the dream of Nobel laureate Rabindranath Tagore for his nation and now the time is moving ahead toward his dreamland

About the author

Rajesh Ranjan is Language Maintainer, Hindi at Red Hat. He is working with several localization projects including Fedora, GNOME, Openoffice.org, and Mozilla. He is the Indic Language Co-ordinator for the Native Language Confederation of Openoffice.org. Before joining Red Hat, he worked with The Indian Express Group and Literate World, Inc.


(Originally published in Red Hat Magazine, Jan, 2006 issue

http://www.redhat.com/magazine/015jan06/features/rhindia/ )


The ‘Open' Tower of Babel


Here's a reality check on the regional desktop localisation efforts. According to the Bible, there was a time when all those on earth spoke one language. And humanity, united by one language, started building the Tower of Babel to reach the heavens and discover the ultimate truth. As this was open defiance against God's wishes, He thought that the best way to stop these efforts would be to create confusion between humans by making everybody speak different languages so that no one could understand each other. Soon, humans could no longer communicate with each other and the work halted. The Biblical myth ends with the tower being left unfinished, and mankind's dream of reaching the heavens effectively thwarted. "The confusion of tongues" created by a Biblical God has been preventing knowledge decentralisation even today. And this very confusion has also become a barrier in the process of actual penetration of IT, as more than 80 per cent of the population of the world speaks a language other than English. But in the world of open source, GNOME and KDE are serving as the ‘open' tower of Babel. GNOME and KDE are the two most popular desktop environments and are available in several languages. Today they are eroding the layers of the "confusion of tongue" by helping to create desktops in the languages people can understand.


The first constructor

GNOME 2.16 has just been released. Dzongka, Hebrew, Indian Bengali, Latvian, Malayalam, Norwegian Nynorsk, Slovenian and Tamil are the new languages supported in this latest version. Also noteworthy is the support for British and Canadian English. Among the languages of the Indian sub-continent that were already supported are Indian English, Gujarati, Hindi, Nepali and Punjabi. Marathi, Oriya and Telugu are also moving towards being supported. Do not be surprised by two versions of Bengali, Bengali (bn) and Indian Bengali (bn_IN). This is the result of the choice and freedom that open source offers to its communities. GNOME 2.16 is the world's first desktop release that features support for the Unicode Character Database (UCD), version 5.0, which defines more than 99,000 characters for the languages of the world. The improvements are built into GNOME libraries GLib and Pango, and are thus available to all other open source and free software projects that use these libraries. Some Indian regional languages are spoken by more people than the national languages of certain other countries. Sixteen of the top 70 global languages are Indian. GNOME and KDE ‘open' desktops are available in several languages. With more and more computer users shifting towards Linux, the demand for localised interfaces has gone up for non-English speaking users. The power of IT is coming to people in their own language. It is very exciting, but not a simple task at all. Translating the whole GNOME desktop is no mean task. There are 32715 strings to translate in GNOME 2.16. For GNOME 2.16, if you take a look at the status page, 119 languages are listed as being supported by the GNOME project. This statistic is mind-boggling. No commercial project can even think of localising as many languages as GNOME and KDE support.

The other constructor

KDE started translating itself before KDE 1 was released. And since then, KDE has added new languages every year. KDE's I18n (internationalisation) team leader, Stephan Kulow says, "In 1999, we had only 34 languages; in 2003 we were with 74 languages and today we have 88 languages." He also adds, "For KDE, translations are very important as many users do not speak English well enough to understand the interface without translation. KDE does not select languages, the translators of a language select KDE." This is the main advantage of open source. Commercial projects select languages on the basis of market share and profit, but KDE takes what it gets from contributors. Hindi, Tamil, and Punjabi teams have done wonderful work in translating KDE. Gujarati, Marathi, Bengali and Kannada are registered at KDE but these teams are not so active nowadays.

IndLinux has long been working on GNOME and KDE L10n (localisation). While steering the Hindi effort, it has also helped start Gujarati, Punjabi and many others. Even Nepal and Bhutan used IndLinux expertise to train their teams for localisation. The progress of the Nepali language on the GNOME L10n front has been very impressive. But the main force behind IndLinux- Karunakar-is not very satisfied with the progress of the recent localisation efforts. He feels that for the past one year, not many new translations have been added; existing ones have been updated or maintained. He stresses the need for a review workshop. Due to initiatives by Sarai and IndLinux, review workshops for the Hindi language have happened twice but most other languages lack this important aspect of localisation.

Hurdles in the path

The key to judging any language translation is its comprehensibility and consistency. Localisation of a desktop should be done according to the users' point of view. So without the review of the localised desktop of GNOME and KDE, it is not possible to get the entire benefit. Therefore Karunakar feels that the effort needs addressed first," asserts Ratlami. He goes on to add, "What we've addressed is only the tip of the iceberg. There are hundreds and thousands of things to be done in each and every Indian language." He gives the community a shot in the arm when he says, "The community has achieved something big with so little resources." According to Ratlami, KDE is definitely better, well thought out and well designed. Ravikant of Sarai has a very strong rationale for the availability of most linguistic projects on open source, "From its very inception, Sarai-CSDS has been inspired by the debates and practices around free software. We believe that these debates are crucial in understanding and interrogating the property regimes, the new form of which we encounter in the shape of ‘Intellectual property'. The licensing In the world of open source, GNOME and KDE are serving as the ‘open' tower of Babel. GNOME and KDE are the two most popular desktop environments and are available in several languages. more volunteers, more translations and more feedback from users. But unfortunately, that has not been coming in a significant way. "Localisation is one activity that has a low entry barrier, where anyone can get into the FOSS development. While it may seem a monotonous task, it can be very enriching in the long run and help preserve the language in the digital age," says Karunakar. Ravi Ratlami, one of the Indic language pioneers in open source localisation efforts, stresses on the need for some common funds to attract volunteers to do translations. "This job is very boring, non- glamorous and thankless in India. It must be compensated for in various ways. Also, there still exist several problems related to Unicode, Inscript or Font, that the community faces during translating anything into their mother tongue. These problems are of prime importance and should be procedures that challenge the dominant norm established by EULA are good for poorer societies like ours. Free Software is also the way to go for localisation, for globalists- induced localisation is on the whole market driven. The market typically supports languages that have big user-bases with a legacy of linguistic resources at their disposal. I believe that this digital moment is the one to grab if the languages that missed the print-technology bus want to revive themselves. It is easy to generate, store and circulate content in practically any language, even the ones that do not have a script. So smaller linguistic communities do not have a choice other than embracing free software, which allows for any number of modifications and adaptations across languages."

The ‘sarkari' behaviour

Talking about the government attitude towards open source software and desktops, Ravikant quips, "My views about the government's attitude towards either open source or localisation are far from charitable. For one, hefty corporations like Microsoft have a foothold in the highest echelons of power in the country. If Bill Gates dines with the prime minister, the media gleefully reports the meeting as if Windows is the only computing reality. Second, the government actually spent a great deal on local solutions, but its model was an old bureaucratic one. It allowed small companies to play with forms and formats, resulting in anarchy of fonts and standards. This delayed the localisation process considerably in India. Third, the government also made the mistake of creating solutions with expert-driven methodologies, and it tried to earn money on what could be popular solutions. The result is that people refused to buy redundant software like Ileap. You can also see that even Microsoft had to launch community portals for its language solutions." That is where Ravikant and several others believe that free software is invaluable-you have the opportunity of catching and correcting errors and bugs all the time. Ravikant adds that the Indic solutions from the Indlinux group of volunteers-which Sarai has been a part of - is far superior, more creative and on the cutting edge than any other efforts. He complains that they have approached the TDIL and CDAC more than once to use software that is freely available in the public domain, but the organisations do not evince any interest.
The hope still lingers

In this age, information is power. The quality and quantity of information that we have decides how powerful we really are. The quality of localisation is heavily dependent on the community. That is one reason why some proprietary companies have also launched community portals for their language solutions. But the community working for them is not the real community. The real one is the open source community, where power lies with the community itself. Punjabi localisation enthusiast Amanpreet Singh Alam is very positive about the success of open source desktops, "If common people start participating in any war, then it is impossible for any army to defeat a country and its people. So is the case with free software and open source versus proprietary software. Eventually, the peoples' desktops- GNOME and KDE-are going to win." And once the construction of the ‘open' tower of Babel is over, the knowledge of IT will be available to everyone, irrespective of commercial benefits.

***

(originally published in Linux For You magazine, Feb, 2007)