ആമുഖം
അച്ചടി മേഖലയില് കംപ്യുട്ടറുകളുടെ ഉപയോഗം ടൈപ്പ് സെറ്റിംഗ് എന്ന സങ്കേതത്തെ കീഴ്മേല് മറിച്ചപ്പോള് ഇംഗ്ലീഷിനു പുറമെയുള്ള ഭാഷകളുടെ കാര്യത്തിലും ഇതെങ്ങനെ സാധ്യമാക്കാം എന്ന അന്വേഷണമാണ് മലയാളം ഉള്പ്പെടെയുള്ള ഭാഷകളുടെ കംപ്യുട്ടര് പ്രവേശനത്തിന് വഴിതുറന്നത്.
കമ്പ്യുട്ടറിന്റെ ഭാഷ
ഇങ്ങനെ അക്ഷരങ്ങളെ സംഖ്യ ആക്കി മാറ്റുന്നത് ഒരു സ്റ്റാന്ഡേര്ഡ് പട്ടികയെ അടിസ്ഥാനമാക്കിയാണ്. അത്തരമൊരു സ്റ്റാന്ഡേര്ഡ് ആണ് ആസ്കി (ASCII). ഈ സ്റ്റാന്ഡേര്ഡ് പ്രകാരം ചില ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ താഴെ കൊടുക്കുന്നു.
'A' യുടെ അക്ഷര സംഖ്യ '65' (ഹെക്സാഡെസിമല്: '41', ബൈനറി: '00101001')
'B' യുടെ അക്ഷര സംഖ്യ '66' (ഹെക്സാഡെസിമല്: '42', ബൈനറി: '00101010')
'C' യുടെ അക്ഷര സംഖ്യ '67' (ഹെക്സാഡെസിമല്: '43', ബൈനറി: '00101011')
...
'a' യുടെ അക്ഷര സംഖ്യ '97' (ഹെക്സാഡെസിമല്: '61', ബൈനറി: '01100001')
'b' യുടെ അക്ഷര സംഖ്യ '98' (ഹെക്സാഡെസിമല്: '62', ബൈനറി: '01100010')
'c' യുടെ അക്ഷര സംഖ്യ '99' (ഹെക്സാഡെസിമല്: '63', ബൈനറി: '01100011')
...
ആസ്കി (ASCII) പ്രകാരമുള്ള അക്ഷര സംഖ്യകളുടെ പൂര്ണ പട്ടിക കാണാന് ഇവിടെ നോക്കുക. http://www.ascii.cl/
കമ്പ്യൂട്ടറില് മറ്റു ഭാഷകള് ഉപയോഗിക്കുന്നതിന്റെ ആദ്യത്തെ പ്രശ്നം ആ ഭാഷയിലെ അക്ഷരങ്ങള്ക്ക് എങ്ങിനെ ഒരു അക്ഷര സംഖ്യ നല്കാം എന്നതായിരുന്നു. അതിനു കണ്ട ആദ്യപരിഹാരമാണ് ആസ്കീ പട്ടികയില് കോഡുകള്ക്ക് തുല്യമായി ആസ്കി നിശ്ചയിച്ചിരിക്കുന്ന അക്ഷരങ്ങള് മാറ്റി അവിടെ മറ്റു ഭാഷകളിലെ അക്ഷരങ്ങള് വയ്ക്കുക എന്നത്. മലയാളത്തില് അത്തരം ഒരു ഫോണ്ട് ആണ് ML-TT Karthika.
ML-TT Karthika യിലെ ചില മലയാളം അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ താഴെ കൊടുക്കുന്നു.
ആസ്കി (ASCII) പ്രകാരമുള്ള അക്ഷര സംഖ്യകളുടെ പൂര്ണ പട്ടിക കാണാന് ഇവിടെ നോക്കുക. http://www.ascii.cl/
കമ്പ്യൂട്ടറില് മറ്റു ഭാഷകള് ഉപയോഗിക്കുന്നതിന്റെ ആദ്യത്തെ പ്രശ്നം ആ ഭാഷയിലെ അക്ഷരങ്ങള്ക്ക് എങ്ങിനെ ഒരു അക്ഷര സംഖ്യ നല്കാം എന്നതായിരുന്നു. അതിനു കണ്ട ആദ്യപരിഹാരമാണ് ആസ്കീ പട്ടികയില് കോഡുകള്ക്ക് തുല്യമായി ആസ്കി നിശ്ചയിച്ചിരിക്കുന്ന അക്ഷരങ്ങള് മാറ്റി അവിടെ മറ്റു ഭാഷകളിലെ അക്ഷരങ്ങള് വയ്ക്കുക എന്നത്. മലയാളത്തില് അത്തരം ഒരു ഫോണ്ട് ആണ് ML-TT Karthika.
ML-TT Karthika യിലെ ചില മലയാളം അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ താഴെ കൊടുക്കുന്നു.
'അ' യുടെ അക്ഷര സംഖ്യ '65' (ഹെക്സാഡെസിമല്: '41', ബൈനറി: '00101001')
'ആ' യുടെ അക്ഷര സംഖ്യ '66' (ഹെക്സാഡെസിമല്: '42', ബൈനറി: '00101010')
'ഇ' യുടെ അക്ഷര സംഖ്യ '67' (ഹെക്സാഡെസിമല്: '43', ബൈനറി: '00101011')
...
'മ' യുടെ അക്ഷര സംഖ്യ '97' (ഹെക്സാഡെസിമല്: '61', ബൈനറി: '01100001')
'യ' യുടെ അക്ഷര സംഖ്യ '98' (ഹെക്സാഡെസിമല്: '62', ബൈനറി: '01100010')
'ര' യുടെ അക്ഷര സംഖ്യ '99' (ഹെക്സാഡെസിമല്: '63', ബൈനറി: '01100011')
...
ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ പുനരുപയോഗിക്കുന്നത് കൊണ്ട് സാധാരണ ഇംഗ്ലീഷ് കീ ബോര്ഡ് ഉപയോഗിച്ച് തന്നെ മലയാള അക്ഷരങ്ങള് കമ്പ്യൂട്ടറിലേക്ക് നല്കാം. അത് അറിയാന് എതെങ്കിലും ഒരു വേര്ഡ് പ്രോസസ്സര് തുറന്ന് ഫോണ്ട് 'ML-TT Karthika' ആക്കുക. എന്നിട്ട് 'A' കീ അമര്ത്തുക 'A' യുടെ അക്ഷരസംഖ്യക്ക് (65) തുല്യമായ അക്ഷരസംഖ്യയുള്ള 'ML-TT Karthika'-യിലെ അക്ഷരം 'അ' ഡോക്യുമെന്റില് തെളിയുന്നത് കാണാം. ഇങ്ങനെ, ടൈപ്പ് ചെയ്യുന്ന ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യക്ക് തുല്യമായ അക്ഷരസംഖ്യയുള്ള 'ML-TT Karthika'-യിലെ അക്ഷരം ഡോക്യുമെന്റില് വരുന്നതാണ്.
ഇങ്ങനെ മലയാളം ടൈപ്പ് ചെയ്യുമ്പോള് ഉള്ള ദോഷം ഈ ലിപി വിന്യാസം മലയാളം ടൈപ്പ് റൈറ്റര്-ന്റെയോ അതുപോലെയുള്ളതോ ആയ സ്റ്റാന്ഡേര്ഡ് പിന്തുടരുന്നില്ല എന്നതാണ്.
മലയാളം അടക്കമുള്ള ഭാരതീയ ഭാഷകളുടെ കീ ബോര്ഡ് വിന്യാസം ഭാരത സര്ക്കാരിന്റെ സ്ഥാപനമായ സി-ഡാക്ക് ഔദ്യോഗികമായി എകീകരിച്ചിട്ടുണ്ട്. ഇതനുസരിച്ചുള്ള ഔദ്യോഗിക നിവേശക രീതിയാണ് ഇന്സ്ക്രിപ്റ്റ്.
ഇന്സ്ക്രിപ്റ്റ് രീതിയിലെ മലയാളം ലിപി വിന്യാസം താഴെ കൊടുത്തിരിക്കുന്നു (ചിത്രത്തിന് കടപ്പാട്: http://malayalam.kerala.gov.in).
മലയാളം ഇന്പുട്ട് ചെയ്യാനുള്ള ഏറ്റവും നല്ല രീതി ഈ കീ ബോര്ഡ് വിന്യാസം ഉപയോഗിക്കുക എന്നതാണ്. ഏറ്റവും ചുരുങ്ങിയ എണ്ണം കീ അമര്ത്തലുകള് കൊണ്ട് വേഗത്തില് മലയാളം ടൈപ്പ് സെറ്റ് ചെയ്യാന് സാധിക്കുന്ന കാര്യക്ഷമമായ മാര്ഗമാണിത്. മലയാളം വേര്ഡ് പ്രോസസ്സിംഗ് പ്രൊഫഷണല് ആയി ചെയ്യുന്നതിനു സര്ക്കാര് അംഗീകരിച്ചിരിക്കുന്ന നിവേശക രീതി ഇതാണ്.
Windows XP യില് മലയാളം ലഭ്യമാക്കാനുള്ള മാര്ഗങ്ങള് ഇവിടെ നല്കിയിട്ടുണ്ട്.
http://malayalam.kerala.gov.in/index.php/EnableMalayalam#Enable_Malayalam_on_Windows_XP
കമ്പ്യൂട്ടറില് മലയാളം ടൈപ്പ് ചെയ്യാനുള്ള മറ്റൊരു രീതിയാണ് ലിപ്യന്തരണം. ഇതില് മലയാളം ഇംഗ്ലീഷ്-ല് ടൈപ്പ് ചെയ്താല് മതി. മലയാളം ടൈപ്പ് റൈറ്റിംഗ് അറിയാത്തവര്ക്ക് ഇത് സൌകര്യമാണ്. ഇതിനു നിരവധി സോഫ്ട്വെയറുകള് നിലവിലുണ്ട്. 'Manglish' ആണ് ഒരു ഉദാഹരണം.
ലിപ്യന്തരണത്തിന് സഹായിക്കുന്ന സോഫ്ട്വെയറുകള് രണ്ടു തരം ഉണ്ട്.
൧. ഒരു ബ്രൌസര് വിന്ഡോയിലോ ആപ്പ്ളിക്കെഷന് വിന്ഡോയിലോ ലിപ്യന്തരണം സാധ്യമാക്കുന്നവ .
൨. ഇന്സ്ക്രിപ്റ്റ് പോലെ ഓപ്പറേറ്റിങ് സിസ്റ്റത്തോട് ചേര്ന്ന് പ്രവര്ത്തിക്കുന്നവ.
ആദ്യത്തേതില് ബ്രൌസര് വിന്ഡോയിലോ ആപ്പ്ളിക്കെഷന് വിന്ഡോയിലോ നിന്നു ലിപ്യന്തരണം വരുത്തിയ മലയാളം പാഠം അവിടെ നിന്നു കോപ്പി ചെയ്ത് നമുക്ക് ആവശ്യമുള്ള സ്ഥലത്തേക്ക് പേസ്റ്റ് ചെയ്യണം.
രണ്ടാമത്തേതില് നമുക്ക് ആവശ്യമുള്ള സ്ഥലത്തേക്ക് നേരിട്ട് ടൈപ്പ് ചെയ്യാം.
ആദ്യത്തെ രീതിയില് പ്രവര്ത്തിക്കുന്ന ചില സോഫ്ട്വെയറുകള് താഴെ കൊടുക്കുന്നു.
൧. വരമൊഴി (Varamozhi Application: https://sites.google.com/site/cibu/)
൨. മൊഴി ഓണ്ലൈന് (http://varamozhi.appspot.com/assets/index.html)
൩. ഗൂഗിള് ഓണ്ലൈന് (http://www.google.com/transliterate/malayalam)
ജിമെയില്, ബ്ലോഗ്ഗര് തുടങ്ങിയ സൈറ്റുകളിലും ദിനപത്രങ്ങളുടെ വെബ്സൈറ്റ്കളിലെ കമന്റ് ബോക്സ്കളില് വരെ ഇപ്പോള് ഈ സൗകര്യം ലഭ്യമാണ്. ഇത്തരം വെബ്സൈറ്റ്കളുടെ പ്രയോജനം ഈ സൗകര്യം ഓപ്പറേറ്റിങ് സിസ്റ്റത്തോട് ബന്ധപ്പെടുന്നില്ല എന്നതാണ്.
രണ്ടാമത്തെ രീതിയില് പ്രവര്ത്തിക്കുന്ന ചില വിന്ഡോസ് സോഫ്ട്വെയറുകള് താഴെ കൊടുക്കുന്നു.
ലിനക്സില് സ്കിം (SCIM) ഐ-ബസ് (i-Bus) എന്നിവയില് നിരവധി മലയാളം ലിപ്യന്തരണ നിവേശക രീതികള് ലഭ്യമാണ്.
ലിപ്യന്തരണ നിവേശക രീതികള്ക്ക് ഒരു പൊതു സ്റ്റാന്ഡേര്ഡ് നിലവിലില്ല. അത് സാധിക്കുകയുമില്ല. പലപ്പോഴും നമ്മള് ഉദ്ദേശിക്കുന്ന വാക്ക് ലിപ്യന്തരണം വഴി കിട്ടിക്കൊള്ളണം എന്നില്ല. ഈ ലേഖനം ടൈപ്പ് ചെയ്തത് ഗൂഗിള് ഇന്പുട്ട് ടൂള്സ് ഉപയോഗിച്ചാണ്. പലപ്പോഴും അതിലെ Character Picker ഉപയോഗിച്ചാണ് ഉദ്ദേശിക്കുന്ന അക്ഷരം ചേര്ത്തത്. ഒരേ പാഠം ടൈപ്പ് ചെയ്യുന്നതിന് ഇന്സ്ക്രിപ്റ്റ് ഉപയോഗിക്കുമ്പോള് അമര്ത്തുന്നതില് കൂടുതല് കീ-കള് ലിപ്യന്തരണം വഴി ചെയ്യുമ്പോള് അമര്ത്തേണ്ടി വരുന്നതിനാല് ഈ രീതി ഒട്ടും കാര്യക്ഷമമല്ല.
മലയാളം ഇന്സ്ക്രിപ്റ്റ് ടൈപ്പിംഗ് അറിയാത്തവര്ക്ക് ഒരു വഴി എന്നല്ലാതെ വേര്ഡ് പ്രോസസ്സിംഗ് വിദഗ്ധര് ലിപ്യന്തരണ നിവേശക രീതികള് ഉപയോഗിക്കുന്നത് അഭികാമ്യമല്ല.
ആസ്കീ പട്ടികയില് കോഡുകള്ക്ക് തുല്യമായി ആസ്കി നിശ്ചയിച്ചിരിക്കുന്ന അക്ഷരങ്ങള് മാറ്റി അവിടെ മറ്റു ഭാഷകളിലെ അക്ഷരങ്ങള് വയ്ക്കുക വഴിയാണ് കമ്പ്യൂട്ടറില് മറ്റു ഭാഷകളുടെ ഉപയോഗം സാധ്യമാക്കിയത്. മലയാളത്തില് 'ML-TT Karthika' എന്ന ഫോണ്ട് ഉപയോഗിച്ചിരിക്കുന്ന അക്ഷരസംഖ്യകള് മുകളില് കാണിച്ചിട്ടുണ്ട്.
ഒറ്റ നോട്ടത്തില് ഇവിടെ വ്യക്തമാകുന്ന ഒരു വസ്തുത ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ മലയാളം അക്ഷരങ്ങള്ക്ക് പുനരുപയോഗിക്കുന്നു എന്നതാണ്. ഇത് ഒരു ലഘു പരീക്ഷണം വഴി വ്യക്തമാകുന്നതാണ്.
വേര്ഡില് ഒരു പുതിയ ഡോക്യുമെന്റ് തുറന്നു അതില് ഏതെങ്കിലും ഇംഗ്ലീഷ് ഫോണ്ട് സെറ്റ് ചെയ്തു 'A' മുതല് 'Z' വരെയുള്ള അക്ഷരമാല ടൈപ്പ് ചെയ്യുക. അതിനു ശേഷം ആ ടെക്സ്റ്റ് മുഴുവന് സെലക്ട് ചെയ്ത ശേഷം ഫോണ്ട് 'ML-TT Karthika' ആക്കുക. ടൈപ്പ് ചെയ്ത ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ സ്ഥാനത്ത് അവയുടെ അക്ഷര സംഖ്യക്ക് തുല്യമായ മലയാളം അക്ഷരം കാണാവുന്നതാണ്.
ഈ രീതിക്ക് കുറെ പോരായ്മകളുണ്ട്. അതില് ആദ്യത്തേത്, ഈ രീതിക്ക് ഒരു സ്റ്റാന്ഡേര്ഡ് ഇല്ല എന്നതാണ്. അതായത് ഫോണ്ട് നിര്മിക്കുന്ന ഓരോരുത്തരും അവരവരുടെ ഫോണ്ടുകളിലെ അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യ സ്വയം നിശ്ചയിക്കുന്നു എന്നതാണ്. ഉദാഹരണത്തിന് '74' (ഹെക്സാഡെസിമല്: '4A', ബൈനറി: '01001010') എന്ന അക്ഷരസംഖ്യക്ക് തുല്യമായ അക്ഷരം 'ML-TT Karthika' ഫോണ്ടില് 'ഖ' യും 'Manorama' ഫോണ്ടില് 'ത്ത' യും 'Kalakaumudi' ഫോണ്ടില് 'ക്ക' യും ആണ്. 'ML-TT Karthika' ഫോണ്ടില് തയാറാക്കിയ ഒരു ടെക്സ്റ്റ് 'Manorama' ഫോണ്ടിലേക്കോ 'Kalakaumudi' ഫോണ്ടിലേക്കോ മാറ്റാനാവില്ല എന്നതാണ് ഇതിന്റെ ഫലം. ഇത് ഒരു നിര്മാതാവിന്റെ ഫോണ്ട് ഉപയോഗിക്കുന്നവര് മറ്റു ഫോണ്ടുകളിലേക്ക് മാറുന്നത് അസാധ്യമാക്കുന്നു. കൂടാതെ ഒരു ഫോണ്ടില് തയാറാക്കിയ ഒരു രേഖ ഈമെയിലില് അയച്ചു കിട്ടുന്നവര്ക്ക് ആ രേഖ വായിക്കണമെങ്കില് ആ ഫോണ്ട് അവരുടെ കമ്പ്യൂട്ടറില് ഉണ്ടാകേണ്ടാതായും വരുന്നു.
ഈ രീതിയുടെ അടുത്ത പോരായ്മ ഒരേ ഡോകുമെന്റില്ത്തന്നെ ഒന്നിലധികം ഭാഷ ഉപയോഗിക്കേണ്ടി വരുമ്പോഴാണ് വ്യക്തമാകുന്നത്. ഉപയോഗിച്ചിരിക്കുന്ന ഫോണ്ടിന്റെ വിവരങ്ങള് കൂടി ഉള്പ്പെടുത്തുന്ന ഒരു ഫയല് ഫോര്മാറ്റ് ആണ് (ഉദാ. വേര്ഡ് ഡോക്യുമെന്റ്) ഉപയോഗിക്കുന്നുവെങ്കില് ഇത് സാരമായ പ്രശ്നം സൃഷ്ടിക്കില്ല. അല്ലാത്ത ഫയല് ഫോര്മാറ്റ് (ഉദാ.ആക്സെസ്സ് ഡാറ്റാബേസ്, ടെക്സ്റ്റ് ഫയല്) ആണെങ്കില് ഫയല് ഉപയോഗ ശൂന്യമാകും.
നോട്ട്പാഡില് (Notepad) ഒരു ടെക്സ്റ്റ് ഫയല് ഉണ്ടാക്കി നോക്കിയാല് ഇത് മനസ്സിലാകും. ടെക്സ്റ്റ് ഫയല് ഫോര്മാറ്റില് ഉപയോഗിച്ചിരിക്കുന്ന ഫോണ്ടിന്റെ വിവരങ്ങള് ഉള്പ്പെടുത്തുകയില്ല. ഏത് ഫോണ്ട് ഉപയോഗിച്ച് വേണം ഫയല് ഡിസ്പ്ലേ ചെയ്യേണ്ടത് എന്ന് തീരുമാനിക്കുന്നത് പ്രോഗ്രാമിലെ സെറ്റിംഗ് അനുസരിച്ചാണ്.
Windows XP യില് Programs>Accessories മെനുവില് നിന്ന് Notepad തുറക്കുക. ഏതെങ്കിലും ഒരു ഇംഗ്ലീഷ് ടെക്സ്റ്റ് ടൈപ്പ് ചെയ്യുക. അതിനു ശേഷം Notepad ലെ Format മെനുവില് നിന്ന് Font തിരഞ്ഞെടുക്കുക.ഫോണ്ട് 'ML-TT Karthika' ആക്കുക. ടെക്സ്റ്റ് മുഴുവന് മലയാളത്തില് ഡിസ്പ്ലേ ചെയ്യുന്നത് കാണാം. ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ മലയാളം അക്ഷരങ്ങള്ക്ക് പുനരുപയോഗിക്കുന്നത് കൊണ്ടാണ് ഇത് സംഭവിക്കുന്നത്.
ഈ പ്രശ്നങ്ങള് പരിഹരിക്കാനുള്ള പോംവഴിയായാണ് യൂണികോഡ് നിലവില് വന്നത്. യൂണികോഡ്-എന്നത് ആസ്കിയുടെ ഒരു വികസിത രൂപമായി കരുതാം. ഇത് അക്ഷരസംഖ്യാ പട്ടികയുടെ ഒരു സ്റ്റാന്ഡേര്ഡ് ആണ്. ഇതില് പിന്തുടര്ന്നിരിക്കുന്ന ആശയങ്ങള് ഇവയാണ്.
൧. ഒരു ഭാഷയിലെ അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യ മറ്റൊരു ഭാഷയിലെയും അക്ഷരങ്ങള്ക്ക് നല്കാതിരിക്കുക.
൨. എല്ലാ ഭാഷകളിലെയും അക്ഷരങ്ങള്ക്ക് ഒരു ഏകീകൃത അക്ഷരസംഖ്യ നല്കുക.
യൂണികോഡ് പ്രകാരം ചില മലയാള അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യ താഴെ കൊടുക്കുന്നു.
Windows XP യില് Programs>Accessories മെനുവില് നിന്ന് Notepad തുറക്കുക. ഏതെങ്കിലും ഒരു ഇംഗ്ലീഷ് ടെക്സ്റ്റ് ടൈപ്പ് ചെയ്യുക. അതിനു ശേഷം Notepad ലെ Format മെനുവില് നിന്ന് Font തിരഞ്ഞെടുക്കുക.ഫോണ്ട് 'Anjali Old Lipi' ആക്കുക. ടൈപ്പ് ചെയ്ത ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ ഫോണ്ട് മാറുന്നതല്ലാതെ മലയാളം അക്ഷരങ്ങള് ആകുകയില്ല.
ഇനി മൈക്രോസോഫ്ട് വേര്ഡില് ഒരേ ഡോകുമെന്റില്ത്തന്നെ ഇംഗ്ലീഷും മലയാളവും ഭാഷകള് ഇടകലര്ത്തി യൂണികോഡ്-ഫോണ്ടില് തയ്യാറാക്കിയ ഒരു ടെക്സ്റ്റ്-ല് ഫോണ്ട് മാറ്റി നോക്കുക. ഇംഗ്ലീഷ് അക്ഷരങ്ങള് മലയാളമോ മലയാളം അക്ഷരങ്ങള് ഇംഗ്ലീഷ്-ഓ ആവുകയില്ല.
ഈ കാരണങ്ങള് കൊണ്ടാണ് പ്രാദേശിക ഭാഷാ കമ്പ്യൂട്ടിങ്ങില് യൂണികോഡ് സ്റ്റാന്ഡേര്ഡ് പിന്തുടരുന്ന ഫോണ്ടുകള്ക്ക് പ്രാധാന്യമുള്ളത്.
കേരള സര്ക്കാര് ഓഫീസുകളില് യൂണികോഡ് സ്റ്റാന്ഡേര്ഡ് പിന്തുടരുന്ന ഫോണ്ടുകള് ഉപയോഗിക്കണമെന്ന് നിഷ്കര്ഷിച്ചു കൊണ്ട് പുറത്തിറക്കിയ ഉത്തരവ് ഇവിടെ ലഭ്യമാണ്.
http://www.itmission.kerala.gov.in/downloads/doc_download/83-go-ms-no-312008itd-dt-21082008-malayalam-unicode.html
മലയാളം കീ ബോര്ഡ്
ഇങ്ങനെ മലയാളം ടൈപ്പ് ചെയ്യുമ്പോള് ഉള്ള ദോഷം ഈ ലിപി വിന്യാസം മലയാളം ടൈപ്പ് റൈറ്റര്-ന്റെയോ അതുപോലെയുള്ളതോ ആയ സ്റ്റാന്ഡേര്ഡ് പിന്തുടരുന്നില്ല എന്നതാണ്.
ഇന്സ്ക്രിപ്റ്റ്.
ഇന്സ്ക്രിപ്റ്റ് രീതിയിലെ മലയാളം ലിപി വിന്യാസം താഴെ കൊടുത്തിരിക്കുന്നു (ചിത്രത്തിന് കടപ്പാട്: http://malayalam.kerala.gov.in).
മലയാളം ഇന്പുട്ട് ചെയ്യാനുള്ള ഏറ്റവും നല്ല രീതി ഈ കീ ബോര്ഡ് വിന്യാസം ഉപയോഗിക്കുക എന്നതാണ്. ഏറ്റവും ചുരുങ്ങിയ എണ്ണം കീ അമര്ത്തലുകള് കൊണ്ട് വേഗത്തില് മലയാളം ടൈപ്പ് സെറ്റ് ചെയ്യാന് സാധിക്കുന്ന കാര്യക്ഷമമായ മാര്ഗമാണിത്. മലയാളം വേര്ഡ് പ്രോസസ്സിംഗ് പ്രൊഫഷണല് ആയി ചെയ്യുന്നതിനു സര്ക്കാര് അംഗീകരിച്ചിരിക്കുന്ന നിവേശക രീതി ഇതാണ്.
Windows XP യില് മലയാളം ലഭ്യമാക്കാനുള്ള മാര്ഗങ്ങള് ഇവിടെ നല്കിയിട്ടുണ്ട്.
http://malayalam.kerala.gov.in/index.php/EnableMalayalam#Enable_Malayalam_on_Windows_XP
ലിപ്യന്തരണം (Transliteration)
ലിപ്യന്തരണത്തിന് സഹായിക്കുന്ന സോഫ്ട്വെയറുകള് രണ്ടു തരം ഉണ്ട്.
൧. ഒരു ബ്രൌസര് വിന്ഡോയിലോ ആപ്പ്ളിക്കെഷന് വിന്ഡോയിലോ ലിപ്യന്തരണം സാധ്യമാക്കുന്നവ .
൨. ഇന്സ്ക്രിപ്റ്റ് പോലെ ഓപ്പറേറ്റിങ് സിസ്റ്റത്തോട് ചേര്ന്ന് പ്രവര്ത്തിക്കുന്നവ.
ആദ്യത്തേതില് ബ്രൌസര് വിന്ഡോയിലോ ആപ്പ്ളിക്കെഷന് വിന്ഡോയിലോ നിന്നു ലിപ്യന്തരണം വരുത്തിയ മലയാളം പാഠം അവിടെ നിന്നു കോപ്പി ചെയ്ത് നമുക്ക് ആവശ്യമുള്ള സ്ഥലത്തേക്ക് പേസ്റ്റ് ചെയ്യണം.
രണ്ടാമത്തേതില് നമുക്ക് ആവശ്യമുള്ള സ്ഥലത്തേക്ക് നേരിട്ട് ടൈപ്പ് ചെയ്യാം.
ആദ്യത്തെ രീതിയില് പ്രവര്ത്തിക്കുന്ന ചില സോഫ്ട്വെയറുകള് താഴെ കൊടുക്കുന്നു.
൧. വരമൊഴി (Varamozhi Application: https://sites.google.com/site/cibu/)
൨. മൊഴി ഓണ്ലൈന് (http://varamozhi.appspot.com/assets/index.html)
൩. ഗൂഗിള് ഓണ്ലൈന് (http://www.google.com/transliterate/malayalam)
ജിമെയില്, ബ്ലോഗ്ഗര് തുടങ്ങിയ സൈറ്റുകളിലും ദിനപത്രങ്ങളുടെ വെബ്സൈറ്റ്കളിലെ കമന്റ് ബോക്സ്കളില് വരെ ഇപ്പോള് ഈ സൗകര്യം ലഭ്യമാണ്. ഇത്തരം വെബ്സൈറ്റ്കളുടെ പ്രയോജനം ഈ സൗകര്യം ഓപ്പറേറ്റിങ് സിസ്റ്റത്തോട് ബന്ധപ്പെടുന്നില്ല എന്നതാണ്.
രണ്ടാമത്തെ രീതിയില് പ്രവര്ത്തിക്കുന്ന ചില വിന്ഡോസ് സോഫ്ട്വെയറുകള് താഴെ കൊടുക്കുന്നു.
൧. മംഗ്ലീഷ് (Manglish)
൨. ഗൂഗിള് ഇന്പുട്ട് ടൂള്സ് (Google Input Tools: http://www.google.com/inputtools/windows/index.html)
൩. മൈക്രോസോഫ്ട് ഇന്ഡിക് ഇന്പുട്ട് ടൂള്സ് (Microsoft Indic Input Tools: http://bhashaindia.com/Downloads/Pages/home.aspx)
ലിനക്സില് സ്കിം (SCIM) ഐ-ബസ് (i-Bus) എന്നിവയില് നിരവധി മലയാളം ലിപ്യന്തരണ നിവേശക രീതികള് ലഭ്യമാണ്.
ലിപ്യന്തരണം: ഒരു വിലയിരുത്തല്
ലിപ്യന്തരണ നിവേശക രീതികള്ക്ക് ഒരു പൊതു സ്റ്റാന്ഡേര്ഡ് നിലവിലില്ല. അത് സാധിക്കുകയുമില്ല. പലപ്പോഴും നമ്മള് ഉദ്ദേശിക്കുന്ന വാക്ക് ലിപ്യന്തരണം വഴി കിട്ടിക്കൊള്ളണം എന്നില്ല. ഈ ലേഖനം ടൈപ്പ് ചെയ്തത് ഗൂഗിള് ഇന്പുട്ട് ടൂള്സ് ഉപയോഗിച്ചാണ്. പലപ്പോഴും അതിലെ Character Picker ഉപയോഗിച്ചാണ് ഉദ്ദേശിക്കുന്ന അക്ഷരം ചേര്ത്തത്. ഒരേ പാഠം ടൈപ്പ് ചെയ്യുന്നതിന് ഇന്സ്ക്രിപ്റ്റ് ഉപയോഗിക്കുമ്പോള് അമര്ത്തുന്നതില് കൂടുതല് കീ-കള് ലിപ്യന്തരണം വഴി ചെയ്യുമ്പോള് അമര്ത്തേണ്ടി വരുന്നതിനാല് ഈ രീതി ഒട്ടും കാര്യക്ഷമമല്ല.
മലയാളം ഇന്സ്ക്രിപ്റ്റ് ടൈപ്പിംഗ് അറിയാത്തവര്ക്ക് ഒരു വഴി എന്നല്ലാതെ വേര്ഡ് പ്രോസസ്സിംഗ് വിദഗ്ധര് ലിപ്യന്തരണ നിവേശക രീതികള് ഉപയോഗിക്കുന്നത് അഭികാമ്യമല്ല.
മലയാളം ഫോണ്ടുകള്
ഒറ്റ നോട്ടത്തില് ഇവിടെ വ്യക്തമാകുന്ന ഒരു വസ്തുത ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ മലയാളം അക്ഷരങ്ങള്ക്ക് പുനരുപയോഗിക്കുന്നു എന്നതാണ്. ഇത് ഒരു ലഘു പരീക്ഷണം വഴി വ്യക്തമാകുന്നതാണ്.
വേര്ഡില് ഒരു പുതിയ ഡോക്യുമെന്റ് തുറന്നു അതില് ഏതെങ്കിലും ഇംഗ്ലീഷ് ഫോണ്ട് സെറ്റ് ചെയ്തു 'A' മുതല് 'Z' വരെയുള്ള അക്ഷരമാല ടൈപ്പ് ചെയ്യുക. അതിനു ശേഷം ആ ടെക്സ്റ്റ് മുഴുവന് സെലക്ട് ചെയ്ത ശേഷം ഫോണ്ട് 'ML-TT Karthika' ആക്കുക. ടൈപ്പ് ചെയ്ത ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ സ്ഥാനത്ത് അവയുടെ അക്ഷര സംഖ്യക്ക് തുല്യമായ മലയാളം അക്ഷരം കാണാവുന്നതാണ്.
ഈ രീതിക്ക് കുറെ പോരായ്മകളുണ്ട്. അതില് ആദ്യത്തേത്, ഈ രീതിക്ക് ഒരു സ്റ്റാന്ഡേര്ഡ് ഇല്ല എന്നതാണ്. അതായത് ഫോണ്ട് നിര്മിക്കുന്ന ഓരോരുത്തരും അവരവരുടെ ഫോണ്ടുകളിലെ അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യ സ്വയം നിശ്ചയിക്കുന്നു എന്നതാണ്. ഉദാഹരണത്തിന് '74' (ഹെക്സാഡെസിമല്: '4A', ബൈനറി: '01001010') എന്ന അക്ഷരസംഖ്യക്ക് തുല്യമായ അക്ഷരം 'ML-TT Karthika' ഫോണ്ടില് 'ഖ' യും 'Manorama' ഫോണ്ടില് 'ത്ത' യും 'Kalakaumudi' ഫോണ്ടില് 'ക്ക' യും ആണ്. 'ML-TT Karthika' ഫോണ്ടില് തയാറാക്കിയ ഒരു ടെക്സ്റ്റ് 'Manorama' ഫോണ്ടിലേക്കോ 'Kalakaumudi' ഫോണ്ടിലേക്കോ മാറ്റാനാവില്ല എന്നതാണ് ഇതിന്റെ ഫലം. ഇത് ഒരു നിര്മാതാവിന്റെ ഫോണ്ട് ഉപയോഗിക്കുന്നവര് മറ്റു ഫോണ്ടുകളിലേക്ക് മാറുന്നത് അസാധ്യമാക്കുന്നു. കൂടാതെ ഒരു ഫോണ്ടില് തയാറാക്കിയ ഒരു രേഖ ഈമെയിലില് അയച്ചു കിട്ടുന്നവര്ക്ക് ആ രേഖ വായിക്കണമെങ്കില് ആ ഫോണ്ട് അവരുടെ കമ്പ്യൂട്ടറില് ഉണ്ടാകേണ്ടാതായും വരുന്നു.
ഈ രീതിയുടെ അടുത്ത പോരായ്മ ഒരേ ഡോകുമെന്റില്ത്തന്നെ ഒന്നിലധികം ഭാഷ ഉപയോഗിക്കേണ്ടി വരുമ്പോഴാണ് വ്യക്തമാകുന്നത്. ഉപയോഗിച്ചിരിക്കുന്ന ഫോണ്ടിന്റെ വിവരങ്ങള് കൂടി ഉള്പ്പെടുത്തുന്ന ഒരു ഫയല് ഫോര്മാറ്റ് ആണ് (ഉദാ. വേര്ഡ് ഡോക്യുമെന്റ്) ഉപയോഗിക്കുന്നുവെങ്കില് ഇത് സാരമായ പ്രശ്നം സൃഷ്ടിക്കില്ല. അല്ലാത്ത ഫയല് ഫോര്മാറ്റ് (ഉദാ.ആക്സെസ്സ് ഡാറ്റാബേസ്, ടെക്സ്റ്റ് ഫയല്) ആണെങ്കില് ഫയല് ഉപയോഗ ശൂന്യമാകും.
നോട്ട്പാഡില് (Notepad) ഒരു ടെക്സ്റ്റ് ഫയല് ഉണ്ടാക്കി നോക്കിയാല് ഇത് മനസ്സിലാകും. ടെക്സ്റ്റ് ഫയല് ഫോര്മാറ്റില് ഉപയോഗിച്ചിരിക്കുന്ന ഫോണ്ടിന്റെ വിവരങ്ങള് ഉള്പ്പെടുത്തുകയില്ല. ഏത് ഫോണ്ട് ഉപയോഗിച്ച് വേണം ഫയല് ഡിസ്പ്ലേ ചെയ്യേണ്ടത് എന്ന് തീരുമാനിക്കുന്നത് പ്രോഗ്രാമിലെ സെറ്റിംഗ് അനുസരിച്ചാണ്.
Windows XP യില് Programs>Accessories മെനുവില് നിന്ന് Notepad തുറക്കുക. ഏതെങ്കിലും ഒരു ഇംഗ്ലീഷ് ടെക്സ്റ്റ് ടൈപ്പ് ചെയ്യുക. അതിനു ശേഷം Notepad ലെ Format മെനുവില് നിന്ന് Font തിരഞ്ഞെടുക്കുക.ഫോണ്ട് 'ML-TT Karthika' ആക്കുക. ടെക്സ്റ്റ് മുഴുവന് മലയാളത്തില് ഡിസ്പ്ലേ ചെയ്യുന്നത് കാണാം. ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ മലയാളം അക്ഷരങ്ങള്ക്ക് പുനരുപയോഗിക്കുന്നത് കൊണ്ടാണ് ഇത് സംഭവിക്കുന്നത്.
യൂണികോഡ്
൧. ഒരു ഭാഷയിലെ അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യ മറ്റൊരു ഭാഷയിലെയും അക്ഷരങ്ങള്ക്ക് നല്കാതിരിക്കുക.
൨. എല്ലാ ഭാഷകളിലെയും അക്ഷരങ്ങള്ക്ക് ഒരു ഏകീകൃത അക്ഷരസംഖ്യ നല്കുക.
യൂണികോഡ് പ്രകാരം ചില മലയാള അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യ താഴെ കൊടുക്കുന്നു.
'അ' യുടെ അക്ഷര സംഖ്യ '3333' (ഹെക്സാഡെസിമല്: '0D05')
'ആ' യുടെ അക്ഷര സംഖ്യ '3334' (ഹെക്സാഡെസിമല്: '0D06')
'ഇ' യുടെ അക്ഷര സംഖ്യ '3335' (ഹെക്സാഡെസിമല്: '0D07')
...
'മ' യുടെ അക്ഷര സംഖ്യ '3374' (ഹെക്സാഡെസിമല്: '0D2E')
'യ' യുടെ അക്ഷര സംഖ്യ '3375' (ഹെക്സാഡെസിമല്: '0D2F')
'ര' യുടെ അക്ഷര സംഖ്യ '3376' (ഹെക്സാഡെസിമല്: '0D2G')
...
യൂണികോഡ് പ്രകാരമുള്ള മലയാള അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യകളുടെ പൂര്ണ പട്ടിക കാണാന് ഈ രേഖ നോക്കുക. http://www.unicode.org/charts/PDF/U0D00.pdf
യൂണികോഡ് സ്റ്റാന്ഡേര്ഡ് പിന്തുടരുന്ന ചില മലയാളം ഫോണ്ടുകള് ഇവയാണ്.
൧. അഞ്ജലി ഓള്ഡ് ലിപി (Anjali Old Lipi)
൨. മീര (Meera)
൩. നിള (Nila)
൪. കാര്ത്തിക (Karthika)
൫. രചന (Rachana)
യൂണികോഡ്-ല് ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ മലയാളം അക്ഷരങ്ങള്ക്ക് പുനരുപയോഗിക്കുന്നില്ല എന്നതറിയാന് നേരത്തെ ചെയ്ത ഒരു ലഘു പരീക്ഷണം തന്നെ ചെയ്യാവുന്നതാണ്.യൂണികോഡ് പ്രകാരമുള്ള മലയാള അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യകളുടെ പൂര്ണ പട്ടിക കാണാന് ഈ രേഖ നോക്കുക. http://www.unicode.org/charts/PDF/U0D00.pdf
യൂണികോഡ് സ്റ്റാന്ഡേര്ഡ് പിന്തുടരുന്ന ചില മലയാളം ഫോണ്ടുകള് ഇവയാണ്.
൧. അഞ്ജലി ഓള്ഡ് ലിപി (Anjali Old Lipi)
൨. മീര (Meera)
൩. നിള (Nila)
൪. കാര്ത്തിക (Karthika)
൫. രചന (Rachana)
Windows XP യില് Programs>Accessories മെനുവില് നിന്ന് Notepad തുറക്കുക. ഏതെങ്കിലും ഒരു ഇംഗ്ലീഷ് ടെക്സ്റ്റ് ടൈപ്പ് ചെയ്യുക. അതിനു ശേഷം Notepad ലെ Format മെനുവില് നിന്ന് Font തിരഞ്ഞെടുക്കുക.ഫോണ്ട് 'Anjali Old Lipi' ആക്കുക. ടൈപ്പ് ചെയ്ത ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ ഫോണ്ട് മാറുന്നതല്ലാതെ മലയാളം അക്ഷരങ്ങള് ആകുകയില്ല.
ഇനി മൈക്രോസോഫ്ട് വേര്ഡില് ഒരേ ഡോകുമെന്റില്ത്തന്നെ ഇംഗ്ലീഷും മലയാളവും ഭാഷകള് ഇടകലര്ത്തി യൂണികോഡ്-ഫോണ്ടില് തയ്യാറാക്കിയ ഒരു ടെക്സ്റ്റ്-ല് ഫോണ്ട് മാറ്റി നോക്കുക. ഇംഗ്ലീഷ് അക്ഷരങ്ങള് മലയാളമോ മലയാളം അക്ഷരങ്ങള് ഇംഗ്ലീഷ്-ഓ ആവുകയില്ല.
ഈ കാരണങ്ങള് കൊണ്ടാണ് പ്രാദേശിക ഭാഷാ കമ്പ്യൂട്ടിങ്ങില് യൂണികോഡ് സ്റ്റാന്ഡേര്ഡ് പിന്തുടരുന്ന ഫോണ്ടുകള്ക്ക് പ്രാധാന്യമുള്ളത്.
കേരള സര്ക്കാര് ഓഫീസുകളില് യൂണികോഡ് സ്റ്റാന്ഡേര്ഡ് പിന്തുടരുന്ന ഫോണ്ടുകള് ഉപയോഗിക്കണമെന്ന് നിഷ്കര്ഷിച്ചു കൊണ്ട് പുറത്തിറക്കിയ ഉത്തരവ് ഇവിടെ ലഭ്യമാണ്.
http://www.itmission.kerala.gov.in/downloads/doc_download/83-go-ms-no-312008itd-dt-21082008-malayalam-unicode.html
വിജ്ഞാനപ്രദമായ ഈ ലേഖനം തയ്യാറാക്കിയതിന് നന്ദി. ഇതിന്റെ ലിങ്ക് മാംപൂവിന്റെ ഫേസ്ബുക്ക് താളിൽ ഉൾക്കൊള്ളിച്ചിട്ടുണ്ട്. മാംപൂവിനൊപ്പം ഉണ്ടായിരിക്കുമല്ലോ? :)
ReplyDeletehttps://www.facebook.com/groups/140224686169867/
http://mampoo.org/
വളരെ പ്രയോജനപ്രദം.പുതിയ അറിവ്.നന്ദി ഹരിജിത്തിനും മാമ്പൂവിനും
ReplyDelete