Monday, November 26, 2012

കമ്പ്യൂട്ടറും മലയാളവും

ആമുഖം


ആദ്യ കാലങ്ങളില്‍ കമ്പ്യൂട്ടറിന്റെ ഉപയോഗം ശാസ്ത്ര സാങ്കേതിക വിദ്യയുമായി ബന്ധപ്പെട്ട മേഖലകളില്‍ മാത്രമായിരുന്നു. അതുകൊണ്ട് തന്നെ അക്കാലത്ത് ഇംഗ്ലീഷ് അല്ലാതെ മറ്റൊരു ഭാഷ കമ്പ്യൂട്ടറുകളില്‍ പയോഗിക്കപ്പെട്ടിരുന്നില്ല. കമ്പ്യൂട്ടറുകളില്‍ മറ്റു ഭാഷകളുടെ ഉപയോഗത്തിന്റെ സാദ്ധ്യതകളെക്കുറിച്ച് ഗവേഷണങ്ങള്‍ വരുന്നത് അച്ചടി മേഖലയില്‍ കമ്പ്യൂട്ടറുകള്‍ ഉപയോഗിക്കാന്‍ തുടങ്ങിയതോടു കൂടിയാണ്.

അച്ചടി മേഖലയില്‍ കംപ്യുട്ടറുകളുടെ ഉപയോഗം ടൈപ്പ് സെറ്റിംഗ് എന്ന സങ്കേതത്തെ കീഴ്മേല്‍ മറിച്ചപ്പോള്‍ ഇംഗ്ലീഷിനു പുറമെയുള്ള ഭാഷകളുടെ കാര്യത്തിലും ഇതെങ്ങനെ സാധ്യമാക്കാം എന്ന അന്വേഷണമാണ് മലയാളം ഉള്‍പ്പെടെയുള്ള ഭാഷകളുടെ കംപ്യുട്ടര്‍ പ്രവേശനത്തിന് വഴിതുറന്നത്.


കമ്പ്യുട്ടറിന്റെ ഭാഷ


കമ്പ്യൂട്ടറുകള്‍ ഉള്‍പ്പെടെ എല്ലാ ഡിജിറ്റല്‍ ഉപകരണങ്ങളും വിവരങ്ങള്‍ സംഭരിച്ചു വയ്ക്കുന്നതും സംസ്കരിക്കുന്നതും ബൈനറി രൂപത്തിലാണ്, അതായത് 'ഓണ്‍'/(1), 'ഓഫ്'/(0) എന്നീ രണ്ടു അവസ്ഥകളുടെ സഞ്ചയങ്ങളായിട്ടാണ്. കമ്പ്യൂട്ടറിലേക്ക് കീബോര്‍ഡ് വഴി നല്കപ്പെടുന്ന ഓരോ അക്ഷരങ്ങളും തത്തുല്യമായ ഡിജിറ്റല്‍ രൂപത്തിലുള്ള ഒരു സംഖ്യ ആയി മാറ്റിയാണ് കമ്പ്യൂട്ടര്‍ പ്രോസ്സെസ്സ് ചെയ്യുന്നത്. മറിച്ചുള്ള രൂപാന്തരണമാണ് മോണിട്ടര്‍, പ്രിന്‍റര്‍ മുതലായ ഔട്ട്‌പുട്ട് ഉപകരണങ്ങള്‍ സാധ്യമാക്കുന്നത്.  ഉപയോഗിക്കുന്ന ആള്‍ അറിയാതെ ഇതെല്ലാം ചെയ്യുന്നത് സങ്കീര്‍ണമായ സോഫ്റ്റ്‌വെയറുകളാണ്.

ഇങ്ങനെ അക്ഷരങ്ങളെ സംഖ്യ ആക്കി മാറ്റുന്നത് ഒരു സ്റ്റാന്‍ഡേര്‍ഡ് പട്ടികയെ അടിസ്ഥാനമാക്കിയാണ്. അത്തരമൊരു സ്റ്റാന്‍ഡേര്‍ഡ് ആണ് ആസ്കി (ASCII). ഈ സ്റ്റാന്‍ഡേര്‍ഡ് പ്രകാരം ചില ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ താഴെ കൊടുക്കുന്നു.

'A' യുടെ അക്ഷര സംഖ്യ  '65' (ഹെക്സാഡെസിമല്‍: '41', ബൈനറി: '00101001')
'B' യുടെ അക്ഷര സംഖ്യ  '66' (ഹെക്സാഡെസിമല്‍: '42', ബൈനറി: '00101010')
'C' യുടെ അക്ഷര സംഖ്യ  '67' (ഹെക്സാഡെസിമല്‍: '43', ബൈനറി: '00101011')
...


'a' യുടെ അക്ഷര സംഖ്യ  '97' (ഹെക്സാഡെസിമല്‍: '61', ബൈനറി: '01100001')
'b' യുടെ അക്ഷര സംഖ്യ  '98' (ഹെക്സാഡെസിമല്‍: '62', ബൈനറി: '01100010')
'c' യുടെ അക്ഷര സംഖ്യ  '99' (ഹെക്സാഡെസിമല്‍: '63', ബൈനറി: '01100011')
...

ആസ്കി (ASCII) പ്രകാരമുള്ള അക്ഷര സംഖ്യകളുടെ പൂര്‍ണ പട്ടിക കാണാന്‍ ഇവിടെ നോക്കുക. http://www.ascii.cl/

കമ്പ്യൂട്ടറില്‍ മറ്റു ഭാഷകള്‍ ഉപയോഗിക്കുന്നതിന്റെ ആദ്യത്തെ പ്രശ്നം ആ ഭാഷയിലെ അക്ഷരങ്ങള്‍ക്ക് എങ്ങിനെ ഒരു അക്ഷര സംഖ്യ നല്‍കാം എന്നതായിരുന്നു. അതിനു കണ്ട ആദ്യപരിഹാരമാണ് ആസ്കീ പട്ടികയില്‍ കോഡുകള്‍ക്ക് തുല്യമായി ആസ്കി നിശ്ചയിച്ചിരിക്കുന്ന അക്ഷരങ്ങള്‍ മാറ്റി അവിടെ മറ്റു ഭാഷകളിലെ അക്ഷരങ്ങള്‍ വയ്ക്കുക എന്നത്. മലയാളത്തില്‍  അത്തരം ഒരു ഫോണ്ട് ആണ് ML-TT Karthika.

ML-TT Karthika യിലെ ചില മലയാളം അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ താഴെ കൊടുക്കുന്നു.


'അ' യുടെ അക്ഷര സംഖ്യ  '65' (ഹെക്സാഡെസിമല്‍: '41', ബൈനറി: '00101001')
'ആ' യുടെ അക്ഷര സംഖ്യ  '66' (ഹെക്സാഡെസിമല്‍: '42', ബൈനറി: '00101010')
'ഇ' യുടെ അക്ഷര സംഖ്യ  '67' (ഹെക്സാഡെസിമല്‍: '43', ബൈനറി: '00101011')
...


'മ' യുടെ അക്ഷര സംഖ്യ  '97' (ഹെക്സാഡെസിമല്‍: '61', ബൈനറി: '01100001')
'യ' യുടെ അക്ഷര സംഖ്യ  '98' (ഹെക്സാഡെസിമല്‍: '62', ബൈനറി: '01100010')
'ര' യുടെ അക്ഷര സംഖ്യ  '99' (ഹെക്സാഡെസിമല്‍: '63', ബൈനറി: '01100011')
...

മലയാളം കീ ബോര്‍ഡ്


ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ  പുനരുപയോഗിക്കുന്നത് കൊണ്ട് സാധാരണ ഇംഗ്ലീഷ് കീ ബോര്‍ഡ് ഉപയോഗിച്ച് തന്നെ മലയാള അക്ഷരങ്ങള്‍ കമ്പ്യൂട്ടറിലേക്ക് നല്‍കാം. അത് അറിയാന്‍ എതെങ്കിലും ഒരു വേര്‍ഡ്‌ പ്രോസസ്സര്‍ തുറന്ന് ഫോണ്ട്  'ML-TT Karthika' ആക്കുക. എന്നിട്ട് 'A' കീ അമര്‍ത്തുക 'A' യുടെ അക്ഷരസംഖ്യക്ക്‌ (65) തുല്യമായ അക്ഷരസംഖ്യയുള്ള 'ML-TT Karthika'-യിലെ അക്ഷരം 'അ' ഡോക്യുമെന്റില്‍ തെളിയുന്നത് കാണാം. ഇങ്ങനെ, ടൈപ്പ് ചെയ്യുന്ന ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യക്ക്‌ തുല്യമായ അക്ഷരസംഖ്യയുള്ള 'ML-TT Karthika'-യിലെ അക്ഷരം ഡോക്യുമെന്റില്‍ വരുന്നതാണ്.

ഇങ്ങനെ മലയാളം ടൈപ്പ് ചെയ്യുമ്പോള്‍ ഉള്ള ദോഷം ഈ ലിപി വിന്യാസം മലയാളം ടൈപ്പ് റൈറ്റര്‍-ന്റെയോ അതുപോലെയുള്ളതോ ആയ സ്റ്റാന്‍ഡേര്‍ഡ് പിന്തുടരുന്നില്ല എന്നതാണ്.


ഇന്‍സ്ക്രിപ്റ്റ്. 


മലയാളം അടക്കമുള്ള ഭാരതീയ ഭാഷകളുടെ കീ ബോര്‍ഡ്‌ വിന്യാസം ഭാരത സര്‍ക്കാരിന്റെ സ്ഥാപനമായ സി-ഡാക്ക് ഔദ്യോഗികമായി എകീകരിച്ചിട്ടുണ്ട്. ഇതനുസരിച്ചുള്ള ഔദ്യോഗിക നിവേശക രീതിയാണ് ഇന്‍സ്ക്രിപ്റ്റ്.

ഇന്‍സ്ക്രിപ്റ്റ് രീതിയിലെ മലയാളം ലിപി വിന്യാസം താഴെ കൊടുത്തിരിക്കുന്നു (ചിത്രത്തിന് കടപ്പാട്: http://malayalam.kerala.gov.in).



മലയാളം ഇന്പുട്ട് ചെയ്യാനുള്ള ഏറ്റവും നല്ല രീതി ഈ കീ ബോര്‍ഡ്‌ വിന്യാസം ഉപയോഗിക്കുക എന്നതാണ്. ഏറ്റവും ചുരുങ്ങിയ എണ്ണം കീ അമര്‍ത്തലുകള്‍ കൊണ്ട് വേഗത്തില്‍ മലയാളം ടൈപ്പ് സെറ്റ് ചെയ്യാന്‍ സാധിക്കുന്ന കാര്യക്ഷമമായ മാര്‍ഗമാണിത്. മലയാളം വേര്‍ഡ്‌ പ്രോസസ്സിംഗ് പ്രൊഫഷണല്‍ ആയി ചെയ്യുന്നതിനു സര്‍ക്കാര്‍ അംഗീകരിച്ചിരിക്കുന്ന നിവേശക രീതി ഇതാണ്.

Windows XP യില്‍ മലയാളം ലഭ്യമാക്കാനുള്ള മാര്‍ഗങ്ങള്‍ ഇവിടെ നല്‍കിയിട്ടുണ്ട്.
http://malayalam.kerala.gov.in/index.php/EnableMalayalam#Enable_Malayalam_on_Windows_XP

ലിപ്യന്തരണം (Transliteration)


കമ്പ്യൂട്ടറില്‍ മലയാളം ടൈപ്പ് ചെയ്യാനുള്ള മറ്റൊരു രീതിയാണ് ലിപ്യന്തരണം. ഇതില്‍ മലയാളം  ഇംഗ്ലീഷ്-ല്‍ ടൈപ്പ് ചെയ്താല്‍ മതി. മലയാളം ടൈപ്പ് റൈറ്റിംഗ് അറിയാത്തവര്‍ക്ക് ഇത് സൌകര്യമാണ്. ഇതിനു നിരവധി സോഫ്ട്വെയറുകള്‍ നിലവിലുണ്ട്. 'Manglish' ആണ് ഒരു ഉദാഹരണം.

ലിപ്യന്തരണത്തിന് സഹായിക്കുന്ന സോഫ്ട്വെയറുകള്‍ രണ്ടു തരം ഉണ്ട്.

൧. ഒരു ബ്രൌസര്‍ വിന്‍ഡോയിലോ ആപ്പ്ളിക്കെഷന്‍ വിന്‍ഡോയിലോ ലിപ്യന്തരണം സാധ്യമാക്കുന്നവ  .

൨. ഇന്‍സ്ക്രിപ്റ്റ് പോലെ ഓപ്പറേറ്റിങ് സിസ്റ്റത്തോട് ചേര്‍ന്ന് പ്രവര്‍ത്തിക്കുന്നവ.

ആദ്യത്തേതില്‍ ബ്രൌസര്‍ വിന്‍ഡോയിലോ ആപ്പ്ളിക്കെഷന്‍ വിന്‍ഡോയിലോ നിന്നു  ലിപ്യന്തരണം വരുത്തിയ മലയാളം പാഠം അവിടെ നിന്നു കോപ്പി ചെയ്ത് നമുക്ക് ആവശ്യമുള്ള സ്ഥലത്തേക്ക് പേസ്റ്റ് ചെയ്യണം.

രണ്ടാമത്തേതില്‍ നമുക്ക് ആവശ്യമുള്ള സ്ഥലത്തേക്ക് നേരിട്ട് ടൈപ്പ് ചെയ്യാം.

ആദ്യത്തെ രീതിയില്‍ പ്രവര്‍ത്തിക്കുന്ന ചില സോഫ്ട്വെയറുകള്‍  താഴെ കൊടുക്കുന്നു.
൧. വരമൊഴി (Varamozhi Application: https://sites.google.com/site/cibu/)
൨. മൊഴി ഓണ്‍ലൈന്‍ (http://varamozhi.appspot.com/assets/index.html)
൩. ഗൂഗിള്‍ ഓണ്‍ലൈന്‍ (http://www.google.com/transliterate/malayalam)

ജിമെയില്‍, ബ്ലോഗ്ഗര്‍ തുടങ്ങിയ സൈറ്റുകളിലും ദിനപത്രങ്ങളുടെ വെബ്‌സൈറ്റ്കളിലെ കമന്റ്‌ ബോക്സ്‌കളില്‍ വരെ ഇപ്പോള്‍ ഈ സൗകര്യം ലഭ്യമാണ്.  ഇത്തരം വെബ്സൈറ്റ്കളുടെ പ്രയോജനം ഈ സൗകര്യം ഓപ്പറേറ്റിങ് സിസ്റ്റത്തോട് ബന്ധപ്പെടുന്നില്ല എന്നതാണ്.

രണ്ടാമത്തെ രീതിയില്‍ പ്രവര്‍ത്തിക്കുന്ന ചില വിന്‍ഡോസ്‌ സോഫ്ട്വെയറുകള്‍  താഴെ കൊടുക്കുന്നു.
൧. മംഗ്ലീഷ് (Manglish)
൨. ഗൂഗിള്‍ ഇന്പുട്ട് ടൂള്‍സ് (Google Input Tools: http://www.google.com/inputtools/windows/index.html)
൩. മൈക്രോസോഫ്ട്‌ ഇന്‍ഡിക് ഇന്പുട്ട് ടൂള്‍സ് (Microsoft Indic Input Tools: http://bhashaindia.com/Downloads/Pages/home.aspx)

ലിനക്സില്‍ സ്കിം (SCIM) ഐ-ബസ്‌ (i-Bus) എന്നിവയില്‍ നിരവധി മലയാളം  ലിപ്യന്തരണ നിവേശക രീതികള്‍ ലഭ്യമാണ്.


ലിപ്യന്തരണം: ഒരു വിലയിരുത്തല്‍


ലിപ്യന്തരണ നിവേശക രീതികള്‍ക്ക് ഒരു പൊതു സ്റ്റാന്‍ഡേര്‍ഡ് നിലവിലില്ല. അത് സാധിക്കുകയുമില്ല. പലപ്പോഴും നമ്മള്‍ ഉദ്ദേശിക്കുന്ന വാക്ക് ലിപ്യന്തരണം വഴി കിട്ടിക്കൊള്ളണം എന്നില്ല. ഈ ലേഖനം ടൈപ്പ് ചെയ്തത് ഗൂഗിള്‍ ഇന്പുട്ട് ടൂള്‍സ് ഉപയോഗിച്ചാണ്‌. പലപ്പോഴും അതിലെ Character Picker ഉപയോഗിച്ചാണ് ഉദ്ദേശിക്കുന്ന അക്ഷരം ചേര്‍ത്തത്. ഒരേ പാഠം ടൈപ്പ് ചെയ്യുന്നതിന് ഇന്‍സ്ക്രിപ്റ്റ് ഉപയോഗിക്കുമ്പോള്‍ അമര്‍ത്തുന്നതില്‍ കൂടുതല്‍ കീ-കള്‍  ലിപ്യന്തരണം വഴി ചെയ്യുമ്പോള്‍ അമര്‍ത്തേണ്ടി വരുന്നതിനാല്‍ ഈ രീതി ഒട്ടും കാര്യക്ഷമമല്ല.

മലയാളം ഇന്‍സ്ക്രിപ്റ്റ് ടൈപ്പിംഗ്‌ അറിയാത്തവര്‍ക്ക് ഒരു വഴി എന്നല്ലാതെ വേര്‍ഡ്‌ പ്രോസസ്സിംഗ് വിദഗ്ധര്‍ ലിപ്യന്തരണ നിവേശക രീതികള്‍ ഉപയോഗിക്കുന്നത് അഭികാമ്യമല്ല.


മലയാളം ഫോണ്ടുകള്‍


ആസ്കീ പട്ടികയില്‍ കോഡുകള്‍ക്ക് തുല്യമായി ആസ്കി നിശ്ചയിച്ചിരിക്കുന്ന അക്ഷരങ്ങള്‍ മാറ്റി അവിടെ മറ്റു ഭാഷകളിലെ അക്ഷരങ്ങള്‍ വയ്ക്കുക വഴിയാണ് കമ്പ്യൂട്ടറില്‍ മറ്റു ഭാഷകളുടെ ഉപയോഗം സാധ്യമാക്കിയത്. മലയാളത്തില്‍ 'ML-TT Karthika' എന്ന ഫോണ്ട് ഉപയോഗിച്ചിരിക്കുന്ന അക്ഷരസംഖ്യകള്‍ മുകളില്‍ കാണിച്ചിട്ടുണ്ട്.

ഒറ്റ നോട്ടത്തില്‍ ഇവിടെ വ്യക്തമാകുന്ന ഒരു വസ്തുത ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ  മലയാളം അക്ഷരങ്ങള്‍ക്ക് പുനരുപയോഗിക്കുന്നു എന്നതാണ്. ഇത് ഒരു ലഘു പരീക്ഷണം വഴി വ്യക്തമാകുന്നതാണ്.

വേര്‍ഡില്‍ ഒരു പുതിയ ഡോക്യുമെന്റ് തുറന്നു അതില്‍ ഏതെങ്കിലും ഇംഗ്ലീഷ് ഫോണ്ട് സെറ്റ് ചെയ്തു  'A' മുതല്‍ 'Z' വരെയുള്ള അക്ഷരമാല ടൈപ്പ് ചെയ്യുക. അതിനു ശേഷം ആ ടെക്സ്റ്റ്‌ മുഴുവന്‍ സെലക്ട്‌ ചെയ്ത ശേഷം ഫോണ്ട്  'ML-TT Karthika' ആക്കുക. ടൈപ്പ് ചെയ്ത ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ സ്ഥാനത്ത് അവയുടെ അക്ഷര സംഖ്യക്ക് തുല്യമായ മലയാളം അക്ഷരം കാണാവുന്നതാണ്.

ഈ രീതിക്ക് കുറെ പോരായ്മകളുണ്ട്. അതില്‍ ആദ്യത്തേത്, ഈ രീതിക്ക് ഒരു സ്റ്റാന്‍ഡേര്‍ഡ് ഇല്ല എന്നതാണ്. അതായത് ഫോണ്ട് നിര്‍മിക്കുന്ന ഓരോരുത്തരും അവരവരുടെ ഫോണ്ടുകളിലെ അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യ സ്വയം നിശ്ചയിക്കുന്നു എന്നതാണ്. ഉദാഹരണത്തിന്   '74' (ഹെക്സാഡെസിമല്‍: '4A', ബൈനറി: '01001010')  എന്ന അക്ഷരസംഖ്യക്ക്‌ തുല്യമായ അക്ഷരം  'ML-TT Karthika' ഫോണ്ടില്‍ 'ഖ' യും 'Manorama'  ഫോണ്ടില്‍ 'ത്ത' യും 'Kalakaumudi'  ഫോണ്ടില്‍ 'ക്ക' യും ആണ്. 'ML-TT Karthika' ഫോണ്ടില്‍ തയാറാക്കിയ ഒരു  ടെക്സ്റ്റ്‌   'Manorama'  ഫോണ്ടിലേക്കോ 'Kalakaumudi'  ഫോണ്ടിലേക്കോ മാറ്റാനാവില്ല എന്നതാണ്  ഇതിന്റെ ഫലം. ഇത് ഒരു നിര്‍മാതാവിന്റെ ഫോണ്ട് ഉപയോഗിക്കുന്നവര്‍ മറ്റു ഫോണ്ടുകളിലേക്ക് മാറുന്നത് അസാധ്യമാക്കുന്നു. കൂടാതെ ഒരു ഫോണ്ടില്‍ തയാറാക്കിയ ഒരു രേഖ ഈമെയിലില്‍ അയച്ചു കിട്ടുന്നവര്‍ക്ക് ആ രേഖ വായിക്കണമെങ്കില്‍ ആ ഫോണ്ട് അവരുടെ കമ്പ്യൂട്ടറില്‍ ഉണ്ടാകേണ്ടാതായും വരുന്നു.

ഈ രീതിയുടെ അടുത്ത പോരായ്മ ഒരേ ഡോകുമെന്റില്‍ത്തന്നെ ഒന്നിലധികം ഭാഷ ഉപയോഗിക്കേണ്ടി വരുമ്പോഴാണ് വ്യക്തമാകുന്നത്. ഉപയോഗിച്ചിരിക്കുന്ന ഫോണ്ടിന്റെ വിവരങ്ങള്‍ കൂടി ഉള്‍പ്പെടുത്തുന്ന ഒരു ഫയല്‍ ഫോര്മാറ്റ് ആണ് (ഉദാ. വേര്‍ഡ്‌ ഡോക്യുമെന്റ്) ഉപയോഗിക്കുന്നുവെങ്കില്‍ ഇത് സാരമായ പ്രശ്നം സൃഷ്ടിക്കില്ല. അല്ലാത്ത ഫയല്‍ ഫോര്മാറ്റ് (ഉദാ.ആക്സെസ്സ് ഡാറ്റാബേസ്, ടെക്സ്റ്റ്‌ ഫയല്‍) ആണെങ്കില്‍ ഫയല്‍ ഉപയോഗ ശൂന്യമാകും.

നോട്ട്പാഡില്‍ (Notepad) ഒരു ടെക്സ്റ്റ്‌ ഫയല്‍ ഉണ്ടാക്കി നോക്കിയാല്‍ ഇത് മനസ്സിലാകും. ടെക്സ്റ്റ്‌ ഫയല്‍ ഫോര്‍മാറ്റില്‍ ഉപയോഗിച്ചിരിക്കുന്ന ഫോണ്ടിന്റെ വിവരങ്ങള്‍ ഉള്‍പ്പെടുത്തുകയില്ല. ഏത് ഫോണ്ട് ഉപയോഗിച്ച് വേണം ഫയല്‍ ഡിസ്പ്ലേ ചെയ്യേണ്ടത് എന്ന് തീരുമാനിക്കുന്നത് പ്രോഗ്രാമിലെ സെറ്റിംഗ് അനുസരിച്ചാണ്. 

Windows XP യില്‍ Programs>Accessories മെനുവില്‍ നിന്ന് Notepad തുറക്കുക. ഏതെങ്കിലും ഒരു ഇംഗ്ലീഷ് ടെക്സ്റ്റ്‌ ടൈപ്പ് ചെയ്യുക. അതിനു ശേഷം Notepad ലെ Format മെനുവില്‍ നിന്ന് Font തിരഞ്ഞെടുക്കുക.ഫോണ്ട്  'ML-TT Karthika' ആക്കുക. ടെക്സ്റ്റ്‌ മുഴുവന്‍ മലയാളത്തില്‍ ഡിസ്പ്ലേ ചെയ്യുന്നത് കാണാം. ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ  മലയാളം അക്ഷരങ്ങള്‍ക്ക് പുനരുപയോഗിക്കുന്നത് കൊണ്ടാണ് ഇത് സംഭവിക്കുന്നത്‌.


യൂണികോഡ് 


ഈ പ്രശ്നങ്ങള്‍ പരിഹരിക്കാനുള്ള പോംവഴിയായാണ് യൂണികോഡ് നിലവില്‍ വന്നത്. യൂണികോഡ്-എന്നത് ആസ്കിയുടെ ഒരു വികസിത രൂപമായി കരുതാം. ഇത് അക്ഷരസംഖ്യാ പട്ടികയുടെ ഒരു സ്റ്റാന്‍ഡേര്‍ഡ് ആണ്. ഇതില്‍ പിന്തുടര്‍ന്നിരിക്കുന്ന ആശയങ്ങള്‍ ഇവയാണ്.

൧.  ഒരു ഭാഷയിലെ അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യ മറ്റൊരു ഭാഷയിലെയും അക്ഷരങ്ങള്‍ക്ക് നല്‍കാതിരിക്കുക.

൨. എല്ലാ ഭാഷകളിലെയും അക്ഷരങ്ങള്‍ക്ക് ഒരു ഏകീകൃത അക്ഷരസംഖ്യ നല്‍കുക.

യൂണികോഡ് പ്രകാരം ചില മലയാള അക്ഷരങ്ങളുടെ അക്ഷരസംഖ്യ താഴെ കൊടുക്കുന്നു.


'അ' യുടെ അക്ഷര സംഖ്യ  '3333' (ഹെക്സാഡെസിമല്‍: '0D05')
'ആ' യുടെ അക്ഷര സംഖ്യ  '3334' (ഹെക്സാഡെസിമല്‍: '0D06')
'ഇ' യുടെ അക്ഷര സംഖ്യ  '3335' (ഹെക്സാഡെസിമല്‍: '0D07')
...


'മ' യുടെ അക്ഷര സംഖ്യ  '3374' (ഹെക്സാഡെസിമല്‍: '0D2E')
'യ' യുടെ അക്ഷര സംഖ്യ  '3375' (ഹെക്സാഡെസിമല്‍: '0D2F')
'ര' യുടെ അക്ഷര സംഖ്യ  '3376' (ഹെക്സാഡെസിമല്‍: '0D2G')
...

യൂണികോഡ് പ്രകാരമുള്ള മലയാള അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യകളുടെ പൂര്‍ണ പട്ടിക കാണാന്‍ ഈ രേഖ നോക്കുക. http://www.unicode.org/charts/PDF/U0D00.pdf

യൂണികോഡ് സ്റ്റാന്‍ഡേര്‍ഡ് പിന്തുടരുന്ന ചില മലയാളം ഫോണ്ടുകള്‍ ഇവയാണ്.
൧. അഞ്ജലി ഓള്‍ഡ്‌ ലിപി (Anjali Old Lipi)
൨. മീര (Meera)
൩. നിള (Nila)
൪. കാര്‍ത്തിക (Karthika)
൫. രചന (Rachana)

യൂണികോഡ്-ല്‍ ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ അക്ഷര സംഖ്യ  മലയാളം അക്ഷരങ്ങള്‍ക്ക് പുനരുപയോഗിക്കുന്നില്ല എന്നതറിയാന്‍ നേരത്തെ ചെയ്ത ഒരു ലഘു പരീക്ഷണം തന്നെ ചെയ്യാവുന്നതാണ്.

Windows XP യില്‍ Programs>Accessories മെനുവില്‍ നിന്ന് Notepad തുറക്കുക. ഏതെങ്കിലും ഒരു ഇംഗ്ലീഷ് ടെക്സ്റ്റ്‌ ടൈപ്പ് ചെയ്യുക. അതിനു ശേഷം Notepad ലെ Format മെനുവില്‍ നിന്ന് Font തിരഞ്ഞെടുക്കുക.ഫോണ്ട്  'Anjali Old Lipi'  ആക്കുക. ടൈപ്പ് ചെയ്ത ഇംഗ്ലീഷ് അക്ഷരങ്ങളുടെ ഫോണ്ട് മാറുന്നതല്ലാതെ മലയാളം അക്ഷരങ്ങള്‍ ആകുകയില്ല.

ഇനി മൈക്രോസോഫ്ട്‌ വേര്‍ഡില്‍ ഒരേ ഡോകുമെന്റില്‍ത്തന്നെ ഇംഗ്ലീഷും മലയാളവും ഭാഷകള്‍ ഇടകലര്‍ത്തി യൂണികോഡ്-ഫോണ്ടില്‍  തയ്യാറാക്കിയ ഒരു ടെക്സ്റ്റ്‌-ല്‍ ഫോണ്ട് മാറ്റി നോക്കുക. ഇംഗ്ലീഷ് അക്ഷരങ്ങള്‍ മലയാളമോ മലയാളം അക്ഷരങ്ങള്‍ ഇംഗ്ലീഷ്-ഓ ആവുകയില്ല.

ഈ കാരണങ്ങള്‍ കൊണ്ടാണ് പ്രാദേശിക ഭാഷാ കമ്പ്യൂട്ടിങ്ങില്‍ യൂണികോഡ് സ്റ്റാന്‍ഡേര്‍ഡ് പിന്തുടരുന്ന ഫോണ്ടുകള്‍ക്ക് പ്രാധാന്യമുള്ളത്.

കേരള സര്‍ക്കാര്‍ ഓഫീസുകളില്‍ യൂണികോഡ് സ്റ്റാന്‍ഡേര്‍ഡ് പിന്തുടരുന്ന ഫോണ്ടുകള്‍ ഉപയോഗിക്കണമെന്ന് നിഷ്കര്ഷിച്ചു കൊണ്ട് പുറത്തിറക്കിയ ഉത്തരവ് ഇവിടെ ലഭ്യമാണ്.
http://www.itmission.kerala.gov.in/downloads/doc_download/83-go-ms-no-312008itd-dt-21082008-malayalam-unicode.html

2 comments:

  1. വിജ്ഞാനപ്രദമായ ഈ ലേഖനം തയ്യാറാക്കിയതിന് നന്ദി. ഇതിന്റെ ലിങ്ക് മാംപൂവിന്റെ ഫേസ്ബുക്ക് താളിൽ ഉൾക്കൊള്ളിച്ചിട്ടുണ്ട്. മാംപൂവിനൊപ്പം ഉണ്ടായിരിക്കുമല്ലോ? :)

    https://www.facebook.com/groups/140224686169867/
    http://mampoo.org/

    ReplyDelete
  2. വളരെ പ്രയോജനപ്രദം.പുതിയ അറിവ്.നന്ദി ഹരിജിത്തിനും മാമ്പൂവിനും

    ReplyDelete