യൂണിക്കോഡു്

കംപ്യൂട്ടറില്‍ ഒരു കോഡു് നമ്പര്‍ ആണു് ഓരോ അക്ഷരത്തേയും പ്രതിനിധീകരിക്കുന്നതു്. അടിസ്ഥാനപരമായി ഇതിലെ ASCII എന്ന കോഡിംഗു് ഇംഗ്ലീഷു് അക്ഷരങ്ങള്‍ക്കും സംഖ്യകള്‍ക്കും വേണ്ടിയാണു്.

അക്കങ്ങളെയാണു് കംപ്യൂട്ടര്‍ അടിസ്ഥാനപരമായി കൈകാര്യം ചെയ്യുന്നതു്, അതും പൂജ്യവും ഒന്നും ചേര്‍ത്തു് തിരിച്ചറിയാവുന്ന 16 ബിറ്റു്, 32 ബിറ്റു്, 64 ബിറ്റു് ഡിജിറ്റല്‍ രൂപത്തില്‍. ഭാഷയിലെ അക്ഷരങ്ങള്‍ക്കും അക്കങ്ങള്‍ക്കും ചിഹ്നങ്ങള്‍ക്കും ഓരോന്നിനും തനതായ ഒരു സംഖ്യാസമൂഹം നിശ്ചയിച്ചു് ലോകമൊട്ടാകെ അംഗീകരിക്കപ്പെട്ടിട്ടുണ്ടു്. ഈ സംഖ്യാസമൂഹത്തില്‍ നിന്നും അക്ഷരം ഏതാണെന്നു് കംപ്യൂട്ടര്‍ തിരിച്ചറിഞ്ഞുകൊണ്ടാണു് അതു് അതിനെ വിശകലനം ചെയ്യുന്നതും പ്രവര്‍ത്തിപ്പിക്കുന്നതും. ആദ്യകാല കംപ്യൂട്ടറുകളില്‍ ഇതിനായി പല കംപ്യൂട്ടര്‍ ഭാഷകളും ഉണ്ടായിരുന്നതിനാല്‍ ഒരു രീതി മറ്റനേകം രീതികളുമായി ഇണങ്ങാതെ മൊത്തം ആശയക്കുഴപ്പമായിരുന്നു. എല്ലാം കൂടി ചേര്‍ത്തു് പില്‍ക്കാലത്തു് അതു് ASCII എന്ന ഇംഗ്ലീഷു് ഭാഷാ എന്‍കോഡിംഗു് സമ്പ്രദായത്തില്‍ ലോകം ഒട്ടാകെ അംഗീകരിക്കപ്പെടുകയും അങ്ങനെ ഏകീകരണം സാധ്യമാവുകയും ചെയ്തു. പക്ഷെ ഇതു് ആംഗലേയഭാഷയ്ക്കു് മാത്രമായി ഉള്ള സംവിധാനമായിരുന്നു. ലോകമെമ്പാടുമുള്ള മറ്റനേകം ഭാഷകള്‍ക്കായി പില്‍ക്കാലത്തു് നിലവില്‍ വന്ന രീതിയാണു്  യൂണിക്കോഡു് കണ്‍സോര്‍ഷ്യം നിര്‍ദ്ദേശിച്ച യൂണിക്കോഡു് സമ്പ്രദായം. ഓരോ ഭാഷാക്ഷരങ്ങള്‍ക്കും അക്കങ്ങള്‍ക്കും ചിഹ്നങ്ങള്‍ക്കും തനതായ ഒരു സംഖ്യ യൂണിക്കോഡു് നല്‍കുന്നു. ലോകത്തുള്ള പല ഭാഷകളും ചേര്‍ത്തു് 1,09,449 അക്ഷരങ്ങള്‍ യൂണിക്കോഡില്‍ ഇതു വരെ ഉള്‍ക്കൊള്ളിച്ചു കഴിഞ്ഞു. ഇതില്‍ മൊത്തം 11,14,112 അക്ഷരങ്ങള്‍ വരെ ഉള്‍ക്കൊള്ളിക്കാന്‍ സാധിക്കുമെങ്കിലും അധികമുള്ള 10,04,663 സ്ഥാനങ്ങള്‍ ഇതു വരെ ഉപയോഗപ്പെടുത്തിയിട്ടില്ല. (പൂജ്യവും ഒന്നും അടങ്ങുന്ന അക്കങ്ങള്‍ വച്ചു് 16 സ്ഥാനങ്ങള്‍ [16 bit] കല്പിക്കുമ്പോള്‍ 2 അക്കങ്ങള്‍ക്കും കൂടി 65,536 വിവിധതരം സംഖ്യാസമൂഹത്തിന്റെ സാദ്ധ്യതയുണ്ടു്. ഇങ്ങനെയുള്ള സ്ഥാനങ്ങള്‍ 17 ലേയറില്‍ ആയി ഗുണിക്കുമ്പോള്‍ കിട്ടുന്നതാണു് 11,14,112 എന്ന സംഖ്യ. ഉദാഹരണം 16 സ്ഥാനങ്ങള്‍ അടങ്ങുന്ന കോഡ് സംഖ്യകള്‍ 0101010101010101 ഉം 101010101010101010 ഉം വ്യത്യസ്ത സംഖ്യകളാണെന്നു് കാണാം. അതിനാല്‍ ഓരോന്നിനും ഓരോ അക്ഷരങ്ങള്‍ കല്പിക്കുവാന്‍ സാധിക്കും).

ഡിജിറ്റല്‍ അക്കങ്ങളെ അക്ഷരങ്ങളാക്കി കംപ്യൂട്ടര്‍ മനസ്സിലാക്കിയാല്‍ അവയെ മോണിറ്ററില്‍ അക്ഷരങ്ങളാക്കി കാണിക്കണമെങ്കില്‍ അക്ഷരരൂപത്തിന്റെ ചിത്രവും വേണം. ഈ അക്ഷരരൂപങ്ങളുടെ പട്ടികയാണു ഫോണ്ടു് എന്നു പറയുന്നതു്. ഇതില്‍ എന്‍കോഡിംഗു് സംഖ്യ ഒരു വശത്തും മറുവശത്തു് തത്തുല്യ അക്ഷരരൂപങ്ങളും കൊടുത്തിരിക്കും. മോണിറ്ററിലോ പ്രിന്ററിലോ വളരെ ചെറിയ പിക്സലുകളായി (‍‍ഡോട്ടുകള്‍ ) വരയ്ക്കുന്നതാണു അക്ഷരമായി ഉപയോക്താവു് കാണുന്നതു്. ഫോണ്ടിനെപ്പറ്റിയുള്ള വിശദവിവരം ഇവിടെ വായിക്കുക.

യൂണിക്കോഡു് എന്നതു് ഒരു എന്‍കോഡിംഗു് രീതിയാണു്. മലയാളത്തിനെ അതു പുതിയ ലിപിയോ പഴയലിപിയോ ആയിട്ടല്ല കാണുന്നതു്. ഉദാ: പഴയ ലിപിയോ പുതിയ ലിപിയോ ഏതുപയോഗിച്ചും കര്‍ക്കിടകം എന്നു റ്റൈപ്പു് ചെയ്തുകഴിഞ്ഞാല്‍ യൂണിക്കോഡു് അതിനെ ക + ര + ് + ക + ് + ക + ി + ട + ക + ം എന്നിങ്ങനെ പിരിച്ചതിനു ശേഷം ഓരോന്നിന്റെയും അക്ഷങ്ങളായിട്ടു് തിരിച്ചറിയുന്നതിനു പകരം അതാതിന്റെ കോഡ്‌നമ്പര്‍ ആയിട്ടാണു് വിശകലനം ചെയ്യുന്നതു്. വിശകലനം കഴിഞ്ഞാല്‍ കോഡു് നമ്പര്‍ മോണിറ്ററില്‍ തെളിയിക്കുന്നതിനു പകരം അതാതിന്റെ അക്ഷരങ്ങള്‍ ആയി മോണിറ്ററില്‍ കാണിക്കും. അതു വായിക്കുവാന്‍ ഉപയോഗിക്കുന്നതു് പഴയ ലിപിയിലെ ഫോണ്ടാണോ പുതിയ ലിപിയിലെ ഫോണ്ടാണോ എന്നതാശ്രയിച്ചാണു് ഓരോ കോഡ്‍നമ്പറും ലിപിയുടെ രൂപത്തില്‍ മോണിറ്ററില്‍ തെളിയുക. അതായതു് ഇന്‍പുട്ടു് ചെയ്ത രീതി ഏതു തന്നെ ആയാലും ഔട്ട്പുട്ടു് ചെയ്യുന്ന രീതിക്കുപയോഗിക്കുന്ന ഫോണ്ടിനനുസരിച്ചു് അക്ഷരങ്ങളുടെ രൂപത്തിനു മാറ്റമുണ്ടാകും.

൧൯൮൭ല്‍ ആണു് യൂണിക്കോഡു് എന്ന രീതി ഉടലെടുക്കുന്നതു്.  (The name 'Unicode' is intended to suggest a unique, unified, universal encoding"). ൧൯൯0 ഓടു് കൂടി ലോകത്തെ മിക്ക ഭാഷകള്‍ക്കുമായി യൂണിക്കോഡില്‍ ൧൬ ബിറ്റില്‍ ഉള്‍ക്കൊള്ളിക്കപ്പെട്ട ഒരു സമ്പ്രദായത്തിന്റെ രൂപരേഖ ആയി. ൧൯൯൧ ജനുവരിയില്‍ ലോകത്തെ എല്ലാ ഭാഷകളും കമ്പ്യൂട്ടറില്‍ ഉള്‍ക്കൊള്ളിക്കുവാന്‍ വേണ്ടി യൂണിക്കോഡു് കണ്‍സോര്‍ഷ്യം എന്ന സംഘടന നിലവില്‍ വരികയും അവരുടെ ശ്രമഫലമായി ൧൯൯൧ ഒക്ടോബര്‍ ഓടുകൂടി ആദ്യത്തെ രൂപരേഖ തയ്യാറായി. ൧൯൯൬ ഓടു കൂടി ൧൬ ബിറ്റില്‍ നിന്നും ൩൨ ബിറ്റിലേക്കു് യൂണിക്കോഡു് സമ്പ്രദായം മാറിയപ്പോള്‍ കൂടുതല്‍ ഭാഷകളെ ഉള്‍ക്കൊള്ളിക്കാന്‍ സാദ്ധ്യതകള്‍ വര്‍ദ്ധിച്ചു. യൂണിക്കോഡു് കണ്‍സോര്‍ഷ്യം എന്ന ലാഭേച്ഛയില്ലാത്ത സംഘടനയില്‍ ലോകത്തുള്ള പല സോഫ്റ്റു്വേര്‍ ഹാര്‍ഡു്വേര്‍ നിര്‍മ്മാതാക്കളാണു്.

9 ഇന്ത്യന്‍ ഭാഷകള്‍ക്കായി 128 X 9 = 1152 കോഡുകള്‍ ( 2304 മുതല്‍ 3455 വരെ ) അലോട്ടു് ചെയ്തിരിക്കുന്നതില്‍ 3328 മുതല്‍ 3455 വരെയുള്ള 128 എണ്ണം മലയാള ലിപികള്‍ക്കാണു് നീക്കി വച്ചിരിക്കുന്നതു്. അംഗീകരിക്കപ്പെട്ട ഈ രീതിയില്‍ ഒരോ മലയാള അക്ഷരങ്ങള്‍ക്കും അക്കങ്ങള്‍ക്കും ചിഹ്നങ്ങള്‍ക്കും അതാതിന്റേതായ തനതായ സംഖ്യാസമൂഹം നിര്‍ണ്ണയിക്കപ്പെട്ടു.  ഇതു് മനസ്സിലാക്കിയാണു് പല സോഫ്റ്റു് വേറും ഹാര്‍ഡു്വേറും ഡിസൈന്‍ ചെയ്തിരിക്കുന്നതു്. ഈ യൂണിക്കോ‍‍ഡു് അക്ഷരങ്ങളെയും അക്കങ്ങളെയും ചിഹ്നങ്ങളെയും നെറ്റിലും വെബു് പേജുകളിലും ഉപയോഗിച്ചാല്‍ അവയെ ലോകത്തുള്ള ഏതു് കംപ്യൂട്ടറിനും സര്‍ച്ചു് എന്‍ജിനും തിരിച്ചറിയുവാന്‍ സാധിക്കും. യൂണിക്കോഡു് ഉപയോഗിച്ചു് മലയാളത്തില്‍ എഴുതാം, വായിക്കാം, വെബു്സൈറ്റു് ഉണ്ടാക്കാം, ബ്ലോഗു് ഉണ്ടാക്കാം, ചാറ്റു് ചെയ്യാം, ഈ മെയില്‍ ചെയ്യാം, ഗൂഗിളില്‍ മലയാളത്തില്‍ സര്‍ച്ചു് ചെയ്യാം എന്നതു് കൂടാതെ ഒരു മാതിരിപ്പെട്ട എല്ലാ ഓഫീസു് സോഫ്റ്റു്വേറിലും മലയാളം ഉപയോഗിക്കാം, വിന്‍ഡോസില്‍ ഫൈല്‍ റീനെം ചെയ്യാം.

കംപ്യൂട്ടര്‍ ഓപ്പറേറ്റിങ്ങു് സിസ്റ്റം ഇത്തരം യൂണിക്കോണ്ടു് ഫോണ്ടുകളെ തിരിച്ചറിയേണ്ടതുണ്ടു്. അങ്ങിനെ തിരിച്ചറിയാന്‍ സാദ്ധ്യമായതിനാല്‍ യൂണിക്കോഡു് ഫോണ്ടുകള്‍ ആണു് ഇന്റര്‍നെറ്റില്‍ സര്‍വ്വസാധാരണമായി ഉപയോഗിക്കുന്നതു്.

കംപ്യൂട്ടര്‍ ഉപയോഗിച്ചു് മലയാളം അല്ലെങ്കില്‍ മറ്റു് ഇന്ത്യന്‍ ഭാഷകള്‍ റ്റൈപ്പു് ചെയ്യുമ്പോള്‍ അതു് റ്റൈപ്പു് ചെയ്യാനുള്ള രീതി ഒരു പ്രശ്നം ആണു്. Qwerty കീബോര്‍ഡു് തന്നെ ഉപയോഗിച്ചു് മലയാളം റ്റൈപ്പു് ചെയ്യാന്‍ ഏക ആശ്രയം ഇന്‍സ്ക്രിപ്റ്റു് കീബോര്‍ഡാണു്. Qwerty കീബോര്‍ഡില്‍ ഇന്‍സ്ക്രിപ്റ്റു് വരാന്‍ വേണ്ടി വിന്‍ഡോസില്‍ അതിന്റെ Winscript (Inscript keyboard in Windows Operating System) സോഫ്റ്റു്വേര്‍ ഇന്‍സ്റ്റാള്‍ ചെയ്താല്‍ മതി. വിന്‍‍ഡോസു് 7 നു ശേഷമുള്ള WinOS ല്‍ ഡിഫാള്‍ട്ടു് ആയി Winscript ഉണ്ടു്. അതു ആക്ടിവേറ്റു് ചെയ്യുകയേ വേണ്ടു.

ചില മാദ്ധ്യമങ്ങള്‍ ഇന്റര്‍നെറ്റില്‍ ഉപയോഗിക്കുന്നതു് ഇംഗ്ലീഷു് പോലത്തെ ASCII ല്‍ എന്‍കോഡു് ചെയ്ത ഫോണ്ടുകള്‍ ആണു്. അതില്‍ അക്ഷരങ്ങള്‍ക്കു് സംഖ്യ പ്രതിനിധീകരിക്കുന്നതിനു പകരം മലയാളം സിംബല്‍സു് ആണു് ഉപയോഗിക്കുന്നതു്. ഇവയ്ക്കൊന്നിനും യൂണിക്കോഡിന്റെ സ്വഭാവങ്ങള്‍ ഒന്നും തന്നെ ഇല്ല. ചിലര്‍ ഡൈനാമിക്കു് ഫോണ്ടു് ഉപയോഗിക്കുന്നു. അവരുടെ സൈറ്റു് ആദ്യമായി സന്ദര്‍ശിക്കുന്ന സമയത്തു് ഈ ഫോണ്ടുകള്‍ ഓട്ടോമാറ്റിക്കു് ആയി ഇന്റര്‍നെറ്റു് എക്സ്പ്ലോററില്‍ ഇന്‍സ്റ്റാള്‍ ആകും. മറ്റു ബ്രൗസറുകളില്‍ ഇതു് സംഭവിക്കുക ഇല്ല.

നിങ്ങളുടെ കംപ്യൂട്ടറില്‍ ASCII ല്‍ എന്‍കോഡു് ചെയ്ത സിംബല്‍ ഫോണ്ടുകളില്ലെങ്കില്‍ ഇവ ഉപയോഗിച്ചു് തയ്യാര്‍ ചെയ്യപ്പെട്ട ഇന്റര്‍നെറ്റു് താളുകളില്‍ കാണാന്‍ കഴിയുന്നതു് വെബു്ഡിംഗ്സു് പോലത്തെ സിംബല്‍സോ താഴെ കാണുന്നതു് പോലെയോ മാത്രമായിരിക്കും.
ഇന്റര്‍നെറ്റില്‍ നിങ്ങള്‍ ചെയ്യുന്ന മലയാളം സംഭാവനകള്‍ മറ്റുള്ളവര്‍ കാണുന്നതു് മുകളില്‍ കാണുന്നതു് പോലെ ആകരുതെന്നു് ആഗ്രഹമുണ്ടെങ്കില്‍ നിങ്ങള്‍ യൂണിക്കോഡു് ഫോണ്ടുകള്‍ തന്നെ ഉപയോഗിക്കണം. നിങ്ങളുടെ ഓപ്പറേറ്റിംഗു് സിസ്റ്റം വിന്‍ഡോസാണെങ്കില്‍ അതില്‍ മലയാളം റ്റൈപ്പു് ചെയ്യുവാന്‍ ഏറ്റവും നല്ലതു് Inscript Keyboard for Malayalam in Windows OS.

മുമ്പു് ASCII സമ്പ്രദായത്തില്‍ മലയാളം ഫോണ്ടുകള്‍ ചെയ്തുകൊണ്ടിരുന്നതു്  അതാതു് ഇംഗ്ലീഷു് ഫോണ്ടു്ഫേസില്‍ മലയാള അക്ഷരങ്ങളുടെ പടം വച്ചു് കംപ്യൂട്ടറെ തെറ്റിദ്ധരിപ്പിക്കുക എന്ന രീതി ആയിരുന്നു.  യൂണിക്കോഡു് സമ്പ്രദായത്തില്‍ മലയാള ലിപി ലിപിയായിത്തന്നെ കമ്പ്യൂട്ടര്‍ മനസ്സിലാക്കുകയാണു്. ASCIIല്‍ എഴുതിയ മലയാളം കമ്പ്യൂട്ടറിലോ സേര്‍ച്ചു് ചെയ്തു് കണ്ടുപിടിക്കാന്‍ സാധ്യമല്ലെങ്കില്‍ യൂണിക്കോഡില്‍ എഴുതിയ മലയാളം ഇംഗ്ലീഷു് സര്‍ച്ചു് പോലെ തന്നെ എളുപ്പത്തില്‍ കണ്ടെത്താനാവും.

ലോകത്തു് എല്ലാ വിധ ഭാഷകള്‍ക്കും യൂണിക്കോഡിലേക്കു് മാറിക്കഴിഞ്ഞു

യൂണിക്കോഡു് കൊണ്ടുള്ള നേട്ടങ്ങള്‍

൧. ഒന്നില്‍ കൂടുതല്‍ ഭാഷകള്‍ ഒരേ ഫയലില്‍ റ്റൈപ്പു് ചെയ്തു സൂക്ഷിക്കാം
൨. അക്ഷരത്തെറ്റുകള്‍ കണ്ടു പിടിക്കാം
൩. വാക്കുകളും വരികളും അക്ഷരമാല ക്രമത്തില്‍ നിരത്താം
൪. ഏതെങ്കിലും ഒരു മലയാളം യൂണിക്കോഡു് ഫോണ്ടു് കംപ്യൂട്ടറില്‍ ഉണ്ടായാല്‍ മതി
൫. ഏതു ആപ്ലിക്കേഷനിലും മലയാളം ഉപയോഗിക്കാം
൬. ഒരിടത്തു നിന്നും വേറൊരിടത്തേക്കു് പകര്‍ത്തി ഒട്ടിക്കാം
൭. മലയാളത്തില്‍ ഈമെയില്‍ അയക്കാം
൮. ഇന്റര്‍നെറ്റിലും കംപ്യൂട്ടറിലും വിവരം തിരയാം
൯. ഇന്റര്‍നെറ്റില്‍ ലഭ്യമായ മലയാളം താളുകള്‍ വായിക്കാം
൧0. 

2 comments:

  1. എനിക്ക് മലയാളത്തില്‍ "ന്‍റെ" എന്ന അക്ഷരം type ചെയ്യാൻ പറ്റുന്നില്ല. ഞാൻ വിൻഡോസ്സ് 8 ആണ്ണ് ഉപയോഗിക്കുന്നത്. ൾ എന്ന അക്ഷരം എനിക്ക് (shift *) അടിച്ചപൊൾ കിട്ടി. എന്നെ സഹായികുമോ....

    ReplyDelete
  2. @Rathish Kumar
    See http://howtotypemalayalam.blogspot.in/2013/11/malayalam-koottaksharam.html
    ന+്+റ=ന്റ
    ന+ ് +]=ന്‍റ

    Also see http://howtotypemalayalam.blogspot.in/p/e.html
    .
    .

    ReplyDelete

സംശയങ്ങള്‍, ആശയങ്ങള്‍, അഭിപ്രായങ്ങള്‍, നിര്‍ദ്ദേശങ്ങള്‍ എന്നിവ ഇവിടെ പറഞ്ഞിട്ടു് മറുപടി പ്രതീക്ഷിച്ചു കാത്തിരിക്കുക. മറുപടി കിട്ടും. തീര്‍ച്ച!