கணினியில் தமிழ்
Published by Arun Isaac on
Tags: தமிழ்
கணினிக்கலையில் தமிழ் பயன்பாட்டை அதிகரிக்க நான் தமிழ்க் கணினிக் குழுவை நிறுவினேன். அதன் முதன்மையான பணி Translation Project என்னும் கட்டற்ற மென்பொருள் மொழிபெயர்ப்புத் தளத்தில் தமிழ்க் குழுவை நடத்துவதே. Translation Project யில் பல GNU கட்டளை நிரல்கள் மொழிபெயர்ப்பிற்காக வழங்கப்பட்டிருக்கின்றன. பெரும்பாலும் தமிழாக்க முயற்சிகள் வலை, கைபேசி மென்பொருள் என அதிகமாகப் பயன்படுத்தப்படும் மென்பொருட்களுக்குப் பெரியுதி அளிக்கின்றன. தமிழ் நிரலாக்கரும் கணினி வல்லுநரும் ஆங்கிலத்தையே பயன்படுத்துகின்றனர். இந்நிலையை மாற்ற நிரலாக்கர் அதிகம் பயன்படுத்தும் கட்டளை நிரல்களைத் தமிழாக்க வேண்டும். இதற்குத் தமிழ்க் கணினி சொல்வளத்தைத் தரப்படுத்த வேண்டும். இவ்விரண்டையும் நடைமுறைபடுத்துவதே தமிழ்க் கணினிக் குழுவின் நோக்கம்.
தமிழ்க் கணினிக்குள் புகுவதற்கு இடையூறாகயிருக்கும் சிலவற்றைப் பற்றியும் அவ்விடையூறுகளைக் கடக்கும் முயற்சிகள் பற்றியும் கீழ் காணலாம்.
கலைச்சொற்கள் நுண்பொருள் தர வேண்டும்
கலைச்சொற்கள் பொதுச் சொற்கள் போன்றில்லாமல் துல்லியமான நுண்பொருள் தருவனவாயிருக்க வேண்டும்1. ஆங்கில கலைச்சொற்கள் இத்தகையவை. தமிழில் கலைச்சொற்கள் பல உருவாக்கப்பட்டுள்ளனவாயினும் அவைப் போதிய அளவு புழக்கத்தில் இல்லாததால், நுண்பொருள் எய்தாமல் பேரளவு அங்கீகாரம் பெறாமல் இருக்கின்றன. எடுத்துக்காட்டிற்கு ஆங்கிலத்தில் library, module, package என்னும் சொற்களைக் கருதுக. இச்சொற்கள் ஏறக்குறைய ஒரே பொருள் தந்தாலும், அவை இடம்பெற்றுள்ள இடத்திற்கேற்ப அவற்றின் பொருள்களில் நுண்மையான வேறுபாடு உண்டு. இச்சொற்கள் பலக் காலம் புழக்கத்தில் இருந்துள்ளதால் அவற்றின் பொருளில் கருத்தொற்றுமை உள்ளது. இச்சொற்களை எவரும் தவறாகப் புரிந்துக் கொள்ளமாட்டார். இச்சொற்களை நிரலகம், நிரல்கூறு, நிரல்தொகுப்பு என்று நாம் தமிழாக்கலாம். ஆனால் இத்தமிழாக்கங்கள் புழக்கத்திற்குள் புகாததால் அவற்றின் பொருள் மனத்திற்கு உடனே வெளிப்படுவதில்லை; மேலும் இத்தமிழாக்கங்களைப் பார்க்கிற ஒவ்வொருவரும் ஒவ்வொரு பொருள் காணும் வாய்ப்புள்ளது — அவற்றின் பொருளில் போதிய கருத்தொற்றுமை இல்லை.
ஆங்கிலத்தில் ஒரேச் சொல் கலைப்பொருளிலும் பொதுப்பொருளிலும் இடம்பெற்று குழம்பாமலிருக்க பல முறை கிரேக்க மொழிச் சொற்களையும் இலத்தீன் மொழிச் சொற்களையும் கடன் வாங்குகிறார்கள். இவ்வேற்றுமொழிச் சொற்களுக்கு ஆங்கிலத்தில் பிறப் பொதுப் பொருள் இல்லாததால் அவைத் தனித்து நின்று நுண்பொருள் தர முடிகிறது. இவ்வாறு கடன்சொற்கள் தேவையா என்பது ஐயப்பாட்டுக்குரியதாயினும் அவ்வாறே சொற்கள் வேண்டுமாயின் நாம் கடன் வாங்குவதற்குப் பதிலாகப் புழக்கத்திலிருந்து விலகிய பழந்தமிழ்ச் சொற்களை மீட்டெடுத்துப் புதிய நுண்பொருளுடன் பயன்படுத்தலாம்2.
ஓரகல எழுத்துருக்கள்
ஒர் எழுத்துருவில் அனைத்து எழுத்துகளும் ஒரே அகலமுடையதாய் அமைந்தால் அவ்வெழுத்துரு ஓரகல எழுத்துரு (monospace font) எனப்படும். எடுத்துக்காட்டாக ஆங்கிலத்தில் i என்னும் எழுத்து மிக மெலிந்தது; m என்னும் எழுத்து மிக அகலமானது; ஆயினும் ஓரகல எழுத்துருக்களில் அவை ஒரே அகலத்துடன் இருக்குமாறு கொஞ்சம் திரித்து எழுதப்பட்டிருக்கும். அனைத்து எழுத்துக்களும் ஒரே அகலமுடையதாய் இருந்தால் தான் கட்டளை நிரல்களின் வெளியீடு வரிக்கு வரி ஒருசீராக ஒன்றின் கீழ் ஒன்றாக நேர்படுத்தப்பட்டுத் தோன்றும். எனவே இவ்வெழுத்துருகள் கணினி முனையங்களில் பரவலாகப் பயன்படுத்தப்படுகின்றன. எனக்குத் தெரிந்தவரை தமிழ் ஓரகல எழுத்துருக்கள் இல்லை. தமிழ் எழுத்துகள் மிகுந்த அகல வேறுபாடு உடையவை. எடுத்துக்காட்டிற்கு, "க" போன்ற அகர எழுத்துகள் மிக மெலிந்தவை; "கோ" போன்ற ஓகார எழுத்துகள் மிக அகலமானவை. இத்தகைய அகல வேறுபாடுகளுடைய தமிழ் எழுத்துகளுக்கு ஓரகல எழுத்துரு உருவாக்குவதெப்படி? இதைப் பற்றி உங்களுக்கு எண்ணம் இருந்தால் கூறுங்கள்.
cal என்னும் நாட்காட்டி நிரலின் வெளியீட்டை ஆங்கிலத்திலும் தமிழிலும் கீழ் காண்க. ஆங்கில வெளியீடு ஓரகல எழுத்துருகளைப் பயன்படுத்துவதால் பத்திகள் நேர்படுத்தப்பட்டுத் தோன்றுகின்றன. தழிழிலோ ஓரகல எழுத்துருகள் இல்லாததால் கிழமைப் பெயர்கள் சற்று பெயர்ந்திருப்பதைக் காண்க.
February 2019 Su Mo Tu We Th Fr Sa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
பிப்ரவரி 2019 ஞா தி செ பு வி வெ ச 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
மென்பொருள் கையேடுகள்
கணினி நிரல்களைத் தமிழாக்குவதோடு தமிழாக்கப் பணி முடிந்துவிடாது. அதை விடக் கடினமான, ஆனால் அவசியமான, வேலை அந்நிரல்களின் பயன்பாட்டு ஆவணங்களைத் தமிழாக்குவது. தற்போதைய நிலையில் அதற்குத் தேவையான ஆள்வலி இல்லாததால் முழு தொழில்நுட்பக் கையேடுகளைத் தமிழாக்குவது மிகக் கடினம். அக்கையேடுகளின் சுருக்கங்களான man பக்கங்களைத் தமிழாக்கலாம். ஆனால் man பக்கங்களை விடச் சுருக்கமாக tldr பக்கங்கள்3 என உள்ளன. அவை ஒவ்வொரு கட்டளை பற்றியும் 4-5 எடுத்துக்காட்டுகள் காட்டி அதன் அடிப்படை பயன்பாட்டை விளக்குவன. இவற்றைத் தமிழாக்கினால் குறைந்த உழைப்பில் நிறைய கட்டளைகளை ஓரளவாது ஆவணப்படுத்திவிடலாம். tldr-pages தற்போது ஆங்கிலப் பக்கங்களை மட்டுமே கொண்டுள்ளது. அதில் தமிழ் உட்பட பிற மொழி பக்கங்களை ஏற்றும் முயற்சி நடந்துக்கொண்டிருக்கிறது4.
முடிவுரை
தமிழ் பாமரனுக்கு மட்டும் தான் என்ற எண்ணம் மாற வேண்டும். ஆங்கிலம் அறிந்தவர்-அறியாதவர், நிரலாக்கர்-பயனர் என்ற பிரிவினைகள் மறைய வேண்டும். இக்குறியோடு நம்மால் இயன்ற அனைத்தையும் செய்து தமிழ்த்தொண்டு புரிவோம்.
இக்கட்டுரை கணியம் இதழில் வெளியடப்பட்டுள்ளது. இதை எழுத ஊக்குவித்த சிரினிவாசனுக்கு எனது நன்றிகள்.
Image Credits
- tamil99-keyboard by Thamizhpparithi Maari, released under the Creative Commons Attribution-ShareAlike 4.0 International license
- proportional-versus-monospace-font by Garethlwalt, released under the Creative Commons Attribution 3.0 Unported license
Footnotes:
இக்கருத்தை மேலும் விளக்கமாக ஜெயபாண்டியன் கோட்டாளம் அவரது அறிவியல் தொழில்நுட்ப இலக்கியங்களைத் தமிழாக்குவதற்கான ஒரு கையேடு என்னும் நூலில் வழங்கியுள்ளார். மேலும் ஏறக்குறைய 14000 கலைச்சொற்களுக்கான தமிழாக்கங்களை அந்நூலில் அவர் வழங்கியுள்ளார். இந்நூலை என் கவனத்திற்குக் கொண்டுவந்த இரா. அசோகனுக்கு எனது நன்றி.
புழக்கதில் இல்லாதச் சொற்களை மீட்டெடுப்பது பற்றி அறிய பழைய ஆங்கிலத்தை மீட்டெடுக்க முயலும் Anglish Moot திட்டத்தைக் காண்க.
tldr பக்கங்கள் வலைத்தளம்: https://tldr.sh/
GitHub tldr-pages களஞ்சியத்தில் உரையாடலைக் காண்க: Support for multiple human languages