கணினியில் தமிழ்

கணினியில் தமிழ்

Published by Arun Isaac on

Tags: தமிழ்

கணினிக்கலையில் தமிழ் பயன்பாட்டை அதிகரிக்க தேவையான முயற்சிகள் பற்றி சிலக் கருத்துகள்.

தமிழ் 99 மற்றும் qwerty அமைப்புடைய விசைப்பலகை

Figure 1: தமிழ் 99 விசைப்பலகை

கணினிக்கலையில் தமிழ் பயன்பாட்டை அதிகரிக்க நான் தமிழ்க் கணினிக் குழுவை நிறுவினேன். அதன் முதன்மையான பணி Translation Project என்னும் கட்டற்ற மென்பொருள் மொழிபெயர்ப்புத் தளத்தில் தமிழ்க் குழுவை நடத்துவதே. Translation Project யில் பல GNU கட்டளை நிரல்கள் மொழிபெயர்ப்பிற்காக வழங்கப்பட்டிருக்கின்றன. பெரும்பாலும் தமிழாக்க முயற்சிகள் வலை, கைபேசி மென்பொருள் என அதிகமாகப் பயன்படுத்தப்படும் மென்பொருட்களுக்குப் பெரியுதி அளிக்கின்றன. தமிழ் நிரலாக்கரும் கணினி வல்லுநரும் ஆங்கிலத்தையே பயன்படுத்துகின்றனர். இந்நிலையை மாற்ற நிரலாக்கர் அதிகம் பயன்படுத்தும் கட்டளை நிரல்களைத் தமிழாக்க வேண்டும். இதற்குத் தமிழ்க் கணினி சொல்வளத்தைத் தரப்படுத்த வேண்டும். இவ்விரண்டையும் நடைமுறைபடுத்துவதே தமிழ்க் கணினிக் குழுவின் நோக்கம்.

தமிழ்க் கணினிக்குள் புகுவதற்கு இடையூறாகயிருக்கும் சிலவற்றைப் பற்றியும் அவ்விடையூறுகளைக் கடக்கும் முயற்சிகள் பற்றியும் கீழ் காணலாம்.

கலைச்சொற்கள் நுண்பொருள் தர வேண்டும்

கலைச்சொற்கள் பொதுச் சொற்கள் போன்றில்லாமல் துல்லியமான நுண்பொருள் தருவனவாயிருக்க வேண்டும்1. ஆங்கில கலைச்சொற்கள் இத்தகையவை. தமிழில் கலைச்சொற்கள் பல உருவாக்கப்பட்டுள்ளனவாயினும் அவைப் போதிய அளவு புழக்கத்தில் இல்லாததால், நுண்பொருள் எய்தாமல் பேரளவு அங்கீகாரம் பெறாமல் இருக்கின்றன. எடுத்துக்காட்டிற்கு ஆங்கிலத்தில் library, module, package என்னும் சொற்களைக் கருதுக. இச்சொற்கள் ஏறக்குறைய ஒரே பொருள் தந்தாலும், அவை இடம்பெற்றுள்ள இடத்திற்கேற்ப அவற்றின் பொருள்களில் நுண்மையான வேறுபாடு உண்டு. இச்சொற்கள் பலக் காலம் புழக்கத்தில் இருந்துள்ளதால் அவற்றின் பொருளில் கருத்தொற்றுமை உள்ளது. இச்சொற்களை எவரும் தவறாகப் புரிந்துக் கொள்ளமாட்டார். இச்சொற்களை நிரலகம், நிரல்கூறு, நிரல்தொகுப்பு என்று நாம் தமிழாக்கலாம். ஆனால் இத்தமிழாக்கங்கள் புழக்கத்திற்குள் புகாததால் அவற்றின் பொருள் மனத்திற்கு உடனே வெளிப்படுவதில்லை; மேலும் இத்தமிழாக்கங்களைப் பார்க்கிற ஒவ்வொருவரும் ஒவ்வொரு பொருள் காணும் வாய்ப்புள்ளது — அவற்றின் பொருளில் போதிய கருத்தொற்றுமை இல்லை.

ஆங்கிலத்தில் ஒரேச் சொல் கலைப்பொருளிலும் பொதுப்பொருளிலும் இடம்பெற்று குழம்பாமலிருக்க பல முறை கிரேக்க மொழிச் சொற்களையும் இலத்தீன் மொழிச் சொற்களையும் கடன் வாங்குகிறார்கள். இவ்வேற்றுமொழிச் சொற்களுக்கு ஆங்கிலத்தில் பிறப் பொதுப் பொருள் இல்லாததால் அவைத் தனித்து நின்று நுண்பொருள் தர முடிகிறது. இவ்வாறு கடன்சொற்கள் தேவையா என்பது ஐயப்பாட்டுக்குரியதாயினும் அவ்வாறே சொற்கள் வேண்டுமாயின் நாம் கடன் வாங்குவதற்குப் பதிலாகப் புழக்கத்திலிருந்து விலகிய பழந்தமிழ்ச் சொற்களை மீட்டெடுத்துப் புதிய நுண்பொருளுடன் பயன்படுத்தலாம்2.

ஓரகல எழுத்துருக்கள்

ஒர் எழுத்துருவில் அனைத்து எழுத்துகளும் ஒரே அகலமுடையதாய் அமைந்தால் அவ்வெழுத்துரு ஓரகல எழுத்துரு (monospace font) எனப்படும். எடுத்துக்காட்டாக ஆங்கிலத்தில் i என்னும் எழுத்து மிக மெலிந்தது; m என்னும் எழுத்து மிக அகலமானது; ஆயினும் ஓரகல எழுத்துருக்களில் அவை ஒரே அகலத்துடன் இருக்குமாறு கொஞ்சம் திரித்து எழுதப்பட்டிருக்கும். அனைத்து எழுத்துக்களும் ஒரே அகலமுடையதாய் இருந்தால் தான் கட்டளை நிரல்களின் வெளியீடு வரிக்கு வரி ஒருசீராக ஒன்றின் கீழ் ஒன்றாக நேர்படுத்தப்பட்டுத் தோன்றும். எனவே இவ்வெழுத்துருகள் கணினி முனையங்களில் பரவலாகப் பயன்படுத்தப்படுகின்றன. எனக்குத் தெரிந்தவரை தமிழ் ஓரகல எழுத்துருக்கள் இல்லை. தமிழ் எழுத்துகள் மிகுந்த அகல வேறுபாடு உடையவை. எடுத்துக்காட்டிற்கு, "க" போன்ற அகர எழுத்துகள் மிக மெலிந்தவை; "கோ" போன்ற ஓகார எழுத்துகள் மிக அகலமானவை. இத்தகைய அகல வேறுபாடுகளுடைய தமிழ் எழுத்துகளுக்கு ஓரகல எழுத்துரு உருவாக்குவதெப்படி? இதைப் பற்றி உங்களுக்கு எண்ணம் இருந்தால் கூறுங்கள்.

இரு வரிகள் -- முதல் வரியில் proportional எழுத்துருவில் "Proportional" என்னும் சொல்லும், இரண்டாம் வரியில் monospace எழுத்துருவில் "monospace" என்னும் சொல்லும்

Figure 2: Proportional எழுத்துருவும் Monospace எழுத்துருவும்

cal என்னும் நாட்காட்டி நிரலின் வெளியீட்டை ஆங்கிலத்திலும் தமிழிலும் கீழ் காண்க. ஆங்கில வெளியீடு ஓரகல எழுத்துருகளைப் பயன்படுத்துவதால் பத்திகள் நேர்படுத்தப்பட்டுத் தோன்றுகின்றன. தழிழிலோ ஓரகல எழுத்துருகள் இல்லாததால் கிழமைப் பெயர்கள் சற்று பெயர்ந்திருப்பதைக் காண்க.

    February 2019   
Su Mo Tu We Th Fr Sa
                1  2
 3  4  5  6  7  8  9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28      
       பிப்ரவரி      
        2019        
ஞா தி செ பு வி வெ  ச
                1  2
 3  4  5  6  7  8  9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28      

மென்பொருள் கையேடுகள்

கணினி நிரல்களைத் தமிழாக்குவதோடு தமிழாக்கப் பணி முடிந்துவிடாது. அதை விடக் கடினமான, ஆனால் அவசியமான, வேலை அந்நிரல்களின் பயன்பாட்டு ஆவணங்களைத் தமிழாக்குவது. தற்போதைய நிலையில் அதற்குத் தேவையான ஆள்வலி இல்லாததால் முழு தொழில்நுட்பக் கையேடுகளைத் தமிழாக்குவது மிகக் கடினம். அக்கையேடுகளின் சுருக்கங்களான man பக்கங்களைத் தமிழாக்கலாம். ஆனால் man பக்கங்களை விடச் சுருக்கமாக tldr பக்கங்கள்3 என உள்ளன. அவை ஒவ்வொரு கட்டளை பற்றியும் 4-5 எடுத்துக்காட்டுகள் காட்டி அதன் அடிப்படை பயன்பாட்டை விளக்குவன. இவற்றைத் தமிழாக்கினால் குறைந்த உழைப்பில் நிறைய கட்டளைகளை ஓரளவாது ஆவணப்படுத்திவிடலாம். tldr-pages தற்போது ஆங்கிலப் பக்கங்களை மட்டுமே கொண்டுள்ளது. அதில் தமிழ் உட்பட பிற மொழி பக்கங்களை ஏற்றும் முயற்சி நடந்துக்கொண்டிருக்கிறது4.

முடிவுரை

தமிழ் பாமரனுக்கு மட்டும் தான் என்ற எண்ணம் மாற வேண்டும். ஆங்கிலம் அறிந்தவர்-அறியாதவர், நிரலாக்கர்-பயனர் என்ற பிரிவினைகள் மறைய வேண்டும். இக்குறியோடு நம்மால் இயன்ற அனைத்தையும் செய்து தமிழ்த்தொண்டு புரிவோம்.

இக்கட்டுரை கணியம் இதழில் வெளியடப்பட்டுள்ளது. இதை எழுத ஊக்குவித்த சிரினிவாசனுக்கு எனது நன்றிகள்.

Footnotes:

1

இக்கருத்தை மேலும் விளக்கமாக ஜெயபாண்டியன் கோட்டாளம் அவரது அறிவியல் தொழில்நுட்ப இலக்கியங்களைத் தமிழாக்குவதற்கான ஒரு கையேடு என்னும் நூலில் வழங்கியுள்ளார். மேலும் ஏறக்குறைய 14000 கலைச்சொற்களுக்கான தமிழாக்கங்களை அந்நூலில் அவர் வழங்கியுள்ளார். இந்நூலை என் கவனத்திற்குக் கொண்டுவந்த இரா. அசோகனுக்கு எனது நன்றி.

2

புழக்கதில் இல்லாதச் சொற்களை மீட்டெடுப்பது பற்றி அறிய பழைய ஆங்கிலத்தை மீட்டெடுக்க முயலும் Anglish Moot திட்டத்தைக் காண்க.

3

tldr பக்கங்கள் வலைத்தளம்: https://tldr.sh/

4

GitHub tldr-pages களஞ்சியத்தில் உரையாடலைக் காண்க: Support for multiple human languages