Jump to content

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும்


Recommended Posts

  • கருத்துக்கள உறவுகள்

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 24. இயல்மொழி ஆய்வு கருவித் தொடரி

September 28, 2018

இயல்மொழி ஆய்வில் எந்தவொரு வேலையை நிறைவேற்றவும் பல பணிகளை ஒன்றன்பின் ஒன்றாகச் செயல்படுத்த வேண்டும். எந்தவொரு சிறிய வேலைக்குக் கூட பெரும்பாலும் கீழ்க்கண்ட பணிகள் இன்றியமையாதவை:

  • வாக்கியங்களைப் பிரித்தல்
  • சொற்களைப் (நிறுத்தற் குறிகளையும் சேர்த்து) பிரித்தல்
  • சொல்வகைக் குறியீடு செய்தல்
  • அடிச்சொல்லையோ, தண்டுச்சொல்லையோ பிரித்தெடுத்தல்

இதன் பின்னர், தேவையைப் பொருத்து, சார்புநிலைப் பிரிப்பியை வைத்து கிளைப்பட வங்கிகளாகவோ அல்லது சொற்பகுப்பியல் ஆய்வியை வைத்து உருபன்களாகவோ பிரிப்போம். ஆக, குறைந்த பட்சம் ஐந்தாறு பணிகளை ஒன்றன்பின் ஒன்றாகச் செயல்படுத்துவோம்.

நிரல்கூறுகளாக இயல்மொழி ஆய்வு கருவித் தொடரி

நிரல்கூறுகளாக இயல்மொழி ஆய்வு கருவித் தொடரி

இவ்வாறு தொடர்ச்சியாகச் செய்யும் பணிகளுக்கு மென்பொருள் ஒரே திரளாக இல்லாமல் தனித்தனியாக பராமரிக்கக் கூடிய நிரல்கூறுகளாக (modular) இருப்பது நல்லது. மேலும், பிரச்சினை வந்தால் ஒவ்வொரு நிரல்கூற்றின் உள்ளீட்டையும், வெளியீட்டையும் தனித்தனியாக நம்மால் ஆய்வு செய்ய இயல வேண்டும். இதைத்தான் இயல்மொழி ஆய்வு கருவித் தொடரி (tool chain) அல்லது குழாய்த்தொடர் (pipeline) என்று சொல்கிறோம்.

அதாவது, இயல்மொழி ஆய்வில் ஒரு குழாய்த் தொடர் என்பது தற்சார்புடைய நிரல்கூறுகளின் சங்கிலி ஆகும். ஒவ்வொன்றும் அதற்கு முன்னதாக உள்ள நிரல்கூறின் வெளியீட்டை எடுத்து தன்னுடைய செய்முறையை செய்து அடுத்த நிரல்கூறுக்கு அனுப்புகிறது.

எடுத்துக்காட்டாக, பைதானில் எழுதப்பட்ட இயல்மொழி கருவித் தொகுப்பில் (NLTK) அடிப்படைக் கருவிகள் உள்ளன. இந்தக் கருவிகளை வைத்து உங்கள் வேலைக்குத் தகுந்தவாறு நீங்கள் ஒரு கருவித் தொடரியை அமைத்துக் கொள்ளலாம். ஏனெனில் ஒவ்வொரு நிரல் கூறும் வெவ்வேறு வழிமுறைகளைப் பயன்படுத்தி நிறைவேற்றப்படலாம், மேலும் கருவித் தொடரியின் மற்ற பகுதிகளை பாதிக்காமல் ஒரு வினைச்சரத்தை மாற்றலாம்.

தற்பொழுது கிடைக்கும் இயல்மொழி ஆய்வுக் கருவிகள்

நாம் முன்பு கூறியது போல, தமிழுக்கான கருவிகள் பெரும்பாலும் கிடைப்பதில்லை. செயல் விளக்கத்துக்காக சில கருவிகள் இணையதளத்தில் செயலியாக வெளியிடப்பட்டுள்ளன. பொதுவாக இவற்றில் ஒரு சொல்லை உள்ளிட்டு, வேலை செய்கிறதா என்று பார்க்க முடியும், அவ்வளவுதான். வேறு சில கருவிகள் பதிவிறக்கமாக அல்லது எழுதிக் கேட்டால் கிடைக்கக்கூடும். அப்படிக் கிடைத்தாலும் இவை வரைபடப் பயனர் இடைமுகம் கொண்டவை. ஒரு நேரத்தில் சிறிய அளவிலான சொற்களை மட்டுமே உள்ளிட முடியும். இவற்றையெல்லாம் விட மிக முக்கியமாக, தனித்தனியாகத்தான் வேலை செய்யும். நாம் மேலே விவரித்தபடி கருவித் தொடரியாக இணைக்க முடியாது.

இரைச்சலை அகற்றல் (Noise removal)

நீங்கள் பலவீனமான ஒலியளவு கொண்ட வானொலி அலைவரிசையைக் கேட்க முயல்கிறீர்கள் என்று வைத்துக்கொள்வோம். இரைச்சலைக் குறைத்தால்தான் சமிக்ஞை தெளிவாக வந்து சேரும். தேவையான ஒலியை நன்றாகக் கேட்க முடியும். அதே போலவே உரையிலுள்ள உட்பொருளைப் பிரித்தெடுக்க இரைச்சலைக் குறைக்க வேண்டும்.

இரைச்சல் அகற்றுவதற்கான ஒரு பொது அணுகுமுறை இரைச்சல் நிறைந்த சொற்குறிகளின் ஒரு பட்டியலைத் தயார் செய்வது. பின்னர் இந்த சொற்குறிகளை ஒன்றொன்றாக உரை முழுவதும் தேடி நீக்குதல். இணையத்திலும், சமூக ஊடகங்களிலும் எடுத்த உரைகளில் இணையத்தள முகவரிகள் (URLs), கொத்துக்குறிகள் (hashtags), வேற்று மொழிச் சொற்கள் போன்றவை இருக்கலாம். அஃகுப்பெயர்களுக்கும் (acronyms) சுருக்கங்களுக்கும் பதிலாக அவற்றின் முழு வடிவங்களை மாற்றி வைக்க வேண்டும். இம்மாதிரி சிறப்பு வடிவங்களைக் கையாளும் போது மற்றொரு அணுகுமுறை தேடுகுறித்தொடர்களைப் (regex) பயன்படுத்துவது.

நாம் அடிக்கடி பயன்படுத்தும் இடைச்சொற்களில் (Stopwords) பொருள் குறைவாக இருப்பதால் இவை ஒரு உரையை மற்ற உரைகளிலிருந்து வேறுபடுத்த உதவுவதில்லை. எடுத்துக்காட்டாக ஒரு, என்று, மற்றும், இந்த, இது, என்ற, கொண்டு, என்பது, பல, ஆகும்…போன்ற சொற்கள். நாம் சில நேரங்களில், மேலும் செயலாக்கும் முன், உரையிலிருந்து இவற்றை வடிகட்டி எடுத்துவிட வேண்டியுள்ளது. நான் இந்த 125 சொற்கள் கொண்ட பட்டியலை TXM சொற் களஞ்சியத்தில் முதல் 300 சொற்குறிகளிலிருந்து (சொற்களும் நிறுத்தற்குறிகளும்) தயாரித்தேன்.

நாம் ஒரு உரையை ஆய்வு செய்யும் போது, வேறெந்த வேலையும் செய்யும் முன்னர்  இவற்றைச் செய்ய வேண்டும். ஆகவே இவற்றைச் செயல்படுத்தல் முன்னோடிகள் (pre-processing) என்றும் சொல்கிறோம்.

வாக்கியங்களைப் பிரித்தல் (Sentence segmentation)

வாக்கியங்களின் எல்லைகளைக் கண்டறிதல், அதாவது பத்திகளாக உள்ள உரையிலிருந்து வாக்கியங்களாகப் பிரிக்கும் செயல். இந்தப் பணியை மேலோட்டமாகப் பார்த்தால் மிக எளிதாகத் தெரிகிறது. ஆனால் நாம் புள்ளியை வாக்கிய முடிவைக் காட்ட நிறுத்தற் குறியாகவும் பயன்படுத்துகிறோம், சுருக்கங்களுக்கும், பதின்ம எண்களுக்கும் பயன்படுத்துகிறோம். ஆகவே புள்ளி வந்தால் வாக்கியம் முடிந்துவிட்டது என்று கூற முடியாது.

ஆங்கில வாக்கியப் பிரிப்பான்களால் தமிழின் தனிப்பட்ட அம்சங்களை சரியாகக் கையாள இயலவில்லை. எ.கா.,பெயர் முதலெழுத்துகள், முன்னொட்டுகள், சுருக்கக் குறியீடுகள் ஆகியவை. ஆகவே இதற்காக நான் NLTK Punkt tokenizer-ஐத் தமிழுக்குத் தயார் செய்துள்ளேன். இது இயந்திரக் கற்றல் (machine learning) மூலம் சாதாரண சொல்வங்கி (raw text corpus) வைத்து செய்யப்பட்டது. 

சொற்களையும் நிறுத்தற் குறிகளையும் பிரித்தல் (Tokenization)

ஒரு வாக்கியத்தில் சொற்களும் நிறுத்தற் குறிகளும் இருக்கும். இவற்றைப் பொதுவாக சொற்குறிகள் (Tokens) என்று சொல்கிறோம். இடைவெளிகளை வைத்து இவற்றைப் பிரிக்கலாம். ஆனால் முற்றுப் புள்ளி முக்கால் புள்ளிகளுக்கு முன் இடைவெளி இல்லாமலும் இருக்கலாம். ‘ச.ம.உ.’ என்பதைப் புள்ளிகளில் பிரிக்காமல், ஒரே சொல்லாக எடுக்க வேண்டும். 

மேலும் இடைவெளி இருப்பதால் “தென் சென்னை” இரண்டு சொற்களா அல்லது இரண்டும் சேர்ந்து ஒரு இடத்தைக் குறிப்பதால் ஒரே சொல்லா? ‘சட்ட மன்ற உறுப்பினர்’ என்பதையும் இடைவெளிகளை வைத்துத் தனித்தனி சொற்களாகப் பிரிக்காமல், ஒரே சொல்லாக எடுக்க வேண்டும். ஆனால் இவற்றை சொற்குறிகள் பிரிக்கும்போது செய்ய இயலாவிட்டால், பின்னர் பெயரிட்ட உருபொருள் பிரித்தெடுக்கும்போது செய்யலாம்.

இதன் பின்னர், செய்யும் வேலையைப் பொருத்து, சொல்வகைக் குறியீடு செய்தல், அடிச்சொல்லையோ, தண்டுச்சொல்லையோ பிரித்தெடுத்தல் போன்ற செயல்முறைகளைக் கருவித் தொடரியில் இணைக்கலாம்.

வியட்நாமிய இயல்மொழி ஆய்வு குழாய்த்தொடர்

வியட்நாமிய இயல்மொழி ஆய்வு குழாய்த்தொடர்

நடைமுறை எடுத்துக்காட்டு: வியட்நாமிய இயல்மொழி ஆய்வு குழாய்த்தொடர்

சொற்களைப் பிரித்தெடுத்தல், சொல்வகைக் குறியீடு, பெயரிட்ட உருபொருள் அடையாளம் காணுதல் மற்றும் சார்புநிலை பிரிப்பி ஆகிய முக்கியப் பணிகளில் பயனர்களுக்கு உதவுவதற்கும், அடுத்து வரும் செய்முறைகளின் ஆய்வாளர்கள் மற்றும் கருவி நிரலாளர்களுக்கு ஆதரவாக இருக்கவும் ஆங்கிலத்தில் ஸ்டான்ஃபோர்ட் CoreNLP கருவித்தொகுப்பு போன்ற ஒரு இயல்மொழி குழாய்த்தொடரை வியட்நாமிய மொழிக்கு உருவாக்குவதற்கான தேவை உள்ளது என்று முடிவு செய்தனர். வியட்நாமிய மொழிக்கு இயல்மொழி ஆய்வுக் குறியீடு செய்யும் இந்த VnCoreNLP என்ற குழாய்த்தொடர் திட்டத்தைத் தொடங்கினர்.இது ஜாவா (Java) மொழியில் எழுதப்பட்டுள்ளது.

இந்த நிரல் தொகுப்பை படைப்பாக்கப் பொதுமங்கள் அனுமதியில் பகிர்ந்துள்ளனர். வணிகம் அல்லாத வேலைகளுக்கு இலவசமாகப் பயன்படுத்தலாம். வியட்நாமிய மொழிக்கு இதுவரை உள்ள கருவிகளைவிட மிகவும் துல்லியமாக வேலை செய்கிறது மற்றும் வேகமாக உள்ளது. எனவே இதை பெரிய அளவிலான தரவுகளைக் கையாளுவதற்குப் பயன்படுத்தலாம். எளிதாகப் பயன்படுத்த முடியும். பயனர்கள் வெளிப்புற சார்புகளை நிறுவ வேண்டியதில்லை. கட்டளை வரி அல்லது ஜாவா (Java) பயன்பாட்டு நிரலாக்க இடைமுகத்திலிருந்து (API) இயக்க முடியும்.

நடைமுறை எடுத்துக்காட்டு: தாய்லாந்து இயல்மொழி ஆய்வு கருவித்தொகுப்பு

NLTK என்பது இயல்மொழி ஆய்வுக்கு பைதான் மொழியில் எழுதப்பட்டது. இது ஒருங்குறியை ஆதரிப்பதால் தமிழுக்கும் ஓரளவு பயன்படுத்த முடியும். இதிலுள்ள தேடுகுறித்தொடர் நிரலகம் ஒருங்குறியை ஆதரிக்கவில்லை. ஆகவே தமிழில் பெயரிட்ட உருபொருள் அடையாளம் காணப் பயன்படாது. இந்த NLTK போல TLTK என்று தாய்லாந்து இயல்மொழி ஆய்வு கருவித்தொகுப்பு தயாரித்துள்ளார்கள். இதில் வாக்கியத்திலிருந்து சொற்களைப் பிரித்தெடுத்தல், சொல்வகைக் குறியீடு செய்தல், பெயரிட்ட உருபொருள் அடையாளம் காணுதல் போன்ற பல வேலைகளுக்கு கருவிகள் உள்ளன.

————-

இத்தொடரில் அடுத்த கட்டுரை: இயந்திர மொழிபெயர்ப்பு

விதி சார்ந்த இயந்திர மொழிபெயர்ப்பு. இயந்திர மொழிபெயர்ப்பு செய்முறை வரிசை. புள்ளிவிவர இயந்திர மொழிபெயர்ப்பு. கலப்பு இயந்திர மொழிபெயர்ப்பு. நரம்பியல் இயந்திர மொழிபெயர்ப்பு. வரைபடச் செயலகம் (GPU) சில்லு உள்ள கணினி தேவை. இயந்திர மொழிபெயர்ப்பு அணுகல்களில் நல்லதும் கெட்டதும். இருமொழித் தொகுப்புகள்.

 

http://www.kaniyam.com/natural-language-processing-toolchain/

 

Link to comment
Share on other sites

  • கருத்துக்கள உறவுகள்

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 25. தமிழ் – ஆங்கிலம் இயந்திர மொழிபெயர்ப்பு

October 4, 2018

இயந்திர மொழிபெயர்ப்புக்கு மூன்று வகையான அணுகல்கள் உள்ளன. இவை விதி சார்ந்த இயந்திர மொழிபெயர்ப்பு (Rule-Based Machine Translation – RBMT), புள்ளிவிவர இயந்திர மொழிபெயர்ப்பு (Statistical Machine Translation – SMT) மற்றும் கலப்பு (Hybrid) இயந்திர மொழிபெயர்ப்பு.

விதி சார்ந்த இயந்திர மொழிபெயர்ப்பு 

விதி சார்ந்த இயந்திர மொழிபெயர்ப்பில் இந்த இரண்டு வகைகள் உண்டு. மேலோட்டமான மொழிமாற்றம் (Shallow transfer) மற்றும் ஆழ்ந்த மொழிமாற்றம் (Deep transfer). அபெர்டியம் (Apertium) ஒரு கட்டற்ற திறந்த மூல விதி சார்ந்த இயந்திர மொழிபெயர்ப்பு தளம் ஆகும். இது குனு பொது உரிமத்தின் கீழ் வெளியிடப்பட்டுள்ளது. இது ஒரு மேலோட்டமான-மொழிமாற்ற இயந்திர மொழிபெயர்ப்பு அமைப்பு ஆகும். தற்பொழுது, அபெர்டியம், இந்தி – உருது சேர்த்து, 40 நிலையான மொழி இணைகளை வெளியிட்டுள்ளது,

இது இந்தி – உருது போன்ற நெருக்கமாக தொடர்புடைய மொழிகளுக்கு இடையில் மொழிபெயர்க்கவே வடிவமைக்கப்பட்டது, இருப்பினும் இது சமீபத்தில் மாறுபட்ட மொழி இணைகளுக்கும் விரிவாக்கப்பட்டுள்ளது. ஒரு புதிய இயந்திர மொழிபெயர்ப்பு அமைப்பு உருவாக்க, XML வடிவங்களில் மொழி தொடர்பான தரவுகளை (அகராதிகள், விதிகள்) மட்டும் உருவாக்க வேண்டும்.

தமிழ் ஒரு கட்டற்ற சொல் வரிசை மொழி. ஆகவே தமிழிலிருந்து ஆங்கிலத்துக்கு மொழிபெயர்ப்பதில் துல்லியம் குறைவு. ஆங்கிலத்திலிருந்து தமிழுக்கு மொழிபெயர்ப்பதில் துல்லியம் அதிகம். 

மூல மொழியில் ஒரு சொற்பகுப்பியல் ஆய்வியும் இலக்கு மொழியில் ஒரு சொற்பகுப்பியல் உருவாக்கியும் அபெர்டியம் இயந்திர மொழிபெயர்ப்பை தமிழுக்கு செயற்படுத்த முக்கியமானவை. ஹைதராபாத் பல்கலையில் பரமேஸ்வரி இவற்றை உருவாக்க செய்த முயற்சியின் முடிவுகள் இங்கே. சுமார் 68 ஆயிரம் சொற்கள் கொண்ட அகராதியைப் பயன்படுத்தி இருவேறு உரைத்தொகுப்புகளில் 85% சொற்களை மொழிபெயர்ப்பு செய்ய முடிந்ததாம்.

இயந்திர மொழிபெயர்ப்பு செய்முறை வரிசை

விதி சார்ந்த இயந்திர மொழிபெயர்ப்புக்கு கீழ்க்கண்ட செய்முறை வரிசையைப் பின்பற்றுகிறோம்:

  1. பகுப்பாய்வு: பகுப்பாய்வின் போது, உள்ளீட்டைப் பாகுபடுத்த மூல மொழியில் செயலிகளும், இலக்கணம் மற்றும் அகராதியும் தேவை.
  2. மொழிமாற்றம்: 
    1. வாக்கியக் கட்டமைப்பு மாற்றத்திற்கு ஒரு இலக்கணம் தேவை.
    2. சொற்களை மொழிமாற்றம் செய்ய இருமொழி அகராதி தேவை.
  3. உருவாக்கம்: கடைசியாக, இலக்கு மொழியில் உருவாக்க இலக்கணமும், அகராதியும் இறுதி மொழிபெயர்ப்புக்குத் தேவை.
தமிழ் - ஆங்கிலம் இயந்திர மொழிபெயர்ப்பு

தமிழ் – ஆங்கிலம் இயந்திர மொழிபெயர்ப்பு

புள்ளிவிவர இயந்திர மொழிபெயர்ப்பு 

மருத்துவ, நிதி அல்லது தொழில்நுட்பம் போன்ற குறிப்பிட்ட துறைக்கான பயிற்சி தரவுகளைப் பயன்படுத்தி பயிற்றுவித்தால், புள்ளிவிவர இயந்திர மொழிபெயர்ப்பு இயந்திரம் உயர் வெளியீடு தரத்தை நிரூபித்துள்ளது. 

ஒரு குறிப்பிட்ட துறைக்கு குறைந்த பட்சம் இரண்டு மில்லியன் சொற்கள் தேவை என்று பொதுவாகக் கருதப்பட்டாலும், அதைவிடக் குறைந்த தரவுகளை வைத்தே ஏற்றுக்கொள்ளத்தக்க தரத்தை அடைய முடியும் என்று சொல்கிறார்கள். நல்ல தரமான சீரமைக்கப்பட்ட இருமொழித் தொகுப்புகள் உருவாக்க செலவு அதிகம். எனினும் உருவாக்கிய பின்னர் அது நிறுவனத்துக்கு மதிப்பு மிக்க சொத்தாகும். 

புள்ளியியல் இயந்திர மொழிபெயர்ப்புக்கு மோசஸ் (Moses) ஒரு திறந்த மூல மென்பொருள். ஒரு மூல மொழியிலிருந்து ஒரு இலக்கு மொழிக்கு உரைகளை மொழிபெயர்ப்பு செய்ய புள்ளிவிவர மாதிரிகளை பயிற்றுவிக்க பயன்படுகிறது. பயிற்றுவித்த இந்த மாதிரிகளை வைத்து மூல மொழி உரைகளை மொழிபெயர்க்கலாம். பயிற்சி கொடுக்க இரண்டு மொழிகளில் வாக்கியங்கள் சீரமைக்கப்பட்ட ஒரு இணை உரைத்தொகுப்பு வேண்டும். 

இது LGPL உரிமத்தின் கீழ் வெளியீடு செய்யப்பட்டுள்ளது. விண்டோஸ், மேக் மற்றும் லினக்ஸ் கணினிகளில் ஓடும். ஐரோப்பிய ஒன்றிய நிதியுதவியில் உருவாக்கப்பட்டது.

கலப்பு இயந்திர மொழிபெயர்ப்பு

கலப்பு (Hybrid) இயந்திர மொழிபெயர்ப்பில் பொதுவாக RBMT மற்றும் SMT இரண்டும் உண்டு. இதை SYSTRAN போன்ற தனியுரிம நிறுவனங்களே பெரும்பாலும் பயன்படுத்துகின்றன.

நரம்பியல் இயந்திர மொழிபெயர்ப்பு 

நரம்பியல் இயந்திர மொழிபெயர்ப்பு (Neural Machine Translation – NMT) என்பது ஒரு பெரிய செயற்கை நரம்பியல் பிணையத்தைப் பயன்படுத்தி அடுத்து வரும் சொற்களின் தொடர்ச்சியைக் கணிக்கிறது. இது பொதுவாக ஒருங்கிணைந்த முன்மாதிரியை வைத்து முழு வாக்கியங்களை உருவாக்க முயற்சிக்கிறது. நரம்பியல் இயந்திர மொழிபெயர்ப்பு என்பது புள்ளிவிவர இயந்திர மொழிபெயர்ப்பில் (SMT) வழக்கமாகச் செய்வதைவிடத் தலைகீழான மாற்றம் அல்ல. ஆகவே இதுவும் புள்ளிவிவர இயந்திர மொழிபெயர்ப்பில் ஒரு வகைதான். ஆனால் மிகவும் மேம்படுத்தப்பட்ட வகை.

இதில் மொழி மாதிரியும், மொழிபெயர்ப்பு மாதிரியும், மறு சீரமைப்பு மாதிரியும் தனித்தனியாகக் கிடையாது. ஆனால் அடுத்து வரும் ஒவ்வொரு சொல்லாகக் கணிக்கும் ஒரு தனி வரிசைமுறை மாதிரி மட்டும் உண்டு. முழு மூல வாக்கியத்தையும் மற்றும் ஏற்கனவே தயாரிக்கப்பட்ட இலக்கு சொல் வரிசைமுறையையும் வைத்து இந்த வரிசைக் கணிப்பு நிர்ணயிக்கப்படுகிறது. ஆழமான NMT இதனுடைய நீட்டிப்பு ஆகும். ஒரே ஒரு அடுக்குக்குப் பதிலாக இது பல நரம்பியல் பிணைப்பு அடுக்குகளை செயல்படுத்துகிறது. இதை ஆழ்ந்த கற்றல் (Deep Learning) என்றும் சொல்கிறார்கள்.

இயந்திர மொழிபெயர்ப்பில் நரம்பியல் பிணையங்களைப் பயன்படுத்துவதற்கான முதல் அறிவியல் அறிக்கை 2014 இல் வெளிவந்தது. முதன்முதலாக 2015 ஆம் ஆண்டில், பொது இயந்திர மொழிபெயர்ப்பு போட்டியில் NMT அமைப்பு இருந்தது. அடுத்த ஆண்டு வெற்றியாளர்களில் 90% NMT பயன்படுத்தியவர்கள். 2016 க்குள், சிறந்த இயந்திர மொழிபெயர்ப்பு அமைப்புகளில் பெரும்பாலானவை NMT அமைப்புகள்தான். கூகிள், மைக்ரோசாப்ட் மற்றும் யாண்டெக்ஸ் மொழிபெயர்ப்பு சேவைகள் இப்போது NMT ஐயே பயன்படுத்துகின்றன.

திறந்த மூல நரம்பியல் இயந்திர மொழிபெயர்ப்பு அமைப்பு, OpenNMT, ஹார்வர்ட் இயல்மொழி ஆய்வுக் குழுவால் வெளியிடப்பட்டது. OpenNMT என்பது நரம்பியல் இயந்திர மொழிபெயர்ப்புக்கான திறந்த மூல முன்முயற்சியாகும். இது அண்மைய ஆழ்ந்த கற்றல் தொழில்நுட்பத்தையே பயன்படுத்துகிறது. இது தற்போது 3 முக்கிய செயலாக்கங்கள் கொண்டது: லுவா (Lua), பைதான் – பைடார்ச்(PyTorch), பைதான் – டென்சார்ஃப்ளோ(TensorFlow). இவை மூன்றுமே தற்போது பராமரிக்கப்படுகின்றன. மூல நிரல்கள் கிட்ஹப்பில் பகிரப்பட்டுள்ளன. OpenNMT MIT உரிமத்தின் கீழ் வெளியிடப்பட்டுள்ளது.

பங்களிப்போர் எண்ணிக்கையையும், பயனர் ஆர்வத்தைக் குறிக்கும் விண்மீன் குறியீடுகளையும் பார்த்தால் கூகிளின் டென்சார்ஃப்ளோதான் (TensorFlow) சவாலில்லாமல் முதலிடத்திலுள்ளது. இது அபாச்சி 2.0 திறந்த மூல உரிமத்தின் கீழ் வெளியிடப்பட்டுள்ளது. இது பைதான் மொழியில் எழுதப்பட்டுள்ளது. ஆனால் கருநிரல் C ++ மற்றும் CUDA வில் எழுதப்பட்டுள்ளது. CUDA என்பது வரைபடச் செயலகம் (GPU) நிரலாக்கம் செய்ய என்விடியா (Nvidia) மொழி.

OpenNMT மென்பொருளை பயன்படுத்தி பயிற்றுவிக்க உங்களுக்கு இரண்டு கோப்புகள்தான் தேவை – மூல மொழிக்கோப்பு மற்றும் இலக்குமொழிக்கோப்பு. ஒவ்வொரு வரியிலும் ஒரு வாக்கியம்தான் இருக்க வேண்டும். சொற்களுக்கு இடையில் இடைவெளி இருக்க வேண்டும். 

வரைபடச் செயலகம் (GPU) சில்லு உள்ள கணினி தேவை

OpenNMT நிரலைப் பயன்படுத்தி பயிற்றுவிக்க NVIDIA நிறுவனத்தால் தயாரிக்கப்பட்ட வரைபட செயலாக்கச் (GPU) சில்லு உள்ள கணினி தேவை. அதுவும் CUDA என்ற கருவித்தொகுதி மென்பொருள் ஓடக்கூடியதாக இருக்க வேண்டும். உங்கள் கணினியில் இவை உள்ளனவா என்று பார்க்க இங்கே செல்லவும். பெரிய அளவில் தரவைச் செயலாக்க வேண்டியிருப்பதால், பொதுவாக எந்த இயந்திர கற்றல் திட்டத்திற்கும் வரைபடச் செயலகம் சில்லு வைத்த கணினி தேவைப்படுகிறது.

இயந்திர மொழிபெயர்ப்பு அணுகல்களில் நல்லதும் கெட்டதும்

RBMT அமைப்புகள் மொழியின் மூன்று முக்கியமான குறைபாடுகளை எதிர்கொள்கின்றன:

1) ஒரு இயந்திரத்தைப் பொருத்தவரை மொழியின் உள்ளார்ந்த தெளிவின்மை. மனிதர்களைப் போல சொல்லின் பொருள் சார்ந்த உள்ளுணர்வு இயந்திரங்களுக்குக் கிடையாது.

2) விலக்கு அடிப்படையிலான இலக்கண அமைப்பு.

3) எப்போதும் விரிவாகிக்கொண்டிருக்கும் கலைச்சொற்கள் அகராதி.

NMT அணுகுமுறை மொழி கட்டமைப்பை நன்றாகக் கற்றுக் கொள்ளும், ஆனால் RBMT அல்லது SMT போல் நீண்ட சொல் பட்டியலை ஞாபகம் வைத்துக் கொள்வதில் அவ்வளவு சிறப்பாக இல்லை. சொற்களின் பட்டியலை RBMT  நன்றாகக் கையாளும், ஆனால் வாக்கிய அமைப்பு சரியாக வராது. SMT இவற்றுக்கு இடையில் உள்ளது. வாக்கியங்கள் சரளமாக வருவது போலிருக்கும், ஆனால் சில நேரங்களில் மொழிபெயர்ப்பு முற்றிலும் தவறானதாக இருக்கலாம்.

NMT பற்றிய சுவாரசியமான அம்சம் என்னவென்றால், PBSMT (சொற்றொடரை அடிப்படையாகக் கொண்ட SMT) யை விட இரைச்சல் மிகுந்த தரவுக்கு சகிப்புத்தன்மை அதிகம். பொதுவான NMT அமைப்புகளில் ஒரு குறிப்பிடத்தக்க பலவீனம் என்னவென்றால் மிகவும் அரிதான வார்த்தைகளை அவை சரியாக மொழிபெயர்ப்பதில்லை.

 

—————–

இத்தொடரில் அடுத்த கட்டுரை: சொற்பிழைத் திருத்தி

தமிழுக்குச் சொல்திருத்தியே தேவையில்லை என்றொரு கருத்து. உரையில் சொற்பிழை சரிபார்ப்பு பின்வரும் படிகளைக் கொண்டுள்ளது. வேட்பு சொற்கள். ஹன்ஸ்பெல் திறந்த மூல சொற்பிழைத் திருத்தி. தமிழுக்கு நான் உருவாக்கிய ஹன்ஸ்பெல் பின்னொட்டு விதிகள். லேங்குவேஜ் டூல் திறந்த மூல சொற்பிழைத் திருத்தி.

 

http://www.kaniyam.com/tamil-english-machine-translation/

 

Link to comment
Share on other sites

  • 2 weeks later...
  • கருத்துக்கள உறவுகள்

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 26. சொற்பிழைத் திருத்தி

October 15, 2018

தமிழுக்குச் சொல்திருத்தியே தேவையில்லை என்றொரு கருத்து

ஆங்கிலத்தில் உச்சரிப்பை வைத்து எழுத்துக்கோர்வை சொல்ல முடியாது. ஆகவே எழுத்துப்பிழைகள் நிகழ்வதற்கான சாத்தியங்கள் உள்ளன. தமிழிலோ எப்படி உச்சரிப்போ அப்படியே எழுதுகிறோம் (Phonetic language). ஆகவே தமிழுக்குச் சொல்திருத்தியே தேவையில்லை என்றொரு கருத்து நிலவுகிறது.  

ஆனால் மயங்கொலி என்று சொல்லப்படும் ல-ள-ழ, ண-ந-ன, ர-ற ஆகியவற்றில் எது சரி என்று தெரியாமல் நாம் தவறு செய்கிறோம். மேலும் ‘fat finger’ என்று ஆங்கிலத்தில் கூறப்படும் தவறான விசையை அழுத்துவதால் ஏற்படும் தட்டச்சுப்  பிழைகளையும் பார்க்கிறோம். ஒற்றுப்பிழை எனும் வல்லினம் மிகும் மிகா இடங்கள் எது என்பதில் பெரும்பாலோருக்கு ஐயமுண்டு. மற்றும் எச்சொற்களைச் சேர்த்து எழுதுவது எவற்றைப் பிரித்து எழுதுவது என்பதிலும் குழப்பம் அதிகம். விக்கிமூலம் போன்ற இடங்களில் ஒளி எழுத்துணரி பிழைகளும் நிறைய உள்ளன. ஆகவே தமிழுக்குச் சொல்திருத்தி தேவைதான். ஆனால் ஆங்கிலச் சொல்திருத்தியின் நகலாக இல்லாமல் தனித்தன்மை வாய்ந்ததாக இருக்க வேண்டும். எனினும் பாமா விஜயம் திரைப்படத்தில் வருவது போல ‘முடித்துத் தருவோம்’ என்பதற்குப் பதிலாக ‘முடி திருத்துவோம்’ என்று எவரும் தட்டச்சு செய்தால், இவையும் சொற்தொகுதியில் இருக்கும் சொற்கள் என்பதால், பிழையென்று எந்தச் சொல்திருத்தியாலும் சுட்டிக்காட்ட முடியாது!

உரையில் சொற்பிழை சரிபார்ப்பு பின்வரும் படிகளைக் கொண்டுள்ளது

  • உரையிலிருந்து நாம் சரிபார்க்க விரும்பும் சொற்களைப் பிரித்தெடுத்துக் கொள்ளுதல் (tokenizing).
  • ஒரு சொல் அகராதியில் உள்ளதா என்று முதலில் பார்த்தல்.
  • இல்லாவிட்டால், அடுத்து அடிச்சொல் (lemma) மற்றும் ஒட்டுகளை விதிப்படி சேர்த்து அந்தச் சொல் வருகிறதா என்று பார்த்தல்.
  • இரண்டிலும் இல்லாவிட்டால், அது தவறான சொல். தவறான சொற்களுக்கு, அகராதியிலும், ஒட்டுகளைச் சேர்த்தும் இதே போன்ற வேட்பு சொற்களைக் (candidate words) கண்டறிவதன் மூலம் திருத்தங்களைப் பரிந்துரைத்தல்.

வேட்பு சொற்கள் 

ஒரு சொல்லைப் பிழை என்று அடையாளமிட்டவுடன் திருத்தங்களைப் பரிந்துரைக்க நாம் வேட்பு சொற்கள் பட்டியலைத் தயாரிக்க வேண்டும். இந்தப் பட்டியலைத் தயாரிக்க நாம் திருத்தும் தூரம் (edit distance) என்ற கருத்துருவைப் பயன்படுத்துகிறோம். ஆங்கிலத்தில் ஒரு திருத்துத் தூரத்தில் உள்ள எழுத்துப்பிழைகளின் வகைகள் இவை:

  1. செருகல் பிழை (insertion): ஒரு கூடுதல் எழுத்து சேர்தல், எ.கா., truly -> truely. ஒரு முக்கியமான சிறப்பு வழக்கு மீண்டும் அதே எழுத்து, எ.கா., occasion -> occassion. (இந்தப் பிழை தமிழில் அரிது.)
  2. விடுபடு பிழை (deletion): ஒரு எழுத்து விட்டுப்போய் விட்டது, எ.கா., unnecessary -> unnecesary
  3. பதிலீட்டுப் பிழை (substitution): ஒரு எழுத்துக்குப் பதிலாக வேறொரு எழுத்து உள்ளது, எ.கா., separate -> seperate.
  4. இடமாற்றுப் பிழை (transposition): இரண்டு தொடர்ச்சியான எழுத்துகள் இடமாற்றம் ஆகியுள்ளன, எ.கா., receive -> recieve.

பெரும்பாலான சொற்பிழைகள் இந்த ஒரு திருத்துத் தூரத்தில்தான் வரும்.

சொற்பிழைத் திருத்தி

சொற்பிழைத் திருத்தி

ஹன்ஸ்பெல் திறந்த மூல சொற்பிழைத் திருத்தி

ஆங்கிலத்தில் முன்னொட்டுகளும் பின்னொட்டுகளும் உள்ளன. இருப்பினும் தமிழில் வினைச்சொற்களுக்கும் பெயர்ச்சொற்களுக்கும் இருப்பது போல அந்த அளவுக்குக் கிடையாது. ஆகவே ஆங்கில சொல்திருத்திகளைத் தமிழுக்குத் தகுந்தவாறு மாற்றி அமைக்க முடியாது.

ஹன்ஸ்பெல் (Hunspell) திறந்த மூல மென்பொருள் முதலில் ஹங்கேரிய மொழிக்காக எழுதப்பட்டது, இதன் முக்கிய பங்களிப்பாளர் லாஸ்லோ நெமெத். ஹங்கேரிய மொழியும் பல ஒட்டுகள் கொண்டது. எ.கா., ház-a-i-é-i-nek (அவர்களின் வீடுகளுடைய). ஹன்ஸ்பெல் சொற்பிழை திருத்தியில் இம்மாதிரி சொற்கள் முற்றிலும் ஒட்டுகளைப் பிரிப்பதன் மூலம் தீர்க்கப்படும். இது தமிழ் போன்ற சொற்றொடரியல் ரீதியாக வளமான மொழிகளுக்கும் ஒத்து வரும். இதைத் தமிழுக்குப் பயன்படுத்த வேண்டுமானால் அடிச்சொற்களைக் கொண்ட அகராதியையும் முன்னொட்டு, பின்னொட்டுகளுக்கான விதிகளையும் தயாரிக்க வேண்டும். 

தமிழுக்கு நான் உருவாக்கிய ஹன்ஸ்பெல் பின்னொட்டு விதிகள்

இதற்கான கோப்புகளையும், விவரங்களையும் இங்கே காணலாம். சொல் ஒட்டுகளுக்கான விதிகளை .aff கோப்பு கொண்டிருக்கிறது. எந்தெந்த ஒட்டுகள் ஒரு அடிச்சொல்லுடன் சேர்ந்து மாற்று சொற்களை உருவாக்கும் என்ற விதிகளை இக்கோப்பில் எழுதியுள்ளேன். 

  • வினைச்சொல்: இதற்கான பின்னொட்டு விதிகள் ஒவ்வொரு அடிச்சொல்லுக்கும் சுமார் 8500 சொல் வேறுபாடுகளை உருவாக்குகின்றன. 1000-க்கும் மேலான வினைச்சொற்களைக் குறியிட்டுள்ளேன்.
  • பெயர்ச்சொல்: இதற்கான பின்னொட்டு மற்றும் முன்னொட்டு விதிகள் சேர்ந்து ஒவ்வொரு அடிச்சொல்லுக்கும் சுமார் 2500 சொல் வேறுபாடுகளை உருவாக்குகின்றன. 4000-க்கும் மேலான பெயர்ச்சொற்களைக் குறியிட்டுள்ளேன்.

என் சொற்பட்டியலில் சுமார் 330,000 சொற்கள் மட்டுமே உள்ளன. இருப்பினும் இந்த சுமார் 30,000 வரிகள் கொண்ட ஒட்டு விதிகள் மொத்தம் 20 மில்லியனுக்கும் மேலான வினைச்சொல் மற்றும் பெயர்ச்சொல் வேறுபாடுகளை உருவாக்குகின்றன!

ஹன்ஸ்பெல்லில் முக்கியக் குறைபாடு என்னவென்றால், ஒற்றுப்பிழை கண்டுபிடிக்க நேரடி ஆதரவு இல்லை. தவிர இது சொற்களைச் சேர்த்து எழுதுவது பிரித்து எழுதுவதால் ஏற்படும் பிழைகளையும் கையாளுவதில்லை. இது திறந்த மூல நிரல் ஆகையால் இதை நீட்சி செய்ய முடியுமா என்று பார்க்க வேண்டும். இது C++ இல் எழுதப்பட்டது. ஆனால் பைதான் மற்றும் ஜாவா உள்ளிட்ட பல மொழிகளுக்கு இடைமுகங்கள் மற்றும் மாற்றியெழுதிய நிரல்கள் உள்ளன. 

லேங்குவேஜ் டூல் திறந்த மூல சொற்பிழைத் திருத்தி

திறந்த மூல சொற்பிழைத் திருத்தி பற்றி மலேசியா நண்பர்கள் சி. ம. இளந்தமிழ் & வே. இளஞ்செழியன் எழுதிய கட்டுரை இங்கே. இக்கட்டுரையில் லேங்குவேஜ் டூல் (Language Tool) பற்றிய முக்கிய குறிப்புகள் சில. “லேங்குவேஜ் டூல் ஒற்றுப்பிழை மட்டுமின்றி சொற்களைச் சேர்த்தும் பிரித்தும் எழுதுவதால் ஏற்படும் தவறுகளையும் கண்டுபிடிக்கும் வசதியைக் கொண்டிருக்கிறது. 

இது ஜாவா நிரலாக்க மொழியைக் கொண்டு எழுதப்பட்ட ஒரு மென்பொருளாகும் . இதனை டேனியல் நேபர் என்ற ஒரு ஜெர்மானிய நிரலாளர் உருவாக்கினார் . இது கடந்த பத்து ஆண்டுகளாகத் திறவூற்றுச் சமூகத்தால் தொடர்ந்து மேம்படுத்தப்பட்டு இன்று 20 க்கும் மேற்பட்ட மொழிகளை ஆதரிக்கிறது.

இத்திருத்தி இலக்கணப்பிழைகளைக் கண்டுபிடிக்க இரண்டு அடிப்படைக் கோப்புகளைப் பயன்படுத்துகின்றது. முதலாவது கோப்பு – tamil.dict – சொற்பட்டிலையும் சொற்பகுதிக் குறிப்பையும் (POS tags) கொண்டிருக்கிறது. இரண்டாவது கோப்பு – grammar.xml – இலக்கண விதிகளைக் கொண்டிருக்கிறது. இக்கோப்புகளைப் பயன்படுத்தி ஒரு சொற்றொடரில் உள்ள பிழைப் பாங்குகளை (error patterns) கண்டுபிடித்து, அவற்றைப் பிழையெனக் குறிப்பிடுவதோடு, அப்பாங்குகளை எவ்வாறு திருத்தி அமைக்கலாம் எனவும் லேங்குவேஜ் டூல் பரிந்துரைக்கிறது.”

லேங்குவேஜ் டூல் இணையதளத்தில் தமிழைத் தேர்வு செய்து உரையை உள்ளிட்டு சரிபார்த்தால் பின்வருமாறு சொற்களைச் சேர்த்தும் பிரித்தும் எழுதப் பரிந்துரை செய்கிறது. “வேண்டும்” என்ற வினைமுற்று வடிவம்முன் இடம்விட வேண்டும்: “கற்க வேண்டும்”. பெயரெச்சத்தின் பின் ‘போது’ வந்தால் சேர்த்து எழுத வேண்டும்: “தேவைப்படும்போது”.

ஆக, தமிழில் சொற்பிழைகளைக் கண்டுபிடிக்க நம்மிடம் ஹன்ஸ்பெல் உள்ளது. லேங்குவேஜ் டூல் ஒற்றுப்பிழையையும் சொற்களைச் சேர்த்தும் பிரித்தும் எழுதுவதால் ஏற்படும் தவறுகளையும் கண்டுபிடிக்கிறது. இவை இரண்டையும் ஒருங்கிணைத்தால் (integration) நமக்கு ஒரு முழுமையான தமிழ் பிழைத்திருத்தி கிடைக்கும் வாய்ப்பிருக்கிறது. லேங்குவேஜ் டூல் ஜாவா மொழியில் எழுதி LGPL உரிமத்தின் கீழ் வெளியிடப்பட்டுள்ளது. இதை ஒரு சவாலாக எடுத்துச்செய்ய தமிழ் சமூக நிரலாளர்கள் முன் வருவார்களா?

 

—————–

இத்தொடரில் அடுத்த கட்டுரை: உணர்வு பகுப்பாய்வும் சமூக ஊடகங்களும்

ரசிகர்களின் கருத்துக் கணிப்பு. கருத்தைக் கணித்து அதற்கேற்ப தானியங்கியாக செயல்படுதல். நடைமுறை எடுத்துக்காட்டு: ட்விட்டர் கீச்சுகளை எடுத்து உணர்வு பகுப்பாய்வு. ஆங்கிலத்தில் இயல்மொழி ஆய்வுக்கான வளங்கள் மிகுதியாக உள்ளன. சமூக ஊடகத் தரவுகளை இயல்மொழி ஆய்வு செய்வதில் எழும் சவால்கள்.

 

http://www.kaniyam.com/tamil-spell-checker/

 

Link to comment
Share on other sites

  • 2 weeks later...
  • கருத்துக்கள உறவுகள்

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 27. உணர்வு பகுப்பாய்வும் சமூக ஊடகங்களும்

October 19, 2018

உணர்வு பகுப்பாய்வு (sentiment analysis) அல்லது கருத்து சுரங்க வேலை (opinion mining) என்பது ஒரு பேச்சாளரின் அல்லது எழுத்தாளரின் மனோபாவத்தைத் தீர்மானிப்பது. ஒரு தலைப்பைப் பற்றியோ அல்லது ஒரு ஆவணத்தை ஒட்டுமொத்தமாகவோ ‘நேர்மறை (positive)’ அல்லது ‘எதிர்மறை (negative)’ என்று கணிக்கிறோம். இம்மாதிரி நேரெதிரான இரண்டு தன்மைகள் இருந்தால் அவற்றை முனைவு (polarity) என்று சொல்கிறோம். சில வேலைகளுக்கு மூன்றாவதாக ‘நடுநிலை (neutral)’ என்றும் கணிக்க வேண்டியிருக்கலாம். இது தவிர உயர்நிலை உணர்வு பகுப்பாய்வில் “கோபம்”, “சோகம்”, மற்றும் “மகிழ்ச்சி” போன்ற வகைப்பாடுகளும் செய்ய இயலும்.

இணையப் பக்கங்கள், செய்திகள், விவாதங்கள், விமர்சனங்கள், வலைப்பதிவுகள், மற்றும் சமூக ஊடகங்கள் உள்ளிட்ட ஆவணங்களின் பெரிய சேகரிப்புகளில் இம்மாதிரி உணர்வு பகுப்பாய்வு செய்ய வேண்டுமானால் கணினி உதவி தேவைப்படுகிறது. பொதுவாக சமூக ஊடகங்களில் யாவரும் தங்கள் கருத்துகளை வெளிப்படையாகப் பகிர்ந்து கொள்வதால், இம்மாதிரி கருத்து சுரங்க வேலை செய்யும் போது, சமூக ஊடக உள்ளடக்கம் மிகவும் பயனுள்ளதாக இருக்கிறது. மேலும் நிகழ் நேர கருத்துகள் தேவையெனில் ட்விட்டர் கீச்சுகளுக்கு நிகரில்லை. 

ரசிகர்களின் கருத்துக் கணிப்பு

எடுத்துக்காட்டாக, இணையம் மற்றும் சமூக ஊடகங்கள் வருவதற்கு முந்தைய காலத்தில் ஒரு திரைப்படம் வெளியிடப்படுகிறது என்று வைத்துக் கொள்வோம். அந்தப் படத்தைப் பற்றி ரசிகர்களின் கருத்து என்ன என்று அதன் தயாரிப்பாளர்கள் அறிய விரும்பினால் முதல் காட்சி முடிந்து வெளியே வரும் ரசிகர்களிடம் நேரடியாகக் கருத்துக் கணிப்பு செய்வார்களாம். அதிகம் போனால் ஒருசில திரையரங்குகளில்தான் இப்படிச் செய்ய முடியும்.

இன்று ரசிகர்களோ தங்கள் விமர்சனங்களைப் படம் முடிந்தவுடன் (முடியும் முன்னரே?) கீச்சத் தொடங்குகின்றனர். இன்று படங்களும் உலகம் முழுவதும் ஒரே நேரத்தில் வெளியிடப்படுகின்றன. கீச்சுகளை உணர்வு பகுப்பாய்வு செய்தால் கருத்துகளை உடன் அறிய முடியும். மக்களின் ரசனைக்குத் தகுந்தவாறு வெவ்வேறு  வட்டாரங்களில் வெவ்வேறு வகையாக வினியோகமும் விளம்பரங்களும் செய்யலாம். திரைப்படங்களுக்கு மட்டுமல்ல, நுகர்பொருள்களுக்கும் ஆடை அலங்காரங்களுக்கும் மற்றும் பல ரசனை அடிக்கடி மாறும் வணிகப் பொருட்களுக்கும் சேவைகளுக்கும் இம்மாதிரி உணர்வு பகுப்பாய்வு தேவைப்படுகிறது.

தேர்தல் சமயங்களிலும் மற்ற நேரங்களிலும் அரசியல்வாதிகளும், அரசு சாரா நிறுவனங்களும் மற்றவர்களும் முறைசாரா கருத்துக் கணிப்புகளுக்கும் இம்மாதிரி செயல்முறைகளைப் பயன்படுத்தலாம்.

உணர்வு பகுப்பாய்வு

உணர்வு பகுப்பாய்வு

கருத்தைக் கணித்து அதற்கேற்ப தானியங்கியாக செயல்படுதல்

இரைச்சலை வடிகட்டுதல், உரையாடல்களைப் புரிந்துகொள்ளுதல், பொருத்தமான உள்ளடக்கத்தை அடையாளம் காணுதல் மற்றும் அதற்கேற்ப செயல்படுதல் போன்ற செயல்களைத் தானியங்கியாக வணிக நிறுவனங்கள் செய்ய முயற்சிக்கும் போது, அவர்களது கவனம் உணர்ச்சி பகுப்பாய்வு துறைக்கு திரும்பத் தொடங்கியுள்ளது.

மின்வணிக இணையதளங்களில் நீங்கள் ஒரு பொருளைத் தேடி எடுத்தீர்களானால், அந்தப் பொருளுடன் வாங்கக் கூடிய மற்ற பொருள்களையும் பரிந்துரை செய்கிறார்கள். இதைப் பரிந்துரை இயந்திரம் (Recommendation Engine) அல்லது அமைப்பு என்று சொல்கிறார்கள்.

பரிந்துரை அமைப்புக்கு, உணர்வு பகுப்பாய்வு ஒரு மதிப்புமிக்க நுட்பமாக நிரூபிக்கப்பட்டுள்ளது. பயனரின் விருப்பங்களை அறிந்து அதற்குத் தோதாக பரிந்துரை செய்ய இது உதவுகிறது.

நடைமுறை எடுத்துக்காட்டு: ட்விட்டர் கீச்சுகளை எடுத்து உணர்வு பகுப்பாய்வு

இந்தக் காணொலி ஆங்கில உரையைப் பற்றியது. இருப்பினும் தமிழில் விளக்கங்கள் எளிதாக இருப்பதால் இது நல்ல எடுத்துக்காட்டாக உதவும். ஒரு குறிப்பிட்ட தலைப்புக்கு கீச்சுகளை சேகரிக்க வேண்டுமானால் ட்விட்டரின் பயன்பாட்டு நிரலாக்க இடைமுகம் மூலம் எடுக்க முடியும். பைதான் நிரல் எழுதி எப்படி அதைச் செய்வது என்று இந்தக் காணொலியில் விளக்குகிறார்.

இதற்கு முன்தேவையாக apps.twitter.com சென்று நீங்கள் ஒரு செயலி உருவாக்கிக் கொள்ள வேண்டும். இந்த செயலியிலிருந்து நுகர்வோர் திறவி (API Key), நுகர்வோர் இரகசியம் (API Secret) அணுகல் அடையாளச் சின்னம் (Access Token), அணுகல் அடையாளச் சின்ன இரகசியம் (Access Token Secret) ஆகிய நான்கையும் படியெடுத்துக் கொள்ளவும். இவற்றை வைத்து பைதானிலுள்ள tweepy என்ற நிரலகத்தைப் பயன்படுத்தினால் நீங்கள் கொடுத்த சொல் பற்றிய கீச்சுகளை தேடித்தரும். இந்த கீச்சுகளை ஒன்றொன்றாக TextBlob என்ற நிரலகத்தைப் பயன்படுத்தி உணர்ச்சி பகுப்பாய்வு செய்ய முடியும்.

ஆங்கிலத்தில் இயல்மொழி ஆய்வுக்கான வளங்கள் மிகுதியாக உள்ளன

இது எப்படி ஒரே வரியில் பகுப்பாய்வு செய்ய முடிந்தது, மாய வேலை போலிருக்கிறதே என்கிறீர்களா? இதனால்தான் ஆங்கிலத்தில் வளங்கள் அதிகமாக உள்ளன, ஆனால் தமிழில் மிகக்குறைவு என்று சொல்கிறோம். இந்த வேலையைச் செய்ய TextBlob ஒரு அகராதியுடன் வருகிறது. 

இந்த அகராதியில் ஒவ்வொரு சொல்லும் கீழ்க்கண்ட மதிப்பெண்களைக் கொண்டுள்ளது.

  • முனைவு: எதிர்மறையா அல்லது நேர்மறையா
  • அகநிலைப்பாடு: தற்சார்புடைய (subjective) அல்லது தற்சார்பற்ற (objective) 
  • தீவிரம் (intensity): அடுத்த சொல்லை மாற்றியமைக்கிறது (எடுத்துக்காட்டாக, “மிக” ஒரு மாற்றியமைக்கும் சொல்)

ஒரு தனிப்பட்ட குறிப்பு. பகுப்பாய்வு செய்யும்போது TextBlob ஓரெழுத்துச் சொற்களைப் பொருட்படுத்தாது. மற்ற சில இயல்மொழி ஆய்வுகளில் ஈரெழுத்துச் சொற்களையும் விட்டு விடுகிறார்கள். ஏனெனில் ஆங்கிலத்தில் இவை வாக்கியத்தின் பொருளுக்கு அவசியமில்லாத stop words என்று சொல்கிறார்கள். ஆனால் தமிழிலோ ஆ, ஈ, தீ, கை, மா, வா, போ, வை போன்ற ஓரெழுத்துச் சொற்கள் மிக அவசியமானவை. எனினும் ஆங்கிலத்துடன் ஒப்பிடுகையில் ஆ, ஈ மட்டுமே ஓரெழுத்துச் சொற்கள். ஒரு மெய்யெழுத்தும் ஒரு உயிரெழுத்தும் சேர்ந்துள்ளதால் மற்ற உயிர்மெய் எழுத்துகள் ஈரெழுத்துச் சொற்களே.

தேசிய அறிவியல் அறக்கட்டளை (NSF) மானியமும், ஆல்ஃபிரெட் பி. ஸ்லோன் ஆய்வு உதவித் தொகையும் பெற்று கார்னெல் பல்கலையில் சில ஆய்வாளர்கள் உணர்வு பகுப்பாய்வு சோதனைகளில் பயன்படுத்த தரவுகளைத் தயாரித்தனர். இந்த தரவுத்தளத்தில் இணைய திரைப்பட தரவுத்தளம் (IMDB), rec.arts.movies.reviews செய்திக்குழு, அழுகிய தக்காளிகள் (Rotten Tomatoes) திரைப்படங்கள் மற்றும் தொலைக்காட்சிகளை மதிப்பாய்வு மற்றும் திரட்டு செய்யும் அமெரிக்க இணையதளம் ஆகியவற்றிலிருந்து எடுக்கப்பட்ட  விமர்சனங்கள் உள்ளன.

  • 1000 நேர்மறை மற்றும் 1000 எதிர்மறை சீர் செய்யப்பட்ட திரைப்பட விமர்சனங்கள்.
  • 5331 நேர்மறை மற்றும் 5331 எதிர்மறை சீர் செய்யப்பட்ட வாக்கியங்கள் மற்றும் துண்டுகள்.
  • 5000 தற்சார்புடைய (subjective) மற்றும் 5000 தற்சார்பற்ற (objective) சீர் செய்யப்பட்ட வாக்கியங்கள்.

சமூக ஊடகத் தரவுகளை இயல்மொழி ஆய்வு செய்வதில் எழும் சவால்கள்

சமூக இயங்குதளங்களின் கட்டுப்பாடற்ற சூழல்கள் பயனர்கள் பேச்சுவழக்கு, தனிப்பட்ட சொற்கள் மற்றும் அஃகுப்பெயர்களைப் (acronyms) பயன்படுத்துவதை ஊக்குவிக்கின்றன. சில எடுத்துக்காட்டுகள் ஜுஜூபி, மரண மொக்கை, ROFL ஆகியவை. இவற்றைப் புரிந்து கொள்வதற்காக தமிழ் அகராதியில் சேர்ப்பதா, ROFL போன்ற சுருக்கங்களை முன்செயலாக்கத்தில் விரித்து எழுதி மொழிபெயர்ப்பு செய்வதா போன்ற பிரச்சினைகள் சமூக ஊடகத் தரவுகளில் எழும். பெரும்பாலும் இவற்றை உணர்வு பகுப்பாய்வு திட்டங்களால் புரிந்து கொள்ள முடிவதில்லை. ஆகவே சூழல் மற்றும் உணர்வை விளக்குவது கடினமாக உள்ளது.

இருப்பினும், நிறுவனங்கள் தங்கள் வாடிக்கையாளர்களுடன் நேரடியாகத் தொடர்பு கொள்ளவும், அவர்களின் விருப்பங்களைப் புரிந்துகொள்ளவும் சமூக ஊடகங்கள் மிகச் சிறந்த வழிமுறையாகவே உள்ளன. திறமையான முறையில் கையாண்டால், அது நீண்ட கால வணிக வளர்ச்சிக்கு நுண்ணறிவு உருவாக்க பயன்படும் தரவுகளை சேகரிக்க நிறுவனங்களுக்கு ஒரு சக்திவாய்ந்த கருவியாகும்.

 

http://www.kaniyam.com/sentiment-analysis-and-social-media/

 

Link to comment
Share on other sites

  • கருத்துக்கள உறவுகள்

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 28. மொழித் தொழில்நுட்பத்தில் வளங்கள் மிகுந்த மொழியாகத் தமிழை உயர்த்துவோம்

October 25, 2018

இயல் மொழியியலில் அண்மைய தொழில்நுட்பக் கலை பற்றிய ஆய்வு, தொகுதி 13-14 இலிருந்து கீழ்க்கண்ட மேற்கோள் எடுக்கப்பட்டது.

“மொழித் தொழில்நுட்பத்தை பயன்படுத்துவதன் மூலம் பெறக்கூடிய நன்மைகள் இவை. கணினிகளின் பயன்மை (usability) அதிகரிக்கிறது. மேலும் கணினி பயன்பாட்டில் பாமர மக்கள் தன்மேம்பாடு பெறவும் (empowering) வழிவகுக்கிறது.”

தமிழின் கடந்த முதன்மைத்துவத்தை மீண்டும் பெற முயல்வோம்

1805 இல் ராஜெட் ஆங்கிலத்தில் முதல் தெஸாரஸ் (Roget’s Thesaurus) உருவாக்கினார். இதன் மூலப் பதிப்பில் 15,000 சொற்கள் இருந்தன. அச்சிடல் ஐரோப்பாவில் 15 ஆம் நூற்றாண்டிலேயே பரவலாக வந்துவிட்டது. திவாகர நிகண்டு என்னும் நூல் 8 ஆம் நூற்றாண்டில் திவாகர முனிவரால் இயற்றப்பட்டது. பிங்கள நிகண்டு 10 ஆம் நூற்றாண்டில் இயற்றப்பட்டது. இதில் 14700 சொற்பொருள் விளக்கங்கள் உள்ளன. நிகண்டு என்பது ஒத்த கருத்துடைய சொற்களை ஓரிடத்தில் சேர்த்துக் கொடுக்கும் தெஸாரஸ் போன்ற நூல் ஆகும். அக்காலத்தில் ஓலைச்சுவடியும் பரவலாக வரவில்லையென்று தெரிகிறது. இந்நூற்களை அனேகமாக மனப்பாடமாகவே பல தலைமுறைகளுக்குப் பேணிக்காத்தனர். கணினி மற்றும் தகவல் யுகத்தில் நம் தாய்மொழியைத் தழைக்கச் செய்யத் தேவையான வேலைகளை நாம் செய்யாவிட்டால் என்ன சாக்கு சொல்லமுடியும்? நமக்கு என்ன வசதி இல்லை? நம் முன்னோர்களிடமிருந்த மொழிப்பற்றையும் சமூக மனநிலையையும் அடைய முயல்வோம்.

இயல்மொழி ஆய்வில் தமிழுக்கு பலவீனமான ஆதரவுதான் உள்ளது

உலகத்தில் சுமார் 7000 மொழிகள் உள்ளன. இவற்றை இயல்மொழி ஆய்வின் ஆதரவு மற்றும் வளங்கள்படி ஆறு படிகளாகப் பிரித்தார்கள். கருவிகளும் வளங்களும் மிகுந்து முதல் படியில் உன்னதமான ஆதரவுடன் ஆங்கிலம் தனியிடத்தில் உள்ளது. இரண்டாம் இடத்தில் நல்ல ஆதரவுடன் ஜெர்மன், பிரெஞ்சு, ஸ்பானிஷ், இத்தாலிய, போர்த்துகீய மொழிகள் போன்ற 10 உள்ளன. மூன்றாவது இடத்தில் மிதமான ஆதரவுடன் இந்தி, வியட்நாமிய, தாய்லாந்து போன்ற 70 மொழிகள் உள்ளன. தமிழ் நான்காவது இடத்தில் பலவீனமான ஆதரவுடன் 300 மொழிகளில் ஒன்றாகத்தான் இன்று இருக்கிறது. 330 ஆயிரம் பேருக்கு மட்டுமே தாய்மொழியான ஐஸ்லாண்டு மொழிக்கு நம்மைவிட நல்ல கருவிகளும் வளங்களும் உள்ளன!

மொழிக்கான அடிப்படை வளங்கள் கருவிப் பெட்டி

ஐரோப்பிய மொழிகளுக்கு, மிகச்சிறு மக்கள்தொகை மட்டுமே பேசும் மொழிகளுக்குக் கூட, தொழில்நுட்பமும் வளங்களும் இன்று பெருகியிருக்கக் காரணம் தெரியவேண்டுமென்றால், அவர்கள் பல பத்தாண்டுகளாக திட்டமிட்டு எடுக்கும் முயற்சிகளைப் பார்க்க வேண்டும். இவற்றில் முக்கியமான ஒன்று மொழிக்கான அடிப்படை வளங்கள் கருவிப் பெட்டி  (Basic Language Resource Kit – BLARK) தயார் செய்தல்.

ஐரோப்பாவில் 11 அதிகாரப்பூர்வமான மொழிகளும் 200 க்கும் மேற்பட்ட மற்ற மொழிகளும் உள்ளன. அடிப்படை வளங்கள் கருவிப் பெட்டி என்ற கட்டமைப்பு  ஸ்டீவன் கிரௌவர் (Steven Krauwer) என்பவரால் ஐரோப்பிய மொழிகளுக்காக முன்வைக்கப்பட்டது. இதன் குறிக்கோள் ஒரு மொழியைக் கணினிக்கு கிடைக்க வைப்பது (making a language computationally available) என்று சொல்கிறார்கள். அதாவது இயல்மொழியை ஆய்வு செய்ய கருவிகள், தரவுகள், செயல்முறைகள் போன்றவை தேவையான அளவு இருந்தால்தான் கணினி உதவி ஆய்வுகள் செய்ய இயலும். 

கல்வி மற்றும் வணிகத்துறை ஆராய்ச்சியாளர்கள், மற்றும் கல்வியாளர்கள் இந்த கருவிப் பெட்டியின் இலக்கு பயனர்கள். இது மாணவர்களுக்குப் பயிற்சியளிக்கவும், ஆராய்ச்சி சோதனைகளுக்கும், செயலி வெள்ளோட்டங்களுக்கும் பயன்படுத்தப்படும். இந்தக் கருவிப் பெட்டியை வணிக நிறுவனங்கள் பயன்படுத்தலாம், ஆனால் பொதுவாக வணிக வேலைகளுக்கு மாற்றமின்றி அப்படியே பயன்படுத்துவது அனேகமாக சாத்தியமில்லை.

எனவே இந்தக் கருவிப் பெட்டி திறந்த மூலமாகவும் இதற்கான வளங்கள் திறந்த அனுமதியிலும் கிடைப்பது இன்றியமையாத முக்கியத்துவம் வாய்ந்தது. அப்படிக் கிடைத்தால்தான் தொழில்துறை உருவாக்குநர்கள் தயக்கமின்றித் தங்கள் தேவைகளுக்கு ஏற்ப இவற்றை மாற்றிக்கொண்டு பயன்படுத்த முடியும்.

நடைமுறைக்கேற்ற, அடையக்கூடிய குறிக்கோள்

ஆக இயல்மொழி ஆய்வுகளில் தமிழ் இன்று வளங்கள் வறண்ட மொழியாக இருக்கிறது. இதை ஆங்கிலத்துக்குச் சமமாக ஆக்குவது அடையக்கூடிய குறிக்கோள் அல்ல. வளங்கள் மிகுந்த மொழியாக ஆக்கக்கூடும். ஆனால் இப்போது அதை நினைத்துப் பார்க்கக் கூடிய இடத்தில் நாம் இல்லை. இடைக்காலத்தில், அதாவது மூன்று முதல் ஐந்து ஆண்டுகளுக்குள், மிதமான வளங்கள் கொண்ட மொழியாக ஆக்குவதுதான் நடைமுறைக்கேற்ற, அடையக்கூடிய ஆனால் சவாலான குறிக்கோள். இதற்கு முதல் படியாக நமக்கு நல்ல தரமான மொழித் தொகுப்புகள் படைப்பாக்கப் பொதுமங்கள் அனுமதியில் தேவை. அடுத்து திறந்த மூலமாக ஒரு இயல்மொழி ஆய்வு கருவித்தொடரி தேவை. மேலும், பிழைகளற்ற உரைத்தொகுப்புகள்  தயாரிக்க பிழைத்திருத்தியும் திறந்த மூலமாக அவசியம். இவற்றைக் குறுகிய காலத்தில், ஒராண்டுக்குள், தயாரிக்க வேண்டும்.

இயல்மொழி ஆய்வுக் கட்டுரைகள் தமிழில்

முரண்நகையாக தமிழ் மொழி பற்றிய இயல்மொழி ஆய்வுக் கட்டுரைகள் ஆங்கிலத்தில் மட்டுமே வெளியிடப்படுகின்றன! தமிழில் மதிப்புமிக்க ஆய்விதழ்கள் (reputed research journals) இல்லை, மேற்கோள் (citation) காட்ட ஆங்கிலத்தில் வெளியிட்டால்தான் வசதியாக இருக்கும் என்பது எனக்குப் புரிகிறது. ஆனால் தமிழிலும் வெளியிடக்கூடாதா என்பதுதான் என்னுடைய கேள்வி. தமிழில் வெளியிட நீங்கள் முன்வந்தால் கணியம் இதழ் வெளியிடத் தயாராக உள்ளது. மொழிபெயர்ப்பையும் நாங்களே செய்துகொள்கிறோம். ஆங்கிலக் கட்டுரையை மட்டும் அனுப்புங்கள்.

பண்பாட்டுக்குத் தமிழ்; பணிவாய்ப்புக்கு ஆங்கிலம்

ஒரு உலகளாவிய தகவல்தொடர்பு சூழலில், வணிக மற்றும் பணிவாய்ப்புகளை விரிவாக்க நாம் பரவலாக யாவருடனும் தொடர்பு கொள்ள வழிவகை தேவை. அதே வேளையில் நமது தாய்மொழியையும், அத்துடன் சேர்ந்த நமது கலாச்சார அடையாளத்தையும் பாதுகாத்துக் கொள்வதற்கான வழிகளையும் நாம் கண்டறிய வேண்டும். “பண்பாட்டுக்குத் தமிழ்; வணிக மற்றும் பணிவாய்ப்புக்கு ஆங்கிலம்” இதுதான் தமிழர்களின் இன்றைய மொழி பற்றிய அணுகுமுறையாக இருக்க முடியும். வணிக மற்றும் பணிவாய்ப்புக்காக ஆங்கிலக் கல்விக்கு முன்னுரிமை கொடுக்கும் நாம், நம் பிள்ளைகளுக்குத் தாய் மொழியான தமிழில் ஆர்வம் வளர்க்கவில்லையென்றால் அவர்கள் கலாச்சாரமும் பண்பாடுமற்ற இயந்திர மனிதர்களாகவே வளர்வார்கள்.

நீங்களும் பங்களிக்க முடியும்

நீங்களும் பங்களிக்க முடியும்

ஊர் கூடித்தான் தேரிழுக்க முடியும்

இந்த திட்டம் நம் தாய் மொழியைப் பிழைக்க வைப்பது பற்றியது மட்டுமல்ல, செழிக்க வைப்பது பற்றியதும்தான். நாம் யாவரும் ஒரு கை கொடுத்தால் சாதிக்க முடியாதது எதுவுமில்லை. உங்களுக்கு நிரல் எழுதத் தெரியாதா? சோதனை செய்வது, ஆவணங்கள் எழுதுவது, உரைகளைத் தொகுப்பது, வலைப்பதிவு எழுதுவது, தமிழாக்கம் செய்வது போன்ற பல வேலைகள் உள்ளன. நீங்களும் தமிழை செழிக்க வைக்கப் பங்களிக்க முடியும்.

முற்றும்

 

 

http://www.kaniyam.com/let-us-promote-tamil-language-technology/

 

Link to comment
Share on other sites

பயனுள்ள கட்டுரைத்தொகுப்பு. தொடர்ந்து இணைபதற்கு நன்றி கிருபன்.

Link to comment
Share on other sites

  • கருத்துக்கள உறவுகள்
7 hours ago, பகலவன் said:

பயனுள்ள கட்டுரைத்தொகுப்பு. தொடர்ந்து இணைபதற்கு நன்றி கிருபன்.

 இணைத்தவற்றை வாசித்தார்களா என்று சந்தேகம் இருந்தது! இல்லையென்று நிரூபித்தமைக்கு நன்றி பகலவன்.

Machine translation இல் தமிழில் செய்ய நிறைய இருக்கின்றபோதிலும் பல திட்டங்கள் செயற்படுத்தப்படுகின்றன என்பது நம்பிக்கையை தருகின்றது. நிரலாக்கம் ( ப்ரோக்கிராமிங்) இல் ஆர்வம் உள்ளவர்கள் உதவலாம். 

Link to comment
Share on other sites

Archived

This topic is now archived and is closed to further replies.



  • Tell a friend

    Love கருத்துக்களம்? Tell a friend!
  • Topics

  • Posts

    • 29 MAR, 2024 | 10:23 AM   காசாவிற்குள் தடையற்ற விதத்தில் உணவுப்பொருட்களையும் மருந்துப்பொருட்களையும் இஸ்ரேல் அனுமதிக்கவேண்டும் என சர்வதேச நீதிமன்றம் உத்தரவிட்டுள்ளது. காசாவிற்குள் தடையற்ற விதத்தில் உணவுப்பொருட்களையும் மருந்துப்பொருட்களையும் இஸ்ரேல் அனுமதிக்கவேண்டும் என சர்வதேச நீதிமன்றம் உத்தரவிட்டுள்ளது. அவசரமாக தேவைப்படும் அத்தியாவசியபொருட்கள் மற்றும் மனிதாபிமான உதவிகளை காசாவிற்குள் அனுமதிப்பது தொடர்பில் இஸ்ரேல் உடனடியாக செயற்படவேண்டும் என சர்வதேச நீதிமன்றம் உத்தரவிட்டுள்ளது. காசாவில் அடுத்த சில வாரங்களில் கடும் பட்டினி நிலைமை உருவாகலாம் என் எச்சரிக்கை வெளியாகியுள்ள நிலையில் சர்வதேசநீதிமன்றம் இந்த உத்தரவை பிறப்பித்துள்ளது. காசா பட்டினி ஆபத்தினை எதிர்கொள்ளவில்லைமாறாக அந்த நிலைமை ஏற்கனவே உருவாகிவிட்டது என தெரிவித்துள்ள சர்வதேச நீதிமன்றம் மந்தபோசாக்கு போன்றவற்றினால் 27 சிறுவர்கள் உட்பட 31 பேர் ஏற்கனவே உயிரிழந்துவிட்டனர் என ஐநா நிபுணர்கள் தெரிவித்துள்ளதை சுட்டிக்காட்டியுள்ளது. மனிதாபிமான உதவிகள் வர்த்தக பொருட்கள் காசாவில் நுழைவதை இஸ்ரேல் கடுமையாக கட்டுப்படுத்தியமையும்   பொதுமக்கள் இடம்பெயர்வு மற்றும் உட்கட்டமைப்புகள் அழிக்கப்பட்டமை போன்ற காரணங்களாலேயே காசாவில் பட்டினி நிலை  உருவாகியுள்ளது என ஐக்கிய நாடுகள் மனித உரிமை ஆணையாளர் தெரிவித்திருப்பதையும் சர்வதேச நீதிமன்றம்  சுட்டிக்காட்டியுள்ளது.   காசாவில் அடுத்த சில வாரங்களில் கடும் பட்டினி நிலைமை உருவாகலாம் என் எச்சரிக்கை வெளியாகியுள்ள நிலையில் சர்வதேசநீதிமன்றம் இந்த உத்தரவை பிறப்பித்துள்ளது. காசா பட்டினி ஆபத்தினை எதிர்கொள்ளவில்லைமாறாக அந்த நிலைமை ஏற்கனவே உருவாகிவிட்டது என தெரிவித்துள்ள சர்வதேச நீதிமன்றம் மந்தபோசாக்கு போன்றவற்றினால் 27 சிறுவர்கள் உட்பட 31 பேர் ஏற்கனவே உயிரிழந்துவிட்டனர் என ஐநா நிபுணர்கள் தெரிவித்துள்ளதை சுட்டிக்காட்டியுள்ளது. மனிதாபிமான உதவிகள் வர்த்தக பொருட்கள் காசாவில் நுழைவதை இஸ்ரேல் கடுமையாக கட்டுப்படுத்தியமையும்   பொதுமக்கள் இடம்பெயர்வு மற்றும் உட்கட்டமைப்புகள் அழிக்கப்பட்டமை போன்ற காரணங்களாலேயே காசாவில் பட்டினி நிலை  உருவாகியுள்ளது என ஐக்கிய நாடுகள் மனித உரிமை ஆணையாளர் தெரிவித்திருப்பதையும் சர்வதேச நீதிமன்றம்  சுட்டிக்காட்டியுள்ளது. https://www.virakesari.lk/article/179954
    • தோட்டத் தொழிலாளர்களுக்கு அடிப்படை நாட்சம்பளமாக 2000 ரூபாவை வழங்க நடவடிக்கை எடுக்க வேண்டும் - கிட்ணண் செல்வராஜ் Published By: VISHNU   29 MAR, 2024 | 01:56 AM 1700 ரூபா எனும் வசனத்தை ஒதுக்கி வைத்துவிட்டு தோட்டத் தொழிலாளர்களுக்கு அடிப்படை நாட்சம்பளமாக 2000 ரூபாவை வழங்க நடவடிக்கை எடுக்க வேண்டுமென அகில இலங்கை தோட்டத் தொழிலாளர் சங்கத்தின் தலைவர் கிட்ணண் செல்வராஜ் தெரிவித்தார். சம்பள விவகாரம் தொடர்பில் பெருந்தோட்டத்  தொழிலாளர்களை தெளிவூட்டும் வகையில் இன்று வியாழக்கிழமை (28) ஹப்புத்தளை பிட்டரத்தமலையில் துண்டு பிரசுரங்கள் விநியோகிக்கப்பட்டன. அகில இலங்கை தோட்டத் தொழிலாளர் சங்கம் இதனை ஏற்பாடு செய்திருந்தது.  இதன்போதே அகில இலங்கைத் தோட்டத் தொழிலாளர் சங்கத்தின் தலைவர் கிட்ணன் செல்வராஜ் மேற்கண்டவாறு தெரிவித்தார். அவர் அங்கு மேலும் தெரிவிக்கையில், “சம்பள நிர்ணய சபைக்கு 2000 ரூபா அடிப்படை சம்பளத்தை வழங்குவதற்கு ஏதுவான பிரேரணை கொண்டுசெல்லப்பட வேண்டும். அவ்வாறு கொண்டு செல்லும் பொழுது அகில இலங்கை தோட்டத் தொழிலாளர் சங்கமாகிய நாங்கள் முழுமையான ஆதரவினை தருவோம். அதைவிடுத்து 1700 ரூபாவுக்குள் தோட்டத் தொழிலாளர்களின் சம்பளத்தை வரையறுக்கக் கூடாது. நிறைவேற்று அதிகாரம் கொண்ட ஜனாதிபதிக்கு ஒரு நாளைக்கு 1700 ரூபாவை சம்பளமாக வழங்கினால் போதுமா? அதுப்போல அரசியல்வாதிகளுக்கு நாட்சம்பளமாக 1700 ரூபா வழங்கினால் போதுமா?  அதனால் 1700 ரூபா என்ற வசனத்தை ஒதுக்கி வைத்துவிட்டு, தோட்டத் தொழிலாளர்களுக்கு அடிப்படை நாட்சம்பளமாக 2000 ரூபாவை வழங்குவதற்கு ஏதுவான நடவடிக்கைகளை அரசாங்கமும், அரசாங்கத்தோடு தூணாகவிருக்கும் மலையகத்தின் பினாமி அமைச்சரும் தொழிற்சங்கத் தலைவர்களும் உடனடியாக முன்னெடுக்க வேண்டும்.” என்று மேலும் தெரிவித்தார். https://www.virakesari.lk/article/179943
    • Published By: VISHNU   29 MAR, 2024 | 01:27 AM கிராமிய வீதிகள் அபிவிருத்தி இராஜாங்க அமைச்சின் நிதி ஒதுக்கீட்டின் கீழ் கிளிநொச்சி பாரதிபுர செபஸ்ரியார் வீதியின் பாலம் புனரமைத்தலுக்கான அடிக்கல் நாட்டு விழா வியாழக்கிழமை (28) இடம்பெற்றிருந்தது. குறித்த நிகழ்வில்  கிராமிய வீதிகள் அபிவிருத்தி இராஜாங்க அமைச்சர் சிவநேசதுரை சந்திரகாந்தன், யாழ்ப்பாண மாவட்ட பாராளுமன்ற உறுப்பினர் அங்கஜன் இராமநாதன், வன்னி பாராளுமன்ற உறுப்பினர் திலீபன், ஒப்பந்ததாரர்கள், பிரதேச செயலாளர்கள், கிராம மக்கள் மற்றும் வீதி அதிகார சபை உத்தியோகத்தர்கள் என பலரும் கலந்து கொண்டிருந்தனர். இந்நிகழ்வில் கிராமிய வீதிகள் அபிவிருத்தி இராஜாங்க அமைச்சர் சிவநேசதுரை சந்திரகாந்தன் அவர்களினால் பாலம் புனரமைப்புக்கான திரைநீக்கம் செய்யப்பட்டு பின் பால புனரைப்புக்கான அடிக்கல்லும் நாட்டி வைத்தார்.குறித்த பாலமானது 15,329,888.18 நிதி பங்களிப்பில் 90நாட்கள் ஒப்பந்த அடிப்படையில் ஆரம்பிக்கப்பட்டுள்ளது. அத்துடன் கண்டாவளை பிரதேச செயலாளர் பிரிவுக்கு உட்பட்ட கல்மடு நகர் பகுதியில் அமைந்துள்ள மூலிகைப் பண்ணையின்  பிரதான வீதியினை புனரமைப்பதாகவும் அதற்குரிய நிதியினை பெற்றுத்தர நடவடிக்கை எடுக்கப்படுவதாகவும் தெரிவித்து அத்துடன் மேலும் தெரிவிக்கையில் பல சிறிய பாலங்கள் உடனடியாக புனரிப்பு செய்வதற்கான நடவடிக்கையினை  உடன் மேற்கொள்ளுமாறு சம்பந்தப்பட்ட அதிகாரிகளுக்கு வேண்டுகோள் விடுத்ததுடன் இப்பகுதிகளில் உள்ள பலகிராமிய வீதிகளை புணரமைப்பு செய்வதற்குசம்பந்தப்பட்ட அமச்சுடன் கலந்துரையாடயிருப்பதாகவும் தெரிவித்தார். https://www.virakesari.lk/article/179939
    • புவி வெப்பமயமாதலால், துருவப் பனிக்கட்டிகள் வேகமாக உருகி வருகின்றன. திடமான பனிக்கட்டி உருகுவதால் பூமியின் மையப்பகுதியில் ஏற்படும் மாற்றங்கள் காரணமாக பூமியின் சுழற்சி வேகம் அதிகரித்து அதன் மூலம் பூமியின் நேரம் மாறுவதாக தெரிவிக்கப்பட்டுள்ளது. இதனால், இன்னும் சில ஆண்டுகளில் பூமியின் நேரம் ஒரு நாளைக்கு ஒரு நொடி வீதம் குறையும் என்று விஞ்ஞானிகள் தற்போது கணித்துள்ளனர் ஒரு வினாடி என்பது மிக குறுகிய காலப்பகுதி என்ற போதிலும், அது கணினி பயன்பாட்டில் அதிக தாக்கத்தை ஏற்படுத்தும் என்று விஞ்ஞானிகள் நம்புகின்றனர். https://thinakkural.lk/article/297441
    • கொதிக்கும் காய்ச்சலுடன், தாயின் முன்னிலையில் கண்ணீரை வென்ற ‘சஞ்சுமல் பாய்ஸ்’ வீரர் பட மூலாதாரம்,GETTY IMAGES கட்டுரை தகவல் எழுதியவர், க.போத்திராஜ் பதவி, பிபிசி தமிழுக்காக 29 மார்ச் 2024, 03:25 GMT புதுப்பிக்கப்பட்டது ஒரு மணி நேரத்துக்கு முன்னர் ஒவ்வொரு அணியிலும் ஒரு ரியல் ஹீரோ இருப்பார். அனைத்து நேரங்களிலும் அவர்களின் உதயம் இருக்காது, தேவைப்படும் நேரத்தில் அவர்களின் எழுச்சி அணியை வெற்றிக்கு அழைத்துச் செல்லும். அந்த வகையில் “சஞ்சுமெல் பாய்ஸ்” என்று அழைக்கப்படும் ராஜஸ்தான் ராயல்ஸ் அணிக்கு நேற்றைய ஆட்டத்தில் ரியல் ஹீரோவாக ஒளிர்ந்தவர் ரியான் பராக் மட்டும்தான். ஜெய்ப்பூரில் நேற்று நடந்த ஐபிஎல் டி20 தொடரின் 9-வது லீக் ஆட்டத்தில் டெல்லி கேபிடல்ஸ் அணியை 12 ரன்கள் வித்தியாசத்தில் வீழ்த்தி 2ஆவது வெற்றி பெற்றது ராஜஸ்தான் ராயல்ஸ் அணி. முதலில் பேட் செய்த ராஜஸ்தான் ராயல்ஸ் 20 ஓவர்களில் 5 விக்கெட் இழப்புக்கு 185 ரன்கள் சேர்த்தது. 186 ரன்கள் சேர்த்தால் வெற்றி எனும் இலக்குடன் களமிறங்கிய டெல்லி கேபிடல்ஸ் அணி 20 ஓவர்களில் 5 விக்கெட் இழப்புக்கு 173 ரன்கள் சேர்த்து 12 ரன்களில் தோல்வி அடைந்தது. இந்த வெற்றியின் மூலம் ராஜஸ்தான் ராயல்ஸ் அணி சொந்த மைதானத்தில் இந்த சீசனில் தொடர்ந்து 2ஆவது வெற்றியைப் பெற்றுள்ளது. முதல் வெற்றி பெற்றவுடன் நிகர ரன்ரேட்டை ஒன்று என வைத்திருந்த ராஜஸ்தான், 2 வெற்றிகளில் 4 புள்ளிகள் பெற்றும் நிகர ரன்ரேட் 0.800 புள்ளியாகக் குறைந்துவிட்டது. டெல்லி கேபிடல்ஸ் அணி அடுத்தடுத்து இரு தோல்விகளைச் சந்தித்துள்ளது. இதனால் இன்னும் புள்ளிக்கணக்கைத் தொடங்க முடியாமல், நிகர ரன்ரேட்டும் மைனஸ் 528ஆக பின்தங்கியுள்ளது. இந்த ஆட்டத்தில் ரியல் ஹீரோவாக ஜொலித்தவர் ரியான் பராக் (45 பந்துகளில் 84 ரன்கள் 6சிக்ஸர்கள், 7பவுண்டரிகள்) மட்டும்தான். ஒரு கட்டத்தில் டெல்லி கேபிடல்ஸ் அணி 3 விக்கெட் இழப்புக்கு 36 ரன்கள் என்று இக்கட்டான நிலையில் தடுமாறியது. ஆனால், 4வது பேட்டராக களமிறங்கிய ரியான் பராஸ், அஸ்வினுடன் ஜோடி சேர்ந்து 54 ரன்கள் பார்ட்னர்ஷிப்பும், ஜூரெலுடன் சேர்ந்து 52 ரன்கள் பார்ட்னர்ஷிப் அமைத்து அணிக்கு கவுரமான ஸ்கோரை பெற்றுக் கொடுத்தார்.   பட மூலாதாரம்,GETTY IMAGES ஒரு கட்டத்துக்கு மேல் அதிரடி ஆட்டம்தான் ஸ்கோரை உயர்த்த கை கொடுக்கும் என்பதை அறிந்த ரியான் பராக் டெல்லி பந்துவீச்சாளர்களை வெளுக்கத் தொடங்கினார். ஒரு கட்டத்தில் 20 பந்துகளில் 16 ரன்கள் என்று மெதுவாக ஆடிய பராக் அதன்பின் பேட்டை சுழற்றத் தொடங்கினார். பராக் தான் சந்தித்த கடைசி 19 பந்துகளில் மட்டும் 58 ரன்களைச் சேர்த்தார். அதிலும் அதிவேகப்பந்துவீச்சாளர் நோர்க்கியா வீசிய கடைசி ஓவரில் மட்டும் 6 சிக்ஸர்கள், 3 பவுண்டரிகள் என 25 ரன்களை பராக் சேர்த்தார். ராஜஸ்தான் அணியை ஒற்றை பேட்டராக கட்டி இழுத்து பெரிய ஸ்கோருக்கு கொண்டு வந்த ரியான் பராக் ஆட்டநாயகனாகத் தேர்ந்தெடுக்கப்பட்டார். கடந்த 3 சீசன்களிலும் ரியான் பராக் பெரிதாக ஸ்கோர் செய்யவில்லை. கடந்த சீசனில் 7 இன்னிங்ஸில் பராக் சேர்த்தது வெறும்78 ரன்கள்தான், 2022ம் ஆண்டு சீசனில் பராக் 14 இன்னிங்ஸ்களில் 148 ரன்கள் சேர்த்தார், 2021 சீசனில் 10 இன்னிங்ஸ்களில் 93 ரன்கள் என பராக் பேட்டிங் மோசமாகவே இருந்தது. இதனால் அணியில் இருந்தாலும் பல போட்டிகளில் ப்ளேயிங் லெவனில் இடம் பெறவில்லை. ஆனால், கடந்த ஆண்டில் உள்நாட்டுப் போட்டிகளில் ரியான் பாராக் தீவிரமான ஆட்டத்தால் கிடைத்த அனுபவம் ஆங்கர் ரோல் எடுத்து அணியை இக்கட்டான நிலையில் இருந்து மீ்ட்டுள்ளது. 2024 சீசன் தொடங்கியதில் இருந்தே பராக்கின் பேட்டிங்கில் முதிர்ச்சியும், பொறுப்புணர்வும் அதிகம் இருந்ததைக் காண முடிந்தது. முதல் ஆட்டத்திலும் கேப்டன் சஞ்சுவுடன் சேர்ந்து பராக் 93 ரன்கள் பார்ட்னர்ஷிப் அமைத்தது பெரிய ஸ்கோருக்கு கொண்டு சென்றது. அந்த ஆட்டத்திலும் பராக் 29 பந்துகளில் 43 ரன்கள் சேர்த்தார். இரு போட்டிகளிலும் தன்னுடைய ஆட்டத்தின் முதிர்ச்சியை, பொறுப்புணர்வை பராக் வெளிப்படுத்தியுள்ளார். அது மட்டுமல்லாமல் கடந்த 3 நாட்களாக ரியான் பராக்கிற்கு கடும் காய்ச்சல், உடல்வலி இருந்துள்ளது.ஆனால், மாத்திரைகளை மட்டும் உட்கொண்டு, அந்த உடல் களைப்போடு நேற்றைய ஆட்டத்தில் பராக் விளையாடினார் என ராஜஸ்தான் நிர்வாகம் தெரிவித்துள்ளது.   பட மூலாதாரம்,GETTY IMAGES தாயின் முன் சிறப்பாக ஆடியது மகிழ்ச்சி ஆட்டநாயகன் விருது வென்ற ரியான் பராக் பேசுகையில் “ என்னுடைய உணர்ச்சிப் பெருக்கு அடங்கிவிட்டது, என்னுடைய தாய் இந்த ஆட்டத்தை இங்கு வந்து நேரில் பார்த்தால் அவர் முன் சிறப்பான ஆட்டத்தை வெளிப்படுத்தி இருக்கிறேன். என்னை இங்கு கொண்டுவருவதற்கு அவர் பல போராட்டங்களை சந்தித்துள்ளார். நான் சிறப்பாக ஆடுகிறேனோ இல்லையோ, என்னுடைய திறமை என்னவென்று எனக்குத் தெரியும், அதை ஒருபோதும் மாற்றியதில்லை. உள்நாட்டுப் போட்டிகளில் அதிகமான போட்டிகளில் பங்கேற்றேன், அதிகமான ரன்களும் குவித்தேன். டாப்-4 பேட்டராக வருபவர் ஆட்டத்தை கடைசிவரை எடுத்துச் செல்ல வேண்டும் அதை செய்திருக்கிறேன். முதல் ஆட்டத்தில் கேப்டன் சஞ்சுவுடன் சேர்ந்து நல்ல பார்ட்னர்ஷிப் அமைத்தேன். இன்று சஞ்சு செய்த பணியை நான் செய்தேன். நான் 3 நாட்களாக உடல்நிலை சரியில்லாமல் மருத்துவமனையில் இருந்தேன். இந்த ஆட்டத்துக்காக கடினமாக உழைத்துள்ளேன். என்னால் விளையாட முடியும் என மனதை தயார் செய்து பேட் செய்தேன்” எனத் தெரிவித்தார். ஆட்டத்தை திருப்பிய பந்துவீச்சாளர்கள் ஒரு கட்டத்தில் ஆட்டம் டெல்லி கேபிடல்ஸ் கையில்தான் இருந்தது. அதை அவர்களிடம் இருந்து பறித்தது ராஜஸ்தான் பந்துவீச்சாளர்கள்தான். கடைசி 5 ஓவர்களில் டெல்லி வெற்றிக்கு 60 ரன்கள் தேவைப்பட்டது. 16-வது ஓவரை வீசிய சஹல் 6 ரன்கள் மட்டுமே கொடுத்து அபிஷேக் போரெல் விக்கெட்டை கைப்பற்றினார். அஸ்வின் வீசிய 17-வது ஓவரில் டெல்லி பேட்டர் ஸ்டெப்ஸ் 2 சிக்ஸர்கள் உள்பட 19 ரன்கள் சேர்த்தால் ஆட்டம் பரபரப்பானது. ஆவேஷ் கான் 18-வது ஓவரை வீசியபோது, ஸ்டெப்ஸ் ஒரு பவுண்டரி உள்பட 9 ரன்களைச் சேர்த்து அணியை வெற்றி நோக்கி நகர்த்தினார். கடைசி இரு ஓவர்களில் டெல்லி வெற்றிக்கு 32 ரன்கள் தேவைப்பட்டது. சந்தீப் சர்மா வீசிய 19-வது ஓவரில் முதல் இருபந்துகளில் பவுண்டரி, சிக்ஸர் என ஸ்டெப்ஸ் பறக்கவிட்டதால் ஆட்டம் டெல்லி பக்கம் சென்றது.அந்த ஓவரில் டெல்லி 15 ரன்கள் சேர்த்தது. கடைசி ஓவரில் டெல்லி வெற்றி பெற 17 ரன்கள் தேவைப்பட்டது.   பட மூலாதாரம்,GETTY IMAGES டெத்ஓவர் ஸ்பெஷலிஸ்ட் கடந்த முதல் ஆட்டத்திலும் டெத் ஓவரில் கடைசி ஓவரை ஆவேஷ்கான் வீசி வெற்றி தேடித்தந்ததால் இந்த முறையும் கேப்டன் சஞ்சு, ஆவேஷ் கானை பயன்படுத்தினார். கடைசி ஓவரை ஆவேஷ்கான் மிக அற்புதமாக வீசினார். நல்ல ஃபார்மில் இருந்த ஸ்டெப்ஸை ஒரு பவுண்டரி, சிக்ஸர்கூட அடிக்கவிடாமல், 3 பந்துகளை அவுட்சைட் ஆஃப்ஸ்டெம்பிலும் வீசினார். 4வது பந்தை ஸ்லாட்டில் வீசியும் ஸ்டெப்ஸ் அடிக்கவில்லை. 5-வது பந்தை ஃபுல்டாசாகவும், கடைசிப்பந்தில் ஃபுல்டாசாக வீசி டெல்லி பேட்டர்களை கட்டிப்போட்டார் ஆவேஷ் கான். அதிரடியாக ஆடிய அஸ்வின் நெருக்கடியான கட்டத்தில் பேட்டிங் வரிசையில் தரம் உயர்த்தப்பட்டு நடுவரிசையில் அஸ்வின் நேற்று களமிறக்கப்பட்டார். ரியான் பராக்கிற்கு நல்ல ஒத்துழைப்பு அளித்து அஸ்வின் ஸ்ட்ரைக்கை மாற்றி, 54 ரன்கள் பார்ட்னர்ஷிப்பும் அமைத்துக் கொடுத்தார். ரியான் பராக் தன்னுடைய முதல்பாதி இன்னிங்ஸில் ரன் சேர்க்க திணறினார், ஆனால் அஸ்வின் அனாசயமாக 3 சிக்ஸர்களை வெளுத்தார். குறிப்பாக குல்தீப், நோர்க்கியா ஓவர்களில் அஸ்வின் 3 சிக்ஸர்களைப் பறக்கவிட்டார். அஸ்வின் அடித்த திடீர் சிக்ஸால்தான் ராஜஸ்தான் ரன்ரேட் 6 ரன்களைக் கடந்தது. அஸ்வின் தன்னுடைய பணியில் சிறிதும் குறைவி்ல்லாமல் சிறிய கேமியோ ஆடி 19 பந்துகளில் 29 ரன்கள் சேர்த்து பெவிலியன் சென்றார்.   பட மூலாதாரம்,GETTY IMAGES டெல்லிக்கு தொல்லையாகிய சஹல் ராஜஸ்தான் அணி தொடக்கத்திலேயே பர்கர், போல்ட் இருவருக்கும் 6 ஓவர்களை வீசச் செய்து பவர்ப்ளேயோடு முடித்துவிட்டது. இதனால் 14 ஓவர்கள்வரை நல்ல ஸ்கோர் செய்யலாம் என டெல்லி பேட்டர்கள் நினைத்திருக்கலாம். டேவிட் வார்னரும் களத்தில் இருந்தார். ஆனால், ஆவேஷ் கான் ஆஃப் சைடில் விலக்கி வீசி வார்னரை அடிக்கச் செய்து ஆட்டமிழக்கச் செய்தார். மிக அருமையாக பந்துவீசிய சஹல் இரு இடதுகை பேட்டர்களான கேப்டன் ரிஷப் பந்த், போரெல் இருவரையும் வெளியேற்றினார். 4 ஓவர்கள் வீசிய சஹல் 19 ரன்கள் கொடுத்து ஒரு விக்கெட்டை வீழ்த்தினார், இவரின் பந்துவீச்சில் ஒரு சிக்ஸர் மட்டுமே அடிக்க முடிந்தது, பவுண்டரி ஒன்றுகூட அடிக்கவில்லை. சஹல் 7 டாட் பந்துகளையும் வீசியதை கணக்கிட்டால் 2 ஓவர்களில்தான் சஹல் 19 ரன்களை வழங்கியுள்ளார். இரு முக்கியமான பேட்டர்களை சஹல் தனது பந்துவீச்சின் மூலம் வெளியேற்றியது டெல்லி அணிக்கு பெரிய பின்னடைவாக மாறியது. நடுங்கவைத்த பர்கர் ராஜஸ்தான் அணிக்கு இந்த சீசனில் கிடைத்த பெரிய பலம் டிரென்ட் போல்ட், ஆன்ட்ரூ பர்கர் ஆகிய இரு இடதுகை வேகப்பந்துவீச்சாளர்கள்தான். போல்ட் இந்த ஆட்டத்தில் விக்கெட் ஏதும் எடுக்காவிட்டாலும், பர்கர் இரு விக்கெட்டுகளை வீழ்த்தினார். அதிலும் ரிக்கி புயிக்கு பர்கர் வீசிய பவுன்ஸர் சற்று தவறியிருந்தால் ஹெல்மெட்டை பதம் பார்த்திருக்கும், ஆனால், கிளவ்வில் பட்டு சாம்சனிடம் கேட்சானது. அதேபோல நல்ல ஃபார்மில் இருந்த மார்ஷ்(23) விக்கெட்டையும் பர்கர் தனது அதிவேகப்பந்துவீச்சில் வீழ்த்தினார். தொடக்கத்திலேயே மார்ஷ், ரிக்கி புயி விக்கெட்டுகளை வீழ்த்தி டெல்லிக்கு பெரிய சேதாராத்தை பர்கர் ஏற்படுத்தினார். மணிக்கு சராசரியாக 148கி.மீ வேகத்தில் பந்துவீசும் பர்கர், பெரும்பாலான பந்துகளை துல்லியமாக, லைன் லென்த்தில் கட்டுக்கோப்பாக வீசுவது ராஜஸ்தான்அணிக்க பெரிய பலம்.   பட மூலாதாரம்,GETTY IMAGES வாய்ப்புகளை தவறவிட்ட டெல்லி அணி டெல்லி அணி பந்துவீச்சிலும்சரி, பேட்டிங்கிலும் சரி கிடைத்த வாய்ப்புகளை சரியாகப் பயன்படுத்தி இருந்தால் வெற்றி கிடைத்திருக்கும். பந்துவீச்சில் தொடக்கத்திலேயே ராஜஸ்தான் பேட்டர்கள் ஜெய்ஸ்வால்(5), பட்லர்(11), சாம்ஸன்(15) என 3 முக்கிய பேட்டர்களையும் முகேஷ் குமார், குல்தீப், கலீல் அகமது வீழ்த்திக் கொடுத்தனர். இந்த நெருக்கடியை தொடர்ந்து ஏற்படுத்தி தக்கவைத்திருந்தால், ராஜஸ்தான் அணி ஸ்கோர் 120 ரன்களை கடந்திருக்காது. 14 ஓவர்கள் வரை ராஜஸ்தான் அணி 100 ரன்களைக் கூட கடக்கவில்லை. ஆனால், கடைசி 5 ஓவர்களில் அதிலும் டெத் ஓவர்ளில் டெல்லி பந்துவீச்சு மோசமானதை, பராக் பயன்படுத்தி வெளுத்து வாங்கினார். கலீல் அகமது, அக்ஸர் படேல் தவிர எந்தப் பந்துவீச்சாளரும் வாய்ப்பைப் பயன்படுத்தவில்லை. அதேபோல பேட்டிங்கிலும், பவர்ப்ளேயில் 59 ரன்களும், 12 ஓவர்களில் 100 ரன்களை எட்டி டெல்லி அணி வெற்றி நோக்கி சீராக சென்றது. ஆனால், ஒரு கட்டத்தில் ரிஷப் பந்த், போரெல், வார்னர் ஆகியோர் 25 ரன்களுக்குள் அடுத்தடுத்து ஆட்டமிழந்தது டெல்லிக்கு பின்னடைவாக மாறியது. கடைசி 5 ஓவர்களில் 60 ரன்களை எட்டுவதற்கும் ஸ்டெப்ஸ் கடுமையாக முயன்று வெற்றிக்கு அருகே கொண்டு சென்றார். ஸ்டெப்ஸுடன் நல்ல பவர் ஹிட்டர் பேட்டர் இருந்தால் ஆட்டம் திசைமாறியிருக்கும். டெல்லி அணியில் வார்னர்(49), ஸ்டெப்ஸ்(44) தவிர எந்த பேட்டரும் பெரிதாக ஸ்கோர் செய்யவில்லை. https://www.bbc.com/tamil/articles/clm7pvlmprko
  • Our picks

    • மனவலி யாத்திரை.....!

      (19.03.03 இக்கதை எழுதப்பட்டது.2001 பொங்கலின் மறுநாள் நிகழ்ந்த ஒரு சம்பவத்தின் நினைவாக பதிவிடப்பட்டது இன்று 7வருடங்கள் கழித்து பதிவிடுகிறேன்)

      அந்த 2001 பொங்கலின் மறுநாள் அவனது குரல்வழி வந்த அந்தச் செய்தி. என் உயிர் நாடிகளை இப்போதும் வலிக்கச் செய்கிறது. அது அவனுக்கும் அவனது அவர்களுக்கும் புதிதில்லைத்தான். அது அவர்களின் இலட்சியத்துக்கு இன்னும் வலுச்சேர்க்கும். ஆனால் என்னால் அழாமல் , அதைப்பற்றி எண்ணாமல் , இனிவரும் வருடங்களில் எந்தப் பொங்கலையும் கொண்டாட முடியாதபடி எனக்குள் அவனது குரலும் அவன் தந்த செய்திகளும் ஒலித்துக் கொண்டேயிருக்கும்.
      • 1 reply
    • பாலியல் சுதந்திரமின்றி பெண்விடுதலை சாத்தியமில்லை - செல்வன்


      Friday, 16 February 2007

      காதலர் தினத்தை வழக்கமான தமது அரசியல் நிலைபாடுகளை பொறுத்து அணுகும் செயலை பல்வேறு தரப்பினரும் உற்சாகமாக செய்து வருகின்றனர்.கிரீட்டிங் கார்டுகளையும், சாக்லடுகளையும் விற்க அமெரிக்க கம்பனிகள் சதி செய்வதாக கூறி காம்ரேடுகள் இதை எதிர்த்து வருகின்றனர்.அமெரிக்க கலாச்சாரத்தை திணிக்க முயற்சி நடப்பதாக கூறி சிவசேனாவினரும் இதை முழுமூச்சில் எதிர்க்கின்றனர். தமிழ்நாட்டில் பாமக ராமதாஸ் இதை கண்டித்து அறிக்கை விட்டுள்ளார். பாகிஸ்தானிலும், அரபுநாடுகளிலும் இதை எதிர்த்து பத்வாக்கள் பிறப்பிக்கப்பட்டு அதை மீறி இளைஞர்கள் இதை கொண்டாடியதாக செய்திகள் வந்துள்ளன.
      • 19 replies
    • எனக்குப் பிடித்த ஒரு சித்தர் பாடல் (எந்தச் சித்தர் என்று மறந்து விட்டேன். கட்டாயம் தேவை என்றால் சொல்லுங்கள் எனது ஓலைச் சுவடிகளை புரட்டிப்பார்த்து பின்னர் அறியத் தருகிறேன்)

      நட்ட கல்லைத் தெய்வம் என்று நாலுபுட்பம் சாத்தியே
      சுற்றி வந்து முணுமுணென்று கூறுமந்த்ரம் ஏனடா
      நட்ட கல்லும் பேசுமோ நாதன் உள்ளிருக்கையில்
      சுட்ட சட்டி தட்டுவம் கறிச்சுவை அறியுமோ?


      பொருள்:
      சூளையில் வைத்துச் சுட்டுச் செய்த மண் பாத்திரத்தில் வைக்கும் கறியின் சுவை எப்படியானது என்று அந்தப் பாத்திரத்துக்கு விளங்குமா? அது போல, எம்முள்ளே எருக்கும் இறைவனை நீ அறியாமல் ஒரு கல்லினுள் கடவுள் இருப்பதாக நம்பி வெறும் கல்லை அராதித்து வழிபடுகிறாய்.
      • 4 replies
    • களத்தில் தற்போது சமயம் சம்ம்பந்தமாக பெரியா கருத்து பரிமாற்றம் நடக்கிறது, அங்கே கருத்தாடு பெரியவர்களே, அறிஞோர்களே உங்களால் இறைவன் இருக்கார் என்று ஆதாரத்துடன் நிரூபிக்க முடியுமா...........? முடிந்தால் நிரூபியூங்கள், நிரூபித்து விட்டு உங்கள் கருத்து மோதலை தொடருங்கள்
      • 37 replies
    • சமூகத்துக்கு பயனுடைய கல்விநிலை எது?

      பேராசிரியர் சோ. சந்திரசேகரன்

      இன்று நாட்டில் உள்ள கல்விமுறையையும் அதற்கு அப்பால் உள்ள கல்வி ஏற்பாடுகளையும் நோக்குமிடத்து, பல்வேறு கல்வி நிலைகளை இனங்காண முடியும். அவையாவன: ஆரம்பக்கல்வி, இடைநிலைக் கல்வி, பல்கலைக்கழகக் கல்வி உள்ளடங்கிய உயர் கல்வி, பாடசாலையில் வழங்கப்படும் (1-11 ஆம் வகுப்பு வரை) பொதுக்கல்வி, தொழில்நுட்பக்கல்வி, வளர்ந்தோர் கல்வி என்பன, இவை தவிர கருத்தாக்க ரீதியாக முறைசாராக் கல்வி, வாழ்க்கை நீடித்த கல்வி, தொடர்கல்வி எனப் பலவற்றை இனங்காண முடியும். இவற்றில் ஆரம்பக்கல்வி, இடைநிலைக்கல்வி, உயர்கல்வி என்னும் கல்வி நிலைகளே முறைசார்ந்த (Formal) கல்வியின் பிரதான நிலைகள் அல்லது கூறுகளாகும்.
      • 5 replies
×
×
  • Create New...

Important Information

By using this site, you agree to our Terms of Use.