This is an old revision of the document!
தமிழ் - ஒளி உரு படிப்பி (Tamil -Optical Character Reader)
முன்னுரை
கணினியின் பரவலான செயல்பாட்டிர்க்கு பிரகு பெரும் அளவிலான தமிழ் நூல்களும் கோப்புகளும் இலக்கமுறைஆக்கப்பட்டு இருக்கின்றன. ஆனால் இவற்றுள் பெரும்பான்மையான தரவுக்ள் புகைபட வடிவிலேயே உள்ளன. இதனால் அப்பதிவுகளை மாற்றத்திரற்க்கு உட்படுத்த கடினமாக உள்ளது. இப்பதிவுகளை மாற்றதக்க எழுத்து வடிவிற்க்கு கொண்டு வருவதே இந்த திட்டம். இந்த தரவுகள் கையால் எழுதப்பட்டவையோ அல்லது தட்டச்சு செய்யப்பட்டவையாக கூட இருக்கலம். இது போண்று ஏல்லா வகையான தரவிலிருந்தும்,செயற்கை அறிவாற்றலைக் கொண்டு எழுத்துக்களை பிரிதெடுப்பதே இந்த முயற்சி.
மாதிரி தரவுகள்:
1) http://www.jfn.ac.lk/index.php/data-sets-printed-tamil-characters-printed-documents/
இன்னும் நிறைய மாதிரி தரவுகள் தேவை படுகின்றன, எனவே அதை புகைபடவடிவில் திரட்ட திட்டமிடபட்டுள்ளது , யாரேனும் உதவ விருபப்பட்டால் இந்த திட்டம் சார்ந்த மின்அஞ்சலை அனுகலாம்
