Course 01 – Data Analytics / Data Science Basics

Module 01 – Data Science හැඳුනුම

Data Analytics ලෝකයට ඔබව සාදරයෙන් පිළිගනිමු! මෙම පළමු මොඩියුලය තුළින්, අපි දත්ත විද්‍යාවේ මූලිකම සංකල්ප, එහි වැදගත්කම, සහ එය අපගේ දෛනික ජීවිතයට බලපාන ආකාරය පිළිබඳව පුළුල් අවබෝධයක් ලබා ගනිමු. අද ලෝකයේ 'දත්ත' යනු නව රත්‍රන් (Data is the new oil) ලෙස සලකන්නේ ඇයි දැයි අපි මෙහිදී ඉගෙන ගනිමු.


දත්ත විශ්ලේෂණය (Data Analytics) කියන්නේ මොකක්ද?

සරලවම කිවහොත්, **දත්ත විශ්ලේෂණය යනු අමු දත්ත (raw data) ගෙන, ඒවායින් වටිනා තොරතුරු, නිගමන සහ තීරණ ගැනීමට උපකාරී වන රටා (patterns) සොයා ගැනීමේ ක්‍රියාවලියයි.**

මෙය හරියට රහස් පරීක්ෂකයෙක් අපරාධයක් විසඳනවා වගේ වැඩක්. රහස් පරීක්ෂකයා විවිධ හෝඩුවාවන් (clues) එකතු කර, ඒවා එකිනෙක ගලපා, අපරාධය පිළිබඳව සම්පූර්ණ චිත්‍රයක් මවා ගන්නවා. ඒ ආකාරයටම, දත්ත විශ්ලේෂකයෙක් (Data Analyst) දත්ත එකතු කර, ඒවා පිරිසිදු කර, විශ්ලේෂණය කර, ව්‍යාපාරයකට හෝ ආයතනයකට වැදගත් වන තොරතුරු එළියට ගන්නවා.

මෙම ක්‍රියාවලිය ප්‍රධාන පියවර කිහිපයකින් සමන්විතයි:

  • දත්ත එකතු කිරීම (Data Collection): පාරිභෝගික සමීක්ෂණ, වෙබ් අඩවි වල ක්‍රියාකාරකම්, විකුණුම් වාර්තා වැනි විවිධ මූලාශ්‍ර වලින් දත්ත ලබා ගැනීම.
  • දත්ත පිරිසිදු කිරීම (Data Cleaning): එකතු කරගත් දත්ත වල ඇති වැරදි, අඩුපාඩු, සහ අනවශ්‍ය කොටස් ඉවත් කර විශ්ලේෂණයට සූදානම් කිරීම.
  • දත්ත විශ්ලේෂණය (Data Analysis): විවිධ සංඛ්‍යානමය ක්‍රම සහ මෙවලම් භාවිතා කර දත්ත තුළ ඇති සම්බන්ධතා සහ රටා හඳුනා ගැනීම.
  • දත්ත අර්ථ නිරූපණය සහ වාර්තා කිරීම (Data Interpretation & Reporting): සොයාගත් තොරතුරු ප්‍රස්තාර සහ වාර්තා මගින් සරලව තේරුම් ගත හැකි ආකාරයට ඉදිරිපත් කිරීම.

Data Science vs Data Analytics vs Machine Learning

මෙම වචන තුන බොහෝ විට එකිනෙක මාරු කර භාවිතා කළත්, ඒවා අතර පැහැදිලි වෙනස්කම් තිබෙනවා. අපි ඒවා වෙන් වෙන්ව හඳුනා ගනිමු.

Data Analytics (දත්ත විශ්ලේෂණය)

මෙහිදී ප්‍රධාන වශයෙන් අවධානය යොමු කරන්නේ අතීතයේ සහ වර්තමානයේ සිදු වූ දේ පිළිබඳවයි. "ගිය මාසයේ අපේ විකුණුම් වැඩි වුනේ ඇයි?" "වඩාත්ම ජනප්‍රිය නිෂ්පාදනය කුමක්ද?" වැනි ප්‍රශ්න වලට පිළිතුරු සපයයි. මෙහි අරමුණ වන්නේ දැනටමත් පවතින දත්ත වලින් ව්‍යාපාරික තීරණ ගැනීමට අවශ්‍ය තොරතුරු ලබා දීමයි.

Data Science (දත්ත විද්‍යාව)

මෙය Data Analytics වලට වඩා පුළුල් ක්ෂේත්‍රයකි. අතීත දත්ත විශ්ලේෂණයට අමතරව, අනාගතය පිළිබඳව අනාවැකි (predictions) පළ කිරීමට දත්ත විද්‍යාව යොදා ගැනේ. "ලබන කාර්තුවේදී අපේ විකුණුම් කොපමණ වේවිද?" "කුමන පාරිභෝගිකයන් අපව අතහැර යාමට ඉඩ තිබේද?" වැනි ප්‍රශ්න වලට පිළිතුරු සෙවීම මෙහිදී සිදු වේ. இதற்காக ಸಂಖ్యాනය, පරිගණක විද්‍යාව සහ Machine Learning වැනි ක්ෂේත්‍ර ගණනාවක දැනුම භාවිතා කරයි.

Machine Learning (යන්ත්‍ර ඉගෙනුම)

මෙය දත්ත විද්‍යාවේ (Data Science) භාවිතා වන එක් ප්‍රබල මෙවලමකි. මෙහිදී සිදු කරන්නේ, පරිගණක වැඩසටහන් වලට විශාල දත්ත ප්‍රමාණයක් ලබා දී, එම දත්ත වලින් ස්වයංක්‍රීයව ඉගෙන ගෙන, රටා හඳුනාගෙන, අනාවැකි පළ කිරීමට හෝ තීරණ ගැනීමට පුහුණු කිරීමයි. උදාහරණයක් ලෙස, ඊමේල් පද්ධතියක් 'Spam' සහ 'Not Spam' ලෙස ඊමේල් වෙන් කිරීමට ඉගෙන ගන්නේ Machine Learning ඇල්ගොරිතමයක් මගිනි.

කෙටියෙන් කිවහොත්: Data Analytics අතීතය පැහැදිලි කරයි, Data Science අනාගතය ගැන අනාවැකි කියයි, Machine Learning යනු එම අනාවැකි කීමට යොදාගන්නා එක් ප්‍රධාන තාක්ෂණයකි.


Real-world උදාහරණ (ප්‍රායෝගික යෙදවුම්)

දත්ත විශ්ලේෂණය අප වටා සෑම තැනකම තිබේ. මෙන්න ප්‍රධාන ක්ෂේත්‍ර කිහිපයක උදාහරණ:

ව්‍යාපාර (Business)

Netflix හෝ YouTube ඔබට නැරඹීමට චිත්‍රපට හෝ වීඩියෝ නිර්දේශ කරන්නේ ඔබ මීට පෙර නැරඹූ දේ විශ්ලේෂණය කිරීමෙනි. Keells හෝ Cargills වැනි සුපිරි වෙළඳසැල්, කුමන භාණ්ඩ රාක්කවල තැබිය යුතුද, මිල අඩු කළ යුත්තේ කවදාද යන්න තීරණය කරන්නේ පාරිභෝගිකයන් භාණ්ඩ මිලදී ගන්නා රටාවන් විශ්ලේෂණය කිරීමෙනි.

සෞඛ්‍ය (Healthcare)

රෝගීන්ගේ දත්ත (වෛද්‍ය වාර්තා, පරීක්ෂණ ප්‍රතිඵල) විශ්ලේෂණය කර, යම් රෝගයක් පැතිරීමේ අවදානමක් ගැන කලින්ම අනාවැකි පළ කිරීමට හැකිය. එමෙන්ම, රෝගියෙකුට වඩාත්ම ගැලපෙන ප්‍රතිකාර ක්‍රමය තීරණය කිරීමටද දත්ත විශ්ලේෂණය උපකාරී වේ.

මූල්‍ය (Finance)

බැංකු විසින් ක්‍රෙඩිට් කාඩ්පත් ගනුදෙනු විශ්ලේෂණය කර, සාමාන්‍ය රටාවෙන් බැහැර වන වංචනික ගනුදෙනු (fraudulent transactions) ක්ෂණිකව හඳුනා ගනී. කොටස් වෙළඳපොලේ මිල ගණන් ඉහළ පහළ යන ආකාරය විශ්ලේෂණය කර ආයෝජන තීරණ ගැනීමටද මෙය යොදා ගනී.

අධ්‍යාපනය (Education)

ශිෂ්‍යයන්ගේ ලකුණු සහ පැමිණීම වැනි දත්ත විශ්ලේෂණය කර, ඉගෙනීමේ දුර්වලතා ඇති ශිෂ්‍යයන් කලින්ම හඳුනාගෙන ඔවුන්ට විශේෂ අවධානය යොමු කිරීමට ගුරුවරුන්ට පුළුවන. පාඨමාලා අන්තර්ගතය වඩාත් ඵලදායී ලෙස සකස් කිරීමටද මෙය උපකාරී වේ.

මෙම Module එකේදී...
  • දත්ත විශ්ලේෂණයේ අර්ථ දැක්වීම.
  • Data Science සහ Analytics අතර වෙනස.
  • Machine Learning වල කාර්යභාරය.
  • සැබෑ ලෝකයේ ප්‍රායෝගික යෙදවුම්.