Python හි විද්යාත්මක සහ සංඛ්යාත්මක ගණනය කිරීම් වල අත්තිවාරම.
NumPy යනු Python සඳහා ඇති මූලිකම library එකකි. එහි ප්රධානම අංගය වන්නේ `ndarray` (N-dimensional array) නමැති බලවත් දත්ත ව්යුහයයි. සරලව කිවහොත්, NumPy යනු Python වලට "ගණිතමය සුපිරි බලයක්" ලබා දෙන මෙවලමකි.
සාමාන්ය Python list එකකට වඩා NumPy array එකක් ඉතා වේගවත් වන අතර, මතකයද වඩාත් කාර්යක්ෂමව භාවිතා කරයි. AI, Data Science, සහ ඉංජිනේරු විද්යාවේදී සිදුකරන මිලියන ගණනක් වන ගණනය කිරීම් සඳහා NumPy අත්යවශ්ය වේ.
NumPy හි ගණනය කිරීම් C වැනි වේගවත් භාෂාවලින් ලියා ඇති නිසා, සාමාන්ය Python වලට වඩා 50x හෝ ඊටත් වඩා වේගවත් වේ.
Mean, Median, Standard Deviation වැනි සංඛ්යානමය ශ්රිත වල සිට, Matrix Algebra සඳහා අවශ්ය සියලුම මෙවලම් NumPy සතුව ඇත.
Pandas, Scikit-learn, TensorFlow වැනි සියලුම ප්රධාන Data Science සහ AI libraries නිර්මාණය කර ඇත්තේ NumPy මත පදනම්වය.
විවිධ ක්රම භාවිතයෙන් NumPy arrays නිර්මාණය කළ හැක.
import numpy as np
# A. Python list එකකින්
arr_from_list = np.array([1, 2, 3, 4, 5])
print(f"List වලින්: {arr_from_list}")
# B. নির্দিষ্ট පරාසයක සංඛ්යා (range) - np.arange(start, stop, step)
arr_arange = np.arange(0, 10, 2) # 0 සිට 10 දක්වා 2න් 2ට
print(f"arange වලින්: {arr_arange}")
# C. බිංදු (zeros) සහ එක (ones) වලින් පිරවූ arrays
arr_zeros = np.zeros((2, 3)) # පේළි 2ක් සහ තීරු 3ක් ඇති බිංදු matrix එකක්
arr_ones = np.ones(5)
print(f"Zeros array:\n{arr_zeros}")
# D. අහඹු සංඛ්යා (random numbers)
arr_random = np.random.rand(3, 3) # 0 සහ 1 අතර අහඹු සංඛ්යා matrix එකක්
print(f"Random array:\n{arr_random}")
NumPy මගින් array එකක ඇති සියලුම உறுப்புகள் මත එකවර ගණනය කිරීම් කිරීමට ඉඩ සලසයි (loop අවශ්ය නොවේ). මෙය "Vectorization" ලෙස හැඳින්වේ.
arr = np.array([10, 20, 30, 40, 50])
# සෑම අගයකටම 5ක් එකතු කිරීම
print("Addition:", arr + 5)
# සෑම අගයකම වර්ගමූලය ගැනීම
print("Square Root:", np.sqrt(arr))
Python lists වල මෙන්, array වල ඇති දත්ත වලටද index අංකය මගින් ප්රවේශ විය හැක. නමුත් NumPy වලදී මෙය වඩාත් බලවත් වේ.
# 2D Array එකක් (Matrix)
matrix = np.array([
[11, 12, 13, 14],
[21, 22, 23, 24],
[31, 32, 33, 34],
[41, 42, 43, 44]
])
# දෙවන පේළිය, තුන්වන තීරුවේ ඇති අගය (row 1, column 2)
element = matrix[1, 2] # ප්රතිඵලය: 23
print(f"Element at (1,2): {element}")
# කොටසක් (sub-matrix) ලබා ගැනීම (Slicing)
# පේළි 1 සහ 2, තීරු 2 සහ 3 ලබාගැනීම
sub_matrix = matrix[1:3, 2:4]
print(f"Sub-matrix:\n{sub_matrix}")
# කොන්දේසියක් මත පදනම්ව දත්ත තේරීම (Boolean Indexing)
# matrix එකේ 30ට වඩා වැඩි සියලුම අගයන්
greater_than_30 = matrix[matrix > 30]
print(f"30ට වඩා වැඩි අගයන්: {greater_than_30}")
NumPy හි ඇති `sum`, `mean`, `std` වැනි ශ්රිත, සම්පූර්ණ array එකට හෝ නිශ්චිත අක්ෂයක් (axis) දිගේ යෙදිය හැක. `axis=0` යනු තීරු (columns) දිගේ වන අතර `axis=1` යනු පේළි (rows) දිගේ වේ.
data = np.array([
[80, 85], # ශිෂ්යයා 1: ගණිතය, විද්යාව ලකුණු
[92, 88], # ශිෂ්යයා 2
[75, 79] # ශිෂ්යයා 3
])
# සම්පූර්ණ array එකේ සාමාන්යය
print(f"සමස්ත සාමාන්යය: {np.mean(data):.2f}")
# එක් එක් විෂයෙහි සාමාන්ය ලකුණු (තීරු දිගේ)
subject_means = np.mean(data, axis=0)
print(f"විෂයයන්ගේ සාමාන්ය (ගණිතය, විද්යාව): {subject_means}")
# එක් එක් ශිෂ්යයාගේ සාමාන්ය ලකුණු (පේළි දිගේ)
student_means = np.mean(data, axis=1)
print(f"ශිෂ්යයන්ගේ සාමාන්ය: {student_means}")
Machine Learning වලදී දත්ත, මොඩලයට අවශ්ය ආකෘතියට (format) ගැලපීම සඳහා `reshape` ශ්රිතය නිතරම භාවිතා වේ. උදාහරණයක් ලෙස, රූපයක් යනු 2D array එකක් වන අතර, එය මොඩලයට ලබා දීමට පෙර 1D array එකක් බවට පත් කිරීමට අවශ්ය විය හැක.
# 1 සිට 12 දක්වා සංඛ්යා ඇති 1D array එකක්
long_array = np.arange(1, 13)
print(f"මුල් array එක: {long_array.shape} -> {long_array}")
# එය පේළි 3ක් සහ තීරු 4ක් ඇති 2D array (matrix) එකක් බවට පත් කිරීම
reshaped_matrix = long_array.reshape(3, 4)
print(f"නව හැඩය: {reshaped_matrix.shape}\n{reshaped_matrix}")
Machine learning මොඩලයක් පුහුණු කිරීමට පෙර, විවිධ ඒකක සහ පරාසයන් ඇති දත්ත (උදා: වයස (10-80) සහ ආදායම (50,000-5,000,000)) එකම පරිමාණයකට ගෙන ඒම ඉතා වැදගත් වේ. මෙය "Normalization" හෝ "Standardization" ලෙස හැඳින්වේ. NumPy භාවිතයෙන් මෙය පහසුවෙන් කළ හැක.
ප්රමිතිකරණ සූත්රය: $ Z = \frac{X - \mu}{\sigma} $ (මෙහි $\mu$ යනු මධ්යන්යය වන අතර $\sigma$ යනු සම්මත අපගමනයයි)
# උදාහරණ දත්ත: පුද්ගලයන් 5 දෙනෙකුගේ වයස සහ ආදායම (ලක්ෂ වලින්)
# තීරු: [වයස, ආදායම]
feature_data = np.array([
[25, 4.9],
[45, 8.0],
[30, 6.5],
[52, 11.0],
[22, 3.5]
])
# 1. එක් එක් තීරුවේ (feature) මධ්යන්යය (mean) ගණනය කිරීම
mean_values = np.mean(feature_data, axis=0)
print(f"Mean (වයස, ආදායම): {mean_values}")
# 2. එක් එක් තීරුවේ සම්මත අපගමනය (std dev) ගණනය කිරීම
std_values = np.std(feature_data, axis=0)
print(f"Std Dev (වයස, ආදායම): {std_values}")
# 3. Vectorization භාවිතයෙන් දත්ත ප්රමිතිකරණය කිරීම
normalized_data = (feature_data - mean_values) / std_values
print(f"\nප්රමිතිකරණය කළ දත්ත:\n{normalized_data.round(2)}")
# ප්රතිඵලය සැලකිල්ලට ගන්න: දැන් සියලුම දත්ත ආසන්න වශයෙන් -2 සහ +2 අතර කුඩා පරාසයක පවතී.
# මෙමගින් AI මොඩලයට සියලුම features වලට සමාන වැදගත්කමක් ලබා දීමට හැකිවේ.
NumPy යනු Python හි දත්ත විද්යාවේ සහ AI හි කොඳු නාරටියයි. එහි වේගවත්, කාර්යක්ෂම array ව්යුහය, vectorization හැකියාව සහ බලවත් ගණිතමය ශ්රිත නිසා, දත්ත සැකසීමේ සිට සංකීර්ණ AI මොඩල නිර්මාණය දක්වා සෑම පියවරකදීම එය අත්යවශ්ය මෙවලමකි.