Course 01 – Data Analytics / Data Science Basics

Module 09 – Real-World Project (Mini Project)

සුභ පැතුම්! ඔබ දැන් මෙම පාඨමාලාවේ වැදගත්ම සහ አስደሳත්ම කොටසට පැමිණ සිටිනවා. මෙතෙක් ඔබ ඉගෙනගත් සියලුම සංකල්ප—Python, Pandas, Data Cleaning, Visualization, සහ EDA—ප්‍රායෝගිකව යොදාගෙන, සැබෑ ලෝකයේ දත්ත කට්ටලයක් විශ්ලේෂණය කිරීමට කාලයයි. මෙම කුඩා ව්‍යාපෘතිය (Mini Project) මගින්, දත්ත විශ්ලේෂණ ක්‍රියාවලියක් මුල සිට අග දක්වා සිදුවන ආකාරය පිළිබඳව ඔබට සැබෑ අත්දැකීමක් ලැබෙනු ඇත.

අපි මෙම ව්‍යාපෘතිය සඳහා **ව්‍යාපාරික විකුණුම් දත්ත කට්ටලයක් (Sales Dataset)** භාවිතා කරමු. අපගේ අරමුණ වන්නේ මෙම දත්ත විශ්ලේෂණය කර, ව්‍යාපාරයේ වර්ධනයට උපකාරී වන වටිනා තොරතුරු (insights) සොයා ගැනීමයි.


ව්‍යාපෘති ක්‍රියාවලිය (Project Workflow)

ඕනෑම දත්ත විශ්ලේෂණ ව්‍යාපෘතියක් පැහැදිලි පියවර කිහිපයකට අනුව සිදු කෙරේ. අපි එම පියවර අනුගමනය කරමු.

Step 1: ව්‍යාපෘතිය තේරුම් ගැනීම සහ සූදානම් වීම (Problem Understanding & Setup)

පළමුව, අප විසඳීමට උත්සාහ කරන ගැටලුව කුමක්දැයි වටහා ගත යුතුය. අපගේ ව්‍යාපාරික කළමනාකරු අපෙන් පහත ප්‍රශ්න වලට පිළිතුරු බලාපොරොත්තු වන බව සිතමු:

  • මාසිකව අපගේ විකුණුම් වල ප්‍රවණතාවය (trend) කෙසේද?
  • වඩාත්ම අලෙවි වන නිෂ්පාදන (best-selling products) මොනවාද?
  • අපගේ විකුණුම් වැඩිපුරම සිදුවන්නේ කුමන නගර වලද?

දැන්, අපගේ Jupyter Notebook එක සූදානම් කර, අවශ්‍ය libraries import කර ගනිමු.

# Import necessary libraries import pandas as pd import matplotlib.pyplot as plt import seaborn as sns

Step 2: දත්ත ලබාගැනීම සහ මූලික ගවේෂණය (Data Loading & Initial Exploration)

අපට ලබා දී ඇති `sales_data.csv` ගොනුව Pandas DataFrame එකකට load කර, එහි මූලික තොරතුරු පරීක්ෂා කර බලමු.

# Load the dataset df_sales = pd.read_csv('sales_data.csv') # Display the first 5 rows print(df_sales.head()) # Get a summary of the dataframe print(df_sales.info())

Step 3: දත්ත පිරිසිදු කිරීම (Data Cleaning)

Module 5 හි ඉගෙනගත් පරිදි, දත්ත විශ්ලේෂණයට පෙර ඒවායේ ඇති දෝෂ නිවැරදි කළ යුතුය. අපි හිස්තැන් (missing values) සහ අනුපිටපත් (duplicates) පරීක්ෂා කර, අවශ්‍ය පිරිසිදු කිරීම් සිදු කරමු.

# Check for missing values print(df_sales.isnull().sum()) # (Optional) Fill or drop missing values if any # df_sales.dropna(inplace=True) # Check for duplicate rows print("Number of duplicates:", df_sales.duplicated().sum()) # (Optional) Drop duplicates if any # df_sales.drop_duplicates(inplace=True)

Step 4: ගවේෂණාත්මක දත්ත විශ්ලේෂණය සහ දෘශ්‍යකරණය (EDA & Visualization)

දැන් අපගේ ප්‍රශ්න වලට පිළිතුරු සෙවීමට කාලයයි. මේ සඳහා අපි දත්ත සාරාංශගත කර, ප්‍රස්තාර නිර්මාණය කරමු.

ප්‍රශ්නය 1: මාසික විකුණුම් ප්‍රවණතාවය? (Line Chart)

# We need a 'Month' column. Let's assume 'Order Date' is a column. # First, convert 'Order Date' to datetime objects df_sales['Order Date'] = pd.to_datetime(df_sales['Order Date']) df_sales['Month'] = df_sales['Order Date'].dt.month # Calculate sales per month monthly_sales = df_sales.groupby('Month')['Sales'].sum() # Plotting plt.figure(figsize=(10, 6)) sns.lineplot(x=monthly_sales.index, y=monthly_sales.values) plt.title('Monthly Sales Trend') plt.xlabel('Month') plt.ylabel('Total Sales') plt.show()

ප්‍රශ්නය 2: වඩාත්ම අලෙවි වන නිෂ්පාදන? (Bar Chart)

product_sales = df_sales.groupby('Product')['Sales'].sum().sort_values(ascending=False).head(10) plt.figure(figsize=(12, 7)) sns.barplot(x=product_sales.values, y=product_sales.index) plt.title('Top 10 Best-Selling Products') plt.xlabel('Total Sales') plt.ylabel('Product') plt.show()

Step 5: ප්‍රතිඵල අර්ථ නිරූපණය සහ වාර්තා කිරීම (Interpretation & Reporting)

අවසාන පියවර වන්නේ අපගේ විශ්ලේෂණයෙන් සොයාගත් දේ සරලව සාරාංශගත කිරීමයි.

සොයාගැනීම් (Findings):
  • මාසික ප්‍රවණතාව: Line chart එකට අනුව, අපගේ විකුණුම් වසරේ අවසාන භාගයේදී (උදා: නොවැම්බර්, දෙසැම්බර්) සැලකිය යුතු ලෙස ඉහළ යන බව පෙනේ. මෙය උත්සව සමයන් නිසා විය හැක.
  • හොඳම නිෂ්පාදන: Bar chart එකට අනුව, 'Product A' සහ 'Product B' අපගේ ආදායමෙන් වැඩිම කොටසක් උපයන බව පැහැදිලිය.
  • ප්‍රධාන නගර: (අදාළ ප්‍රස්තාරයට අනුව) අපගේ ප්‍රධාන වෙළඳපොළවල් වන්නේ 'City X' සහ 'City Y' ය.
නිර්දේශ (Recommendations):

මෙම සොයාගැනීම් මත පදනම්ව, අපට කළමනාකාරීත්වයට "වසර අවසානයේදී වැඩිපුර අලෙවි වන නිෂ්පාදන සඳහා ප්‍රවර්ධන වැඩසටහන් දියත් කිරීම" සහ "'City Z' වැනි අඩු විකුණුම් ඇති නගර වල වෙළඳපොළ පුළුල් කිරීමට අවධානය යොමු කිරීම" වැනි නිර්දේශ ඉදිරිපත් කළ හැක.

මෙම සොයාගැනීම් සහ ප්‍රස්තාර, සරල Presentation එකක් හෝ Word Document එකක් ලෙස සකස් කර වාර්තාවක් ලෙස ඉදිරිපත් කළ හැක.

ව්‍යාපෘති පියවර
  • ගැටලුව තේරුම් ගැනීම
  • දත්ත ලබාගැනීම
  • දත්ත පිරිසිදු කිරීම
  • EDA සහ Visualization
  • අර්ථ නිරූපණය සහ වාර්තා කිරීම