Statistical Analysis

Statistical Analysis Statistics with R

15/02/2026

Data Analysis မစခင် ဒါတွေ စစ်ပြီးပြီလား? (Preprocessing Guide)
​ဒေတာတွေ ရှိရုံနဲ့ မရပါဘူး၊ "အရည်အသွေး" ရှိဖို့လည်း လိုပါတယ်။ အမှိုက်ထည့်ရင် အမှိုက်ပဲ ထွက်လာမှာမို့ (Garbage In, Garbage Out) အောက်ပါ အဆင့် ၄ ဆင့်ကို သေချာ လုပ်ဆောင်ရပါမယ်။
​၁။ Missing Values (ပျောက်ဆုံးနေသော ဒေတာများကို ကိုင်တွယ်ခြင်း)
​ဒေတာတွေ စုတဲ့အခါ အကြောင်းအမျိုးမျိုးကြောင့် အချက်အလက် တချို့ လွတ်နေတတ်ပါတယ်။ ဒါကို Data Imputation လို့ ခေါ်တဲ့ နည်းလမ်းတွေနဲ့ ဖြေရှင်းကြပါတယ်။
​ဘယ်လိုရှင်းမလဲ?
​Deletion: အချက်အလက် အရမ်းနည်းရင် အဲဒီ Row ကို ဖျက်ပစ်ပါ။ (ဒါပေမဲ့ ဒေတာ အနည်းငယ်ပဲ ရှိရင်တော့ ဒါကို ရှောင်သင့်ပါတယ်)။
​Mean/Median Imputation: ကိန်းဂဏန်းတွေ ဖြစ်နေရင် ပျမ်းမျှတန်ဖိုး (Mean) သို့မဟုတ် အလယ်ကိန်း (Median) နဲ့ အစားထိုးပါ။
​Mode Imputation: စာသား (Category) တွေ ဖြစ်နေရင် အများဆုံး ပါဝင်တဲ့ စာသားနဲ့ အစားထိုးပါ။
​၂။ Outlier Detection (ထူးခြားချက်တွေကို ရှာဖွေခြင်း)
​အုပ်စုထဲမှာ တခြားဒေတာတွေနဲ့ လုံးဝမတူဘဲ ကွဲထွက်နေတဲ့ တန်ဖိုးတွေကို Outliers လို့ ခေါ်ပါတယ်။ ဥပမာ- လူကြီးတွေရဲ့ အသက်ကို စာရင်းသွင်းရာမှာ ၂၀၀ နှစ် ဆိုပြီး ပါနေတာမျိုးပါ။
​ဘယ်လိုရှာမလဲ?
​Box Plots: ဇယားဆွဲကြည့်ရင် အစက်ကလေးတွေ အဝေးကြီးမှာ ထွက်နေတာကို တွေ့ရပါလိမ့်မယ်။
​Z-Score: သင်္ချာနည်းအရ Standard Deviation ရဲ့ အပြင်ဘက်ကို ရောက်နေတဲ့ ဒေတာတွေကို စစ်ထုတ်တာပါ။
​ကိုင်တွယ်ပုံ: ဒါက အမှားဆိုရင် ဖျက်ပစ်ပါ၊ ဒါပေမဲ့ တစ်ခါတလေ ဒီ Outlier ကပဲ ထူးခြားတဲ့ Business Insight ဖြစ်နေတတ်တာကို သတိပြုပါ။
​၃။ Feature Scaling (တန်ဖိုးများ ညှိယူခြင်း)
​ဒေတာတွေရဲ့ ယူနစ်တွေ မတူတဲ့အခါ (ဥပမာ- အသက်က ၁၈-၆၀ ကြား၊ လစာက ၁ သိန်း ကနေ ၁၀ သိန်းကြား) Analysis လုပ်ရင် လစာက ပိုအရေးကြီးသလိုမျိုး Machine လွဲမှားသွားတတ်ပါတယ်။
ဘယ်လိုညှိမလဲ?
Normalization: ဒေတာအားလုံးကို 0 နဲ့ 1 ကြားထဲ ရောက်အောင် ချုံ့ပစ်တာပါ။

x_new = (x - x_min)/(x_max - x_min)

Standardization: ပျမ်းမျှတန်ဖိုး (Mean) ကို 0 ထားပြီး ဒေတာတွေကို ညှိတာပါ။
၄။ Data Encoding (စာသားမှ ဂဏန်းသို့ ပြောင်းခြင်း)
​Computer တွေက စာသားတွေကို နားမလည်ပါဘူး။ ဒါကြောင့် "Male/Female" သို့မဟုတ် "City Names" တွေကို နံပါတ်ပြောင်းပေးရပါတယ်။
​ဘယ်လိုပြောင်းမလဲ?
​Label Encoding: Category တစ်ခုချင်းစီကို 0, 1, 2 ဆိုပြီး နံပါတ်ပေးတာပါ။
​One-Hot Encoding: Column အသစ်တွေ ခွဲထုတ်ပြီး 0 နဲ့ 1 သုံးပြီး သတ်မှတ်တာပါ။ (ဥပမာ- ရန်ကုန်၊ မန္တလေး ဆိုရင် 'Is_Yangon', 'Is_Mandalay' ဆိုပြီး Column ခွဲတာမျိုးပါ)။
Data Preprocessing ဟာ Data Analysis ပရောဂျက်တစ်ခုရဲ့ အချိန် ၈၀% ခန့်ကို ယူပါတယ်။ "ဒေတာသန့်မှ အဖြေမှန်ရပါမယ်"

Statistical Analysis with SPSS, STATA, R from Basic to Advance သင်တန်းရှိပါတယ်
စိတ်ဝင်စားသူများ ဆက်သွယ်နိုင်ပါတယ်
ဆက်သွယ်ရန် viber 09 760373714
[email protected]

14/02/2026

R^2 (Coefficient of Determination) ဆိုတာ ဘာလဲ?
​R^2 ဆိုတာ ရိုးရိုးလေးပြောရရင် "မင်းရဲ့ Model က ဘယ်လောက်အထိ တော်သလဲ?" လို့ မေးခွန်းထုတ်တာပါ။ Model က ဒေတာတွေရဲ့ ပြောင်းလဲမှု (Variation) ကို ဘယ်လောက် ရာခိုင်နှုန်းအထိ မှန်ကန်အောင် ရှင်းပြနိုင်သလဲဆိုတာကို တိုင်းတာတာဖြစ်ပါတယ်။

​🏠 အိမ်ခြံမြေ ဥပမာလေးနဲ့ ကြည့်ရအောင်
​သင်က အိမ်ဈေးနှုန်းတွေကို ခန့်မှန်းတဲ့ Model တစ်ခု တည်ဆောက်တယ် ဆိုပါစို့။
​အခြေအနေ (၁): အိမ်ရဲ့ "အကျယ်အဝန်း" တစ်ခုတည်းကိုပဲ ကြည့်ပြီး တွက်ရင် R^2 = 0.50 (50%) ရတယ်ဆိုပါစို့။ ဒါက အိမ်ဈေးနှုန်း အတက်အကျ ဖြစ်ရတဲ့ အကြောင်းရင်းတွေရဲ့ တစ်ဝက်ကိုပဲ သင် ခန့်မှန်းနိုင်သေးတာပါ။ ကျန်တဲ့ 50% က တခြားအချက်တွေ (Location၊ အိမ်သက်တမ်း) ကြောင့် ဖြစ်နိုင်ပါတယ်။
​အခြေအနေ (၂): အကျယ်အဝန်းအပြင် "မြို့ထဲနဲ့ အကွာအဝေး" ကိုပါ ထည့်တွက်လိုက်လို့ R^2 = 0.85 (85%) ဖြစ်သွားရင် သင့် Model က အရင်ထက် အများကြီး ပိုတော်လာပြီလို့ ပြောလို့ရပါတယ်။

R^2 ကို ဘယ်လိုတွက်သလဲ? (The Math Behind It)
​Sum of Squares ၃ မျိုးကို သုံးပြီး ဒီလိုတွက်ပါတယ်-
R^2 = SSR/SST { သို့မဟုတ် } R^2 = 1 - (SSE/SST)
​SST (Total Variation): ဒေတာတွေမှာ ရှိသမျှ စုစုပေါင်း ကွာဟချက်။
​SSR (Explained Variation): Model က ရှင်းပြနိုင်တဲ့ ကွာဟချက်။
​SSE (Unexplained Variation): Model က ရှင်းမပြနိုင်တဲ့ အမှား (Residuals)။

R^2 တန်ဖိုးကို ဘယ်လို ဖတ်မလဲ?
​R^2 တန်ဖိုးဟာ 0 နဲ့ 1 ကြားမှာ အမြဲရှိနေပါတယ် (သို့မဟုတ် 0% မှ 100% အတွင်း)။
​R^2 = 0: Model က ဘာကိုမှ ရှင်းမပြနိုင်ဘူး။ ခန့်မှန်းချက်တွေ အားလုံး လွဲနေတယ်။
​R^2 = 1: Model က Perfect ဖြစ်တယ်။ ဒေတာအမှတ် (Scatter points) တွေအားလုံး Regression line ပေါ်မှာ ကွက်တိ ကျနေတယ်။
​0.7 အထက်: ယေဘုယျအားဖြင့် Model ကောင်းတယ်လို့ သတ်မှတ်နိုင်ပါတယ်။ (ဒါပေမဲ့ နယ်ပယ်အလိုက် ကွာခြားနိုင်ပါတယ်)။

သတိထားရမယ့် အချက် (Regression Assumptions)
​Regression Model တစ်ခု ကောင်းမွန်ဖို့ဆိုရင် R^2 ကောင်းရုံနဲ့ မပြီးပါဘူး။
အောက်ပါ Assumptions တွေနဲ့လည်း ကိုက်ညီရပါမယ်-
​Linearity: X နဲ့ Y ကြားက ဆက်နွယ်မှုဟာ မျဉ်းဖြောင့်ပုံစံ ရှိရမယ်။
​Independence: ဒေတာတစ်ခုစီဟာ တစ်ခုနဲ့တစ်ခု သီးခြားစီ ဖြစ်ရမယ်။
​Homoscedasticity: Residual (အမှား) တွေရဲ့ ပမာဏဟာ X တန်ဖိုးတလျှောက် တူညီနေရမယ်။
​Normality: Residual တွေဟာ Normal Distribution (ခေါင်းလောင်းပုံစံ) ရှိနေရမယ်။

R^2 ဟာ Independent Variable တွေ အများကြီး ထပ်ထည့်လေလေ ပိုများလာလေလေ ဖြစ်တတ်ပါတယ်။ ဒါကို ကာကွယ်ဖို့ Data Scientist တွေက Adjusted R^2 ကို သုံးလေ့ရှိပါတယ်။


Data Analysis with R, SPSS, STATA သင်တန်း
Basic to Advance
စိတ်ဝင်စားသူများ ဆက်သွယ်နိုင်ပါတယ်
Viber 09 760373714
Email - [email protected]

14/02/2026

Residuals နှင့် အမှားကို လျှော့ချခြင်း
​Regression Model တစ်ခုရဲ့ ရည်မှန်းချက်က တကယ့်တန်ဖိုးနဲ့ ခန့်မှန်းချက်ကြားက "အမှား (Residual)" ကို အနည်းဆုံးဖြစ်အောင် လုပ်ဖို့ပါ။

​Residual (Prediction Error)
e_i = y_i - y^_i
​y_i : လက်တွေ့ရရှိတဲ့ တန်ဖိုး (Observed value)။
​y^_i : Model ကနေ ခန့်မှန်းပေးလိုက်တဲ့ တန်ဖိုး (Predicted value)။
​Positive Residual: Model က နည်းနည်းလေး ခန့်မှန်းမိတာ (Underpredicts)။
​Negative Residual: Model က များများ ခန့်မှန်းမိတာ (Overpredicts)။
Best-fit Line ဆိုတာ ဘာလဲ?
​ဒေတာအမှတ်လေးတွေ အားလုံးနဲ့ အနီးစပ်ဆုံး ဖြစ်နေတဲ့မျဉ်းကို ခေါ်တာပါ။ ဒီမျဉ်းကို ရှာဖို့အတွက် Ordinary Least Squares (OLS) ဆိုတဲ့ နည်းလမ်းကို သုံးပါတယ်။ သူကတော့ Residual တွေကို နှစ်ထပ်ကိန်းတင်ပြီး ပေါင်းလိုက်တဲ့အခါ (Sum of Squares) အနည်းဆုံး ဖြစ်စေမယ့် မျဉ်းကို ရှာပေးတာပါ။

Model ရဲ့ အရည်အသွေးကို ဘယ်လိုတိုင်းတာမလဲ?
​ကျွန်တော်တို့ရဲ့ Regression Model က ဒေတာတွေကို ဘယ်လောက်အထိ ကောင်းကောင်း ရှင်းပြနိုင်သလဲဆိုတာကို Sums of Squares တွေနဲ့ တိုင်းတာပါတယ်။
​SSR (Sum of Squares Regression): Model ကြောင့် ရှင်းပြနိုင်တဲ့ ပြောင်းလဲမှု။ (ဒီတန်ဖိုးများလေ ပိုကောင်းလေ)
​SSE (Sum of Squares Error): Model က ရှင်းမပြနိုင်တဲ့ အမှားများ။ (ဒီတန်ဖိုး နည်းလေ ပိုကောင်းလေ)
​SST (Sum of Squares Total): ဒေတာတွေမှာ ရှိသမျှ စုစုပေါင်း ပြောင်းလဲမှု။

Coefficient of Determination (R^2)
​ဒါကတော့ Regression မှာ အသုံးအများဆုံး Metric ပါ။
R^2 = SSR/SST လို့ တွက်ပါတယ်။
အကယ်၍ R^2 = 0.85 ဆိုရင် ကျွန်တော်တို့ရဲ့ Model က Y ရဲ့ ပြောင်းလဲမှု 85% ကို X အသုံးပြုပြီး ရှင်းပြနိုင်တယ်လို့ ဆိုလိုတာပါ။



ဆက်သွယ်ရန် viber 09 760373714

Thesis & Statistics ခေါင်းခဲနေပြီလား? ​🎓 MBA / MPA ကျောင်းသားများအတွက် ​Thesis တစ်စောင်လုံးအတွက်ဖြစ်စေ၊ အခက်ခဲဆုံး Chapt...
12/02/2026

Thesis & Statistics ခေါင်းခဲနေပြီလား?
​🎓 MBA / MPA ကျောင်းသားများအတွက်
​Thesis တစ်စောင်လုံးအတွက်ဖြစ်စေ၊ အခက်ခဲဆုံး Chapter 4 Analysis အပိုင်းအတွက်ဖြစ်စေ အားကိုးလို့ရမယ့် Guide ဝန်ဆောင်မှု။
​✅ Expertise: Proposal, Literature Review, Methodology
✅ Software Skills: SPSS | STATA | R
✅ Training: Basic to Advanced Statistics သင်တန်းများ
Data Analysis ကို SPSS, STATA, R နဲ့ အပိုင်တွက်မလား?
​Research တစ်စောင်ရဲ့ အသက်ဟာ Statistical Analysis ပါပဲ။ Analysis အပိုင်းမှာ အခက်အခဲဖြစ်နေလို့ပဲဖြစ်ဖြစ်၊ Basic ကနေ Advanced အထိ ကိုယ်တိုင် ကျွမ်းကျင်ချင်လို့ပဲဖြစ်ဖြစ် ဆက်သွယ်လိုက်ပါ။
​အ​တွေ့အကြုံ?
​ပြည်တွင်းသာမက ပြည်ပရောက် ကျောင်းသားများအတွက်ပါ Guide ပေးနေသည့် အတွေ့အကြုံရှိခြင်း။
​SPSS, STATA နှင့် R Software များဖြင့် တိကျသော Analysis များ ပြုလုပ်ပေးခြင်း။
​Statistical Analysis သင်တန်းများလည်း ဖွင့်လှစ်ထားရှိခြင်း။
​သင်တန်းတက်ရောက်လိုသူများ သို့မဟုတ် Thesis Guide ရယူလိုသူများ Messenger ကနေ အသေးစိတ် မေးမြန်းနိုင်ပါပြီ။
ဆက်သွယ်ရန် Viber 09 760373714

ပြည်ပ နိုင်ငံများတွင် Statistics/Business Analysis ဘာသာရပ်များ၌ R/R studio software ကို အသုံးပြုပြီး လေ့လာသင်ယူနေသော Bac...
12/02/2026

ပြည်ပ နိုင်ငံများတွင် Statistics/Business Analysis ဘာသာရပ်များ၌ R/R studio software ကို အသုံးပြုပြီး လေ့လာသင်ယူနေသော Bachelor, Master and Ph.d ကျောင်းသား/သူများ Lecture and Assignment ပြုလုပ်ရာတွင် နားလည်ရန် အခက်အခဲရှိပါက ဆက်သွယ်နိုင်ပါတယ််။
အ​တွေ့အကြုံ
US, UK, Germany and Israel တွင် တက်​ရောက်​နေ​သော ​​မြန်မာ ကျောင်းသား/သူများကို guideလုပ်​ပေးဖူး/​ပေး​နေပါသည်။
ဆက်သွယ်ရန်
ဖုန်း (Viber) 09 760373714
Email- [email protected]

12/02/2026

📊 Regression Analysis: အတိတ်က ဒေတာတွေကနေ အနာဂတ်ကို ဘယ်လိုခန့်မှန်းမလဲ?
​ဒေတာလောကမှာ "Correlation" က အချက်အလက်နှစ်ခုရဲ့ ဆက်နွယ်မှုကိုပဲ ကြည့်တာဆိုရင် "Regression" ကတော့ အဲဒီဆက်နွယ်မှုကို အခြေခံပြီး တိကျတဲ့ တန်ဖိုးတစ်ခု ထွက်လာအောင် တွက်ချက်ပေးတာဖြစ်ပါတယ်။
​💡 Regression ဆိုတာ ဘာလဲ?
​Regression ဆိုတာ Variable တစ်ခု (Independent Variable) ရဲ့ အပြောင်းအလဲပေါ် မူတည်ပြီး နောက်ထပ် Variable တစ်ခု (Dependent Variable) က ဘယ်လောက်အထိ ပြောင်းလဲသွားမလဲဆိုတာကို Model တည်ဆောက် တိုင်းတာတာပါ။
​ဥပမာ - High School GPA (X) ကို ကြည့်ပြီး ကျောင်းသားတစ်ယောက်ရဲ့ College GPA (Y) ဘယ်လောက်ဖြစ်နိုင်မလဲဆိုတာကို ခန့်မှန်းတာမျိုးပေါ့။
​📐 Regression Formula ကို နားလည်ခြင်း
​Regression ရဲ့ အခြေခံပုံသေနည်းကတော့ အောက်ပါအတိုင်း ဖြစ်ပါတယ်:

Y_i = beta_0 + beta_1 X_i + epsilon_i

​Y_i (Dependent Variable): ကျွန်တော်တို့ သိချင်တဲ့ ရလဒ် (Outcome)။
​X_i (Independent Variable): ခန့်မှန်းတွက်ချက်ဖို့ အသုံးပြုတဲ့ အချက်အလက် (Predictor)။
​beta_0 (Intercept): X တန်ဖိုး 0 ဖြစ်နေတဲ့အချိန်မှာ ရှိမယ့် Y ရဲ့ တန်ဖိုး။
​beta_1 (Slope): X တန်ဖိုး 1 ယူနစ် တိုးလာတိုင်း Y တန်ဖိုး ဘယ်လောက်ပြောင်းလဲသွားမလဲဆိုတဲ့ နှုန်း။
​epsilon_i (Error term): ခန့်မှန်းချက်နဲ့ တကယ့်လက်တွေ့ကြားက ကွာဟချက်။
​✅ Regression အမျိုးအစားများ
​Simple Linear Regression: Independent Variable တစ်ခုတည်းကိုပဲ သုံးပြီး ခန့်မှန်းတာပါ။ (ဥပမာ - အလုပ်လုပ်တဲ့ သက်တမ်းတစ်ခုတည်းနဲ့ လစာကို ခန့်မှန်းခြင်း)
​Multiple Linear Regression: Independent Variables အများကြီးကို သုံးပြီး ခန့်မှန်းတာပါ။ ပိုပြီးတော့လည်း တိကျတတ်ပါတယ်။ (ဥပမာ - အလုပ်သက်တမ်း၊ ပညာအရည်အချင်းနဲ့ ရာထူး—ဒီ ၃ ခုလုံးကိုကြည့်ပြီး လစာကို ခန့်မှန်းခြင်း)
​⚠️ Regression မသုံးခင် သိထားရမယ့် Assumptions များ
​Regression Model တစ်ခု အလုပ်လုပ်ဖို့အတွက် အောက်ပါအချက်တွေနဲ့ ကိုက်ညီဖို့ လိုအပ်ပါတယ် -
​Linearity: X နဲ့ Y ကြားက ဆက်နွယ်မှုဟာ မျဉ်းဖြောင့်အတိုင်း ရှိနေရပါမယ်။
​Independence: ဒေတာတစ်ခုချင်းစီဟာ တစ်ခုနဲ့တစ်ခု သီးခြားစီ ဖြစ်နေရပါမယ်။
​Homoscedasticity: Error တန်ဖိုးတွေရဲ့ ကွာဟချက် (Variance) ဟာ X တန်ဖိုးတလျှောက် တူညီနေရပါမယ်။
​Normality: Error တွေဟာ Normal Distribution ပုံစံ ရှိနေရပါမယ်။
​✨ ဘာကြောင့် Regression က အရေးကြီးတာလဲ?
​Regression Analysis ဟာ စီးပွားရေးလုပ်ငန်းတွေမှာ Sales ခန့်မှန်းတာ၊ ဆေးပညာမှာ ရောဂါအခြေအနေ ခန့်မှန်းတာနဲ့ စက်မှုလုပ်ငန်းတွေမှာ Quality Control လုပ်တာတွေအတွက် မရှိမဖြစ် အရေးပါတဲ့ Tool တစ်ခု ဖြစ်ပါတယ်။
​"Data တွေဟာ အနာဂတ်ကို ပြောပြနေတဲ့ စကားလုံးတွေဆိုရင်၊ Regression ကတော့ အဲဒီစကားလုံးတွေကို ဘာသာပြန်ပေးတဲ့ အဘိဓာန်ပါပဲ။" 📖

11/02/2026

📊 Correlation နဲ့ Regression ဘာကွာသလဲ? 🤔
​Statistics လေ့လာတဲ့အခါမှာဖြစ်ဖြစ်၊ Data တွေကို စစ်ဆေးတဲ့အခါမှာဖြစ်ဖြစ် Correlation နဲ့ Regression ဆိုတာ အမြဲတမ်းပါလာလေ့ရှိတဲ့ Concept နှစ်ခုပါ။ အပေါ်ယံကြည့်ရင် ဆင်သလိုလိုနဲ့ တကယ်တမ်း အသုံးချပုံချင်း မတူပါဘူး။ ဘာတွေကွာခြားလဲဆိုတာ အတူတူကြည့်ရအောင်...👇
​🔗 Correlation (ဆက်နွယ်မှု)
​Correlation ဆိုတာ Variable (အချက်အလက်) နှစ်ခုကြားမှာ "ဆက်နွယ်မှု ရှိသလား" ဆိုတာကိုပဲ ကြည့်တာပါ။
👌​အဓိကမေးခွန်း: X နဲ့ Y နဲ့က ပတ်သက်နေသလား? (ဥပမာ - ကလေးတစ်ယောက်ရဲ့ အသက်ကြီးလာလေ၊ သိတဲ့ဝေါဟာရအရေအတွက် ပိုများလာလေလား?)
👌​Symmetric (အပြန်အလှန်): X ကြောင့် Y ဖြစ်တာလား၊ Y ကြောင့် X ဖြစ်တာလားဆိုတာ ခွဲခြားမထားပါဘူး။ နှစ်ခုလုံးက အပြန်အလှန် ဆက်နွယ်နေတာပါ။
👌​စွမ်းဆောင်ရည်: ဆက်နွယ်မှုရဲ့ အားကောင်းမှု (Strength) နဲ့ ဦးတည်ချက် (Direction) ကိုပဲ တိုင်းတာပါတယ်။
​📈 Regression (ခန့်မှန်းတွက်ချက်မှု)
​Regression ကတော့ တစ်ဆင့်ပိုသွားပါတယ်။ သူက "တစ်ခုကိုကြည့်ပြီး နောက်တစ်ခုကို ခန့်မှန်း (Predict)" ဖို့အတွက် သုံးတာပါ။
👌​အဓိကမေးခွန်း: X က 1 ယူနစ် ပြောင်းလဲသွားရင် Y က ဘယ်လောက်အထိ လိုက်ပြောင်းမလဲ?
👌​Asymmetric : သူကတော့ ဘယ်သူက အကြောင်းတရား (Independent Variable - X)၊ ဘယ်သူက အကျိုးရလဒ် (Dependent Variable - Y) ဆိုတာကို ပြတ်ပြတ်သားသား ခွဲခြားပါတယ်။
👌​စွမ်းဆောင်ရည်: အတိတ်က Data တွေကို ကြည့်ပြီး အနာဂတ်မှာ ဘာဖြစ်နိုင်လဲဆိုတာကို Model ထုတ်ပြီး ခန့်မှန်းပေးနိုင်ပါတယ်။
​💡 Key Point
​👌Variables နှစ်ခု ဘယ်လောက်အထိ ရင်းနှီးလဲဆိုတာ သိချင်ရင် Correlation ကိုကြည့်ပါ။
👌အကယ်၍ တစ်ခုရဲ့ အပြောင်းအလဲကိုကြည့်ပြီး နောက်တစ်ခု ဘယ်လောက်ဖြစ်မလဲဆိုတာကို တွက်ချက်ချင်ရင်တော့ Regression ကို သုံးပါ။
​မှတ်ချက်"Correlation does not imply causation"


25/12/2025

🌍 Spatial Panel Data Models
​သုတေသနလုပ်တဲ့အခါ ကျွန်တော်တို့ မေ့လျော့နေတတ်တဲ့အချက်က "ပထဝီဝင် အနေအထား" ပါ။ ဥပမာ- မြန်မာနိုင်ငံရဲ့ စီးပွားရေး တိုးတက်မှုဟာ အိမ်နီးချင်း ထိုင်းနိုင်ငံ ဒါမှမဟုတ် တရုတ်နိုင်ငံရဲ့ အခြေအနေတွေအပေါ်မှာ မှီခိုနေတတ်ပါတယ်။ ဒါကို ပညာရပ်အရ Spatial Dependence (အာကာသဆိုင်ရာ မှီခိုမှု) လို့ ခေါ်ပါတယ်။
​ဒီနေ့မှာတော့ Spatial Panel Data Analysis ရဲ့ စိတ်ဝင်စားစရာ အချက်အလက်တွေကို ဝေမျှပေးသွားမှာ ဖြစ်ပါတယ်။
​📍 ၁။ Spatial Dependence နဲ့ Spillover Effect ဆိုတာ ဘာလဲ?
​Spatial Dependence: ဒေသတစ်ခုရဲ့ တန်ဖိုး (ဥပမာ- GDP) ဟာ သူ့အိမ်နီးချင်းတွေရဲ့ တန်ဖိုးတွေနဲ့ ဆက်နွှယ်နေတာပါ။ ဒါကို Spatial Weights Matrix (W) ကိုသုံးပြီး သင်္ချာနည်းအရ တွက်ချက်ပါတယ်။
​Spillover Effect (ကူးစက်သက်ရောက်မှု): ဒါကတော့ ပိုစိတ်ဝင်စားဖို့ကောင်းပါတယ်။ နိုင်ငံ (A) က လမ်းပန်းဆက်သွယ်ရေး ကောင်းအောင် လုပ်လိုက်တဲ့အခါ နိုင်ငံ (A) ပဲ တိုးတက်တာမဟုတ်ဘဲ ကုန်သွယ်မှုတွေကြောင့် အိမ်နီးချင်းနိုင်ငံ (B) ရဲ့ ကုန်ထုတ်လုပ်မှုပါ လိုက်တိုးတက်လာတာမျိုးကို ဆိုလိုပါတယ်။
​⚖️ ၂။ ဘယ် Model ကို ရွေးမလဲ? (SAR, SEM သို့မဟုတ် SDM)
​Spatial Dependence ရှိကြောင်း (Moran's I Test အရ P-value < 0.05) အဖြေထွက်လာရင် အောက်ပါ Model တွေထဲက ရွေးရပါမယ်။
​SAR (Spatial Autoregressive Model): အိမ်နီးချင်းတွေရဲ့ "ရလဒ်" က ကိုယ့်အပေါ် သက်ရောက်နေရင် သုံးပါတယ်။
​SEM (Spatial Error Model): ကျွန်တော်တို့ တိုင်းတာလို့မရတဲ့ "အခြားအချက်အလက်တွေ" က အိမ်နီးချင်းတွေဆီကနေ ကူးစက်လာရင် သုံးပါတယ်။
​SDM (Spatial Durbin Model): 🌟 ဒါကတော့ အကောင်းဆုံးပါ။ သူက အိမ်နီးချင်းတွေရဲ့ ရလဒ်ရော၊ လုပ်ဆောင်ချက်တွေ (Variables) ရော နှစ်ခုလုံးရဲ့ သက်ရောက်မှုကို တိုင်းတာနိုင်ပါတယ်။
​💡 Decision Rule: LR Test လုပ်တဲ့အခါ P-value < 0.05 ထွက်ရင် SDM ကိုပဲ သုံးဖို့ အကြံပြုထားပါတယ်။
​📊 ၃။ Direct, Indirect နဲ့ Total Effects ကို ဘယ်လိုဖတ်မလဲ?
​Spatial Model တွေမှာ ရိုးရိုး Coefficients တွေကို တန်းဖတ်လို့ မရပါဘူး။ အပိုင်း (၃) ပိုင်း ခွဲကြည့်ရပါတယ်။
​✅ Direct Effect (တိုက်ရိုက်): မိမိနိုင်ငံရဲ့ ရင်းနှီးမြှုပ်နှံမှုကြောင့် မိမိနိုင်ငံ GDP တိုးတက်တာ။
✅ Indirect Effect (Spillover): မိမိနိုင်ငံရဲ့ ရင်းနှီးမြှုပ်နှံမှုကြောင့် အိမ်နီးချင်းနိုင်ငံတွေရဲ့ GDP လိုက်တိုးတက်တာ။
✅ Total Effect (စုစုပေါင်း): အပေါ်က နှစ်ခုပေါင်းလဒ်။
​Decision Rule:
​Indirect Effect ရဲ့ P-value < 0.05 ဖြစ်ရင်: သင့်ရဲ့ ပေါ်လစီက အိမ်နီးချင်းတွေအပေါ် တကယ်ပဲ "ကူးစက်သက်ရောက်မှု" ရှိတယ်လို့ အခိုင်အမာ ပြောနိုင်ပါတယ်။
​💡 အချုပ်
ယနေ့ခေတ် ကမ္ဘာကြီးမှာ ဘယ်ဒေသမှ သီးခြားရပ်တည်နေတာ မဟုတ်ပါဘူး။ ဒါကြောင့် သုတေသနလုပ်တဲ့အခါ Spatial Dependence ကိုပါ ထည့်သွင်းစဉ်းစားခြင်းဖြင့် ပိုမိုတိကျပြီး ထိရောက်တဲ့ ပေါ်လစီအကြံပြုချက်တွေကို ထုတ်ဖော်နိုင်မှာ ဖြစ်ပါတယ်ခင်ဗျာ။




24/12/2025

🛡️ သင့်ရဲ့ သုတေသနရလဒ်တွေ ခိုင်မာရဲ့လား? (Robustness & Model Diagnostics)
​သုတေသနတစ်ခုမှာ Variable တွေကြားက ဆက်နွှယ်မှုကို ရှာဖွေပြီးရလာတဲ့ အဖြေ (Estimates) တွေကိုတင်ပြီး ရပ်လိုက်လို့ မရပါဘူး။ ကိုယ့်ရဲ့ Model က တကယ့်ကို တိကျခိုင်မာမှုရှိရဲ့လားဆိုတာ "Error Term" (အမှားတန်ဖိုး) တွေကို ပြန်စစ်ဖို့ လိုပါတယ်။
​အကယ်၍ Error Term တွေမှာ ပြဿနာရှိနေရင် သင့်ရဲ့ P-value တွေက မှားယွင်းသွားပြီး တကယ်အရေးမပါတဲ့အရာကို အရေးပါတယ်လို့ မှားယွင်းစွာ ဆုံးဖြတ်မိစေနိုင်ပါတယ်။
​⚠️ သတိထားရမည့် အဓိကပြဿနာ (၂) မျိုး
​၁။ Heteroskedasticity (ပြောင်းလဲနိုင်သော Variance)
ဒါကတော့ အဖွဲ့အစည်းတစ်ခုနဲ့တစ်ခု (ဥပမာ- နိုင်ငံတစ်ခုနဲ့တစ်ခု) အကြား အမှားတန်ဖိုးတွေရဲ့ ကွာဟချက် (Variance) မတူညီတာကို ဆိုလိုပါတယ်။
🔍 ဘယ်လိုစစ်မလဲ? Modified Wald Test
​P-value ≤ 0.05 ဖြစ်ရင်: Heteroskedasticity ပြဿနာ ရှိနေပါပြီ။
​၂။ Serial Correlation (အစဉ်လိုက် ဆက်စပ်မှု)
ဒီနှစ်မှာဖြစ်တဲ့ အမှားက နောက်နှစ်ရဲ့ အမှားအပေါ် သက်ရောက်နေတာမျိုး (အချိန်ကာလအလိုက် ဆက်နွှယ်နေတာ) ကို ဆိုလိုပါတယ်။
🔍 ဘယ်လိုစစ်မလဲ? Wooldridge Test
​P-value ≤ 0.05 ဖြစ်ရင်: Serial Correlation ပြဿနာ ရှိနေပါပြီ။
​🛠️ အကောင်းဆုံးဖြေရှင်းချက်- Cluster Robust Standard Errors
​အပေါ်က ပြဿနာတွေ ရှိနေရင် Model တစ်ခုလုံးကို ပြောင်းစရာမလိုပါဘူး။ ကျွန်တော်တို့ရဲ့ Standard Errors တွေကို "Cluster Robust" ပြုလုပ်ပေးရုံနဲ့ ပြဿနာတွေကို ဖြေရှင်းနိုင်ပါတယ်။
​✨ ဘာကြောင့် သုံးသင့်တာလဲ?
​Cross-Sectional အကြား Variance မတူညီမှုကို ညှိပေးတယ်။
​Time Periods အလိုက် Error ဆက်နွှယ်နေမှုကို ပြုပြင်ပေးတယ်။
​💡 King of Home ရဲ့ အကြံပြုချက်
​စီးပွားရေးပညာရှင်ကြီးတွေကတော့ Panel Data Analysis လုပ်တဲ့အခါ Diagnostic Tests တွေ အောင်သည်ဖြစ်စေ၊ ရှုံးသည်ဖြစ်စေ Cluster Robust Standard Errors ကို "အမြဲတမ်း" သုံးဖို့ အကြံပြုထားပါတယ်။ ဒါမှသာ သင့်ရဲ့ P-value တွေက ယုံကြည်စိတ်ချရပြီး သုတေသနရလဒ်ကလည်း အခိုင်မာဆုံး ဖြစ်နေမှာပါ။



24/12/2025

Panel Data Analysis
​📊 Data တွေက အဆင့်ဆင့် ရုန်းကန်နေရတဲ့အခါ (When Data is I(2))
​သုတေသနလောကမှာ Data တွေ တည်ငြိမ်ဖို့ (Stationary ဖြစ်ဖို့) ဆိုတာ အရေးကြီးပါတယ်။ တစ်ကြိမ်ပဲ Difference ယူရတာမျိုး ရှိသလို (I(1))၊ တချို့ ဂျစ်ကန်ကန် Data တွေကျတော့ နှစ်ကြိမ်တိုင်တိုင် Difference ယူမှ ငြိမ်သွားတတ်ကြပါတယ်။ ဒါကို ကျွန်တော်တို့က I(2) အဆင့် လို့ ခေါ်ပါတယ်။
​⚠️ ဘာကြောင့် I(2) ကို ကြောက်ရတာလဲ?
​ကျွန်တော်တို့ ခဏခဏ သုံးနေတဲ့ Panel ARDL (PMG) မော်ဒယ်ဟာ I(0) နဲ့ I(1) ရောနေရင် လက်ခံနိုင်ပေမယ့်၊ I(2) ပါလာရင်တော့ အလုပ်မလုပ်တော့ပါဘူး။ တွက်ချက်မှုတွေ မှားယွင်းကုန်ပါလိမ့်မယ်။ ဒါကြောင့် ပထမဆုံးအဆင့်အနေနဲ့ ကိုယ့် Data က I(2) ဟုတ်မဟုတ် အရင်စစ်ရပါမယ်။
​❌ Level မှာ စစ်မယ် -> မငြိမ်ဘူး
❌ First Difference (\Delta Y) မှာ စစ်မယ် -> မငြိမ်သေးဘူး
✅ Second Difference (\Delta^2 Y) မှာ စစ်မယ် -> ငြိမ်သွားပြီ (ဒါဆိုရင် သေချာပါပြီ၊ သင့် Data က I(2) ပါ)။
​🛠️ ဖြေရှင်းချက်- Panel VECM (Vector Error Correction Model)
​ARDL သုံးလို့မရရင် ကျွန်တော်တို့မှာ VECM ဆိုတဲ့ အဆင့်မြင့် လက်နက်တစ်ခု ရှိပါသေးတယ်။ သူက Variables တွေကြားက အပြန်အလှန် ဆက်နွှယ်မှု စနစ်တစ်ခုလုံးကို တစ်ပြိုင်နက် ခန့်မှန်းပေးနိုင်ပါတယ်။
​VECM နဲ့ Cointegration စစ်ဆေးပုံ အဆင့်ဆင့်:
​1️⃣ Lag Order သတ်မှတ်ခြင်း: မော်ဒယ်ထဲမှာ အတိတ်က တန်ဖိုးတွေကို ဘယ်လောက်အထိ ထည့်တွက်မလဲဆိုတာ (AIC/BIC Criteria) နဲ့ အရင်ဆုံးဖြတ်ပါတယ်။
2️⃣ Johansen Test (Rank ရှာခြင်း): ရေရှည်ဆက်နွှယ်မှု (Cointegration Vector) ဘယ်နှစ်ခု ရှိသလဲဆိုတာကို ရှာတာပါ။
​P-value < 0.05 ဖြစ်နေသရွေ့ ဆက်နွှယ်မှု အရေအတွက် (Rank) တိုးတိုးသွားပါတယ်။
​P-value > 0.05 ဖြစ်သွားတဲ့နေရာမှာ ရပ်လိုက်ပါ။ အဲဒါဟာ သင့်မော်ဒယ်ရဲ့ ရေရှည်ဆက်နွှယ်မှု အရေအတွက် (Number of Cointegrating Vectors) ပါပဲ။
​✨ ရလဒ်ကို ဘယ်လို ဖတ်မလဲ?
​VECM တွက်ပြီးရင် အဓိက အချက် (၂) ချက်ကို အဖြေထုတ်ရပါတယ်။
​Cointegrating Vectors: ဒါက Variables တွေကြားက "ရေရှည် ချစ်ကြည်ရေး/မျှခြေ" ကို ပြတာပါ။
​Adjustment Coefficients: ဒါကတော့ ရေတိုမှာ တစ်ခုခုလွဲချော်သွားရင် ရေရှည်မျှခြေဆီကို "ဘယ်လောက် မြန်မြန် ပြန်ချိန်ညှိပေးသလဲ" ဆိုတာကို ပြတာပါ။
​💡 အချုပ်
I(2) Data တွေဟာ ကိုင်တွယ်ရ ခက်ခဲပေမယ့် Panel VECM ကို စနစ်တကျ သုံးတတ်ရင် ခိုင်မာတဲ့ သုတေသနရလဒ်တွေကို ထုတ်ဖော်နိုင်မှာ ဖြစ်ပါတယ်။ အကယ်၍ သင့် Data မှာ I(2) တွေ ပါနေရင် ARDL ကို ဇွတ်မသုံးဘဲ VECM ဘက်ကို လှည့်ကြည့်ဖို့ မမေ့ပါနဲ့။



Address

Yezin
Naypyidaw

Website

Alerts

Be the first to know and let us send you an email when Statistical Analysis posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Share