ဒေတာကို သတ်မှတ်ခြင်း


ဒေတာကို သတ်မှတ်ခြင်း - Sketchnote by @nitya

ဒေတာဆိုတာ အချက်အလက်များ၊ သတင်းအချက်အလက်များ၊ ကြည့်ရှုမှုများနှင့် တိုင်းတာမှုများဖြစ်ပြီး ရှာဖွေတွေ့ရှိမှုများနှင့် သတိထားဖြင့် ဆုံးဖြတ်ချက်များကို ပံ့ပိုးရန် အသုံးပြုသည်။ ဒေတာအချက်အလက်တစ်ခုသည် ဒေတာအချက်အလက်စုစည်းမှုတစ်ခုအတွင်းရှိ ဒေတာ၏ တစ်ခုတည်းသောယူနစ်ဖြစ်ပြီး ဒေတာအချက်အလက်များ၏ စုစည်းမှုဖြစ်သည်။ ဒေတာအချက်အလက်စုစည်းမှုများသည် အမျိုးအစားနှင့် ဖွဲ့စည်းမှုများကွဲပြားနိုင်ပြီး ဒေတာရရှိသော အရင်းအမြစ်ပေါ်မူတည်လေ့ရှိသည်။ ဥပမာအားဖြင့် ကုမ္ပဏီ၏ လစဉ်ဝင်ငွေများသည် စာရင်းဇယားတွင်ရှိနိုင်သလို smartwatch မှ နာရီတိုင်းနှလုံးခုန်နှုန်းဒေတာသည် JSON ဖော်မတ်တွင်ရှိနိုင်သည်။ ဒေတာသိပ္ပံပညာရှင်များသည် ဒေတာအမျိုးအစားများစွာနှင့် အလုပ်လုပ်ရလေ့ရှိသည်။

ဒီသင်ခန်းစာမှာ ဒေတာ၏ လက္ခဏာများနှင့် အရင်းအမြစ်များအပေါ်မူတည်၍ ဒေတာကို သတ်မှတ်ခြင်းနှင့် အမျိုးအစားခွဲခြင်းကို အဓိကထားသည်။

Pre-Lecture Quiz

ဒေတာကို ဘယ်လို ဖော်ပြထားသလဲ

Raw Data

Raw data ဆိုတာ ဒေတာရရှိသော အရင်းအမြစ်မှ စတင်အခြေအနေတွင်ရှိပြီး မသုံးသပ်ထားသော ဒေတာဖြစ်သည်။ ဒေတာအချက်အလက်စုစည်းမှုတွင် ဖြစ်နေသောအရာကို နားလည်နိုင်ရန် လူသားများနှင့် နည်းပညာများက ပိုမိုသုံးသပ်နိုင်ရန် ဖွဲ့စည်းထားသော ဖော်မတ်တစ်ခုအဖြစ် စီစဉ်ရန် လိုအပ်သည်။ ဒေတာအချက်အလက်စုစည်းမှု၏ ဖွဲ့စည်းမှုသည် ဒေတာကို ဘယ်လို စီစဉ်ထားသည်ကို ဖော်ပြပြီး structured, unstructured နှင့် semi-structured အဖြစ် အမျိုးအစားခွဲနိုင်သည်။ ဒီဖွဲ့စည်းမှုအမျိုးအစားများသည် အရင်းအမြစ်ပေါ်မူတည်၍ ကွဲပြားနိုင်သော်လည်း အဓိကအားဖြင့် ဒီသုံးမျိုးအတွင်းသို့ အဆင့်သတ်မှတ်နိုင်သည်။

Quantitative Data

Quantitative data ဆိုတာ ဒေတာအချက်အလက်စုစည်းမှုအတွင်းရှိ ကိန်းဂဏန်းအချက်အလက်များဖြစ်ပြီး သုံးသပ်နိုင်သည်၊ တိုင်းတာနိုင်သည်၊ သင်္ချာနည်းဖြင့် အသုံးပြုနိုင်သည်။ Quantitative data ၏ ဥပမာများမှာ - တစ်နိုင်ငံ၏ လူဦးရေ၊ တစ်ဦး၏ အရပ်အမြင့်၊ ကုမ္ပဏီ၏ သုံးလပတ်ဝင်ငွေများ ဖြစ်သည်။ ထပ်မံသုံးသပ်မှုများဖြင့် Quantitative data ကို Air Quality Index (AQI) ၏ ရာသီဥတုလမ်းကြောင်းများကို ရှာဖွေခြင်း သို့မဟုတ် အလုပ်လုပ်ရက်များတွင် Rush Hour Traffic ဖြစ်နိုင်ခြေကို ခန့်မှန်းရန် အသုံးပြုနိုင်သည်။

Qualitative Data

Qualitative data (categorical data) ဆိုတာ Quantitative data ကဲ့သို့ တိုင်းတာနိုင်သော ဒေတာမဟုတ်ဘဲ အရည်အသွေးကို ဖော်ပြသော ဒေတာဖြစ်သည်။ Qualitative data သည် အမျိုးမျိုးသော subjective data ဖော်မတ်များဖြစ်ပြီး ပစ္စည်း သို့မဟုတ် လုပ်ငန်းစဉ်၏ အရည်အသွေးကို ဖမ်းယူထားသည်။ တစ်ခါတစ်ရံ Qualitative data သည် ကိန်းဂဏန်းဖြစ်နိုင်သော်လည်း သင်္ချာနည်းဖြင့် အသုံးမပြုလေ့ရှိသည်။ ဥပမာအားဖြင့် ဖုန်းနံပါတ်များ သို့မဟုတ် အချိန်မှတ်တမ်းများ။ Qualitative data ၏ ဥပမာများမှာ - ဗီဒီယိုမှတ်ချက်များ၊ ကား၏ အမျိုးအစားနှင့် မော်ဒယ်၊ သင့်အနီးဆုံးသူငယ်ချင်းများ၏ အကြိုက်ဆုံးအရောင်များ ဖြစ်သည်။ Qualitative data ကို စားသုံးသူများအကြိုက်ဆုံးပစ္စည်းများကို နားလည်ရန် သို့မဟုတ် အလုပ်လျှောက်လွှာများတွင် လူကြိုက်များသော keyword များကို ရှာဖွေရန် အသုံးပြုနိုင်သည်။

Structured Data

Structured data ဆိုတာ အတန်းနှင့် ကော်လံများအဖြစ် စီစဉ်ထားသော ဒေတာဖြစ်ပြီး အတန်းတစ်ခုစီတွင် အတန်းတစ်ခုနှင့် တူညီသော ကော်လံများရှိသည်။ ကော်လံများသည် တစ်ခုတည်းသော အမျိုးအစားကို ကိုယ်စားပြုသော တန်ဖိုးကို ဖော်ပြပြီး အတန်းများတွင် အမှန်တကယ်တန်ဖိုးများကို ပါဝင်သည်။ Structured data ၏ အကျိုးကျေးဇူးမှာ ဒေတာကို အခြား structured data နှင့် ဆက်စပ်စီစဉ်နိုင်သည်။ သို့သော် ဒေတာကို အတိအကျစီစဉ်ထားသောကြောင့် ဖွဲ့စည်းမှုကို ပြောင်းလဲရန် အချိန်နှင့် အင်အားများလိုအပ်သည်။

Structured data ၏ ဥပမာများ - စာရင်းဇယားများ၊ relational databases၊ ဖုန်းနံပါတ်များ၊ ဘဏ်စာရင်းများ

Unstructured Data

Unstructured data သည် အတန်းနှင့် ကော်လံများအဖြစ် စီစဉ်ထားနိုင်သော ဒေတာမဟုတ်ဘဲ ဖော်မတ် သို့မဟုတ် စည်းမျဉ်းများမပါဝင်သော ဒေတာဖြစ်သည်။ Unstructured data သည် ဖွဲ့စည်းမှုအပေါ် အကန့်အသတ်နည်းသောကြောင့် ဒေတာအသစ်များကို ထည့်သွင်းရန် ပိုမိုလွယ်ကူသည်။ သို့သော် ဒေတာကို သုံးသပ်ရန် ပိုမိုအချိန်ယူနိုင်သည်။

Unstructured data ၏ ဥပမာများ - စာသားဖိုင်များ၊ စာသားမက်ဆေ့များ၊ ဗီဒီယိုဖိုင်များ

Semi-structured

Semi-structured data သည် structured နှင့် unstructured data ၏ ပေါင်းစပ်ဖြစ်ပြီး အတန်းနှင့် ကော်လံများအဖြစ် မဟုတ်သော်လည်း ဖွဲ့စည်းမှုရှိသည်။ Metadata သည် ဒေတာကို ဘယ်လို စီစဉ်ထားသည်ကို ဆုံးဖြတ်ရန် အညွှန်းများဖြစ်ပြီး tags, elements, entities, attributes စသည်ဖြင့် အမျိုးအစားခွဲနိုင်သည်။

Semi-structured data ၏ ဥပမာများ - HTML, CSV ဖိုင်များ, JavaScript Object Notation (JSON)

ဒေတာရင်းမြစ်များ

ဒေတာရင်းမြစ်ဆိုတာ ဒေတာကို စတင်ဖန်တီးသောနေရာ သို့မဟုတ် "နေထိုင်ရာ" ဖြစ်ပြီး ဒေတာကို ဘယ်လိုနှင့် ဘယ်အချိန်တွင် စုဆောင်းခဲ့သည်ပေါ်မူတည်၍ ကွဲပြားနိုင်သည်။ Primary data သည် အသုံးပြုသူများက ဖန်တီးသော ဒေတာဖြစ်ပြီး Secondary data သည် အခြားသူများက စုဆောင်းထားသော ဒေတာဖြစ်သည်။

နိဂုံး

ဒီသင်ခန်းစာတွင် ကျွန်ုပ်တို့ သင်ယူခဲ့သည် -

ဒေတာဆိုတာ ဘာလဲ
ဒေတာကို ဘယ်လို ဖော်ပြထားသလဲ
ဒေတာကို ဘယ်လို အမျိုးအစားခွဲထားသလဲ
ဒေတာကို ဘယ်နေရာတွင် ရှာဖွေနိုင်သလဲ

🚀 စိန်ခေါ်မှု

Kaggle သည် ဖွင့်လွှင့်ထားသော ဒေတာအချက်အလက်စုစည်းမှုများရရှိနိုင်သော အကောင်းဆုံးရင်းမြစ်တစ်ခုဖြစ်သည်။ dataset search tool ကို အသုံးပြု၍ စိတ်ဝင်စားဖွယ် ဒေတာအချက်အလက်စုစည်းမှုများကို ရှာဖွေပြီး အောက်ပါအတိုင်း ၃-၅ ခုကို အမျိုးအစားခွဲပါ-

ဒေတာသည် Quantitative သို့မဟုတ် Qualitative ဖြစ်ပါသလား?
ဒေတာသည် Structured, Unstructured သို့မဟုတ် Semi-structured ဖြစ်ပါသလား?

Post-lecture quiz

ပြန်လည်သုံးသပ်ခြင်းနှင့် ကိုယ်တိုင်လေ့လာခြင်း

Microsoft Learn unit Classify your Data သည် structured, semi-structured, unstructured data အကြောင်းကို အသေးစိတ်ဖော်ပြထားသည်။

လုပ်ငန်းတာဝန်

Classifying Datasets

အကြောင်းကြားချက်:
ဤစာရွက်စာတမ်းကို AI ဘာသာပြန်ဝန်ဆောင်မှု Co-op Translator ကို အသုံးပြု၍ ဘာသာပြန်ထားပါသည်။ ကျွန်ုပ်တို့သည် တိကျမှုအတွက် ကြိုးစားနေသော်လည်း၊ အလိုအလျောက် ဘာသာပြန်မှုများတွင် အမှားများ သို့မဟုတ် မမှန်ကန်မှုများ ပါဝင်နိုင်သည်ကို သတိပြုပါ။ မူရင်းဘာသာစကားဖြင့် ရေးသားထားသော စာရွက်စာတမ်းကို အာဏာရှိသော ရင်းမြစ်အဖြစ် သတ်မှတ်သင့်ပါသည်။ အရေးကြီးသော အချက်အလက်များအတွက် လူ့ဘာသာပြန်ပညာရှင်များမှ ပရော်ဖက်ရှင်နယ် ဘာသာပြန်မှုကို အကြံပြုပါသည်။ ဤဘာသာပြန်မှုကို အသုံးပြုခြင်းမှ ဖြစ်ပေါ်လာသော အလွဲအလွတ်များ သို့မဟုတ် အနားလွဲမှုများအတွက် ကျွန်ုပ်တို့သည် တာဝန်မယူပါ။

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ဒေတာကို သတ်မှတ်ခြင်း

Pre-Lecture Quiz

ဒေတာကို ဘယ်လို ဖော်ပြထားသလဲ

Raw Data

Quantitative Data

Qualitative Data

Structured Data

Unstructured Data

Semi-structured

ဒေတာရင်းမြစ်များ

နိဂုံး

🚀 စိန်ခေါ်မှု

Post-lecture quiz

ပြန်လည်သုံးသပ်ခြင်းနှင့် ကိုယ်တိုင်လေ့လာခြင်း

လုပ်ငန်းတာဝန်

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

ဒေတာကို သတ်မှတ်ခြင်း

Pre-Lecture Quiz

ဒေတာကို ဘယ်လို ဖော်ပြထားသလဲ

Raw Data

Quantitative Data

Qualitative Data

Structured Data

Unstructured Data

Semi-structured

ဒေတာရင်းမြစ်များ

နိဂုံး

🚀 စိန်ခေါ်မှု

Post-lecture quiz

ပြန်လည်သုံးသပ်ခြင်းနှင့် ကိုယ်တိုင်လေ့လာခြင်း

လုပ်ငန်းတာဝန်