Data Lake

Data lake ဆိုသည္မွာ လိုအပ္သည့္ အခ်ိန္အထိ raw data မ်ားကို ထိန္းသိမ္းထားေသာ သိုေလွာင္႐ံုတစ္ခု ျဖစ္သည္။

အေရးႀကီးသည့္ အဆင့္အလိုက္ အဆင့္အတန္း သတ္မွတ္ထားသည့္ hierarchical data warehouse တစ္ခုတြင္ အခ်က္အလက္မ်ားကို ဖိုင္မ်ားႏွင့္ folder မ်ားတြင္ သိမ္းဆည္းေသာ္လည္း data lake တြင္ အခ်က္အလက္ သိမ္းဆည္းရန္ flat architecture တစ္ခုကို အသံုးျပဳသည္။ Data lake တစ္ခုရိွ အခ်က္အလက္ တစ္ခုခ်င္းစီတြင္ unique identifier တစ္ခုစီ သတ္မွတ္ထားၿပီး metadata tag မ်ားျဖင့္လည္း ထည့္သြင္းထားသည္။ စီးပြားေရးႏွင့္ ပတ္သက္သည့္ ေမးခြန္းတစ္ခု ေမးျမန္းသည့္အခါ data lake က ေမးခြန္းကို ေျဖၾကားရာတြင္ အေထာက္အကူ ျဖစ္ေစမည့္ အခ်က္အလက္ကို ေလ့လာဆန္းစစ္ရန္အတြက္ သက္ဆိုင္ရာ အခ်က္အလက္ကို ေတာင္းဆိုမည္ ျဖစ္သည္။