منبع اصلی نوشتار زیر در این لینک قرار دارد

انبار داده (Data Warehouse) چیست – بخش نخست

در سازمان ها، داده ها و اطلاعات معمولا به دوشکل در سیستم ها پیاده سازی می شوند : یا سیستم های عملیاتی OLTP و یا سیستم های اطلاعاتی  DSS,DW,OLAP. امروزه سیستم ها را می توان به سیستم های تراکنشی و سیستم های تحلیلی دسته بندی نمود و اینطور در نظر می گیریم که سیستم های OLAP داده های عملیاتی انبار داده ها را فراهم می کنند و OLAP آنها را تحلیل می کنند. در OLTP تاکید بر تعداد بسیاری تراکنش ها، پردازش سریع پرس و جو ها، تضمین صحت و درستی داده ها در محیط هایی که دسترسی های همزمان وجود دارد.

OLAP در مقابل OLTP

یکی از ویژگی های داده های انبار داده، موضع گرا بودن آنهاست. هر موضوع به نوعی یکی از فعالیت های سازمان را بیان می کند و اهداف سازمان بر اساس آنها شکل می گیرد. OLAP اجازه آنالیز های سریع و موثر را بروی انبوهی از داده ها می دهد. داده ها به صورت ” مدل چند بعدی” ذخیره می شوند. همچنین کاربران به داده های خلاصه شده سریعتر و آسان تر دسترسی دارند.

سیستم های “پردازش تراکنش بر خط یا OLTP” مبتنی بر اعمال روزانه هستند، مانند سیستم تراکنش های بانکی. در این سیستم ها، تراکنش ها در خواست خواندن داده ها و یا بروز رسانی داده ها را دارند. همچنین نیاز به مکانیزم هایی برای کنترل همروندی و ریکاوری داده ها وجود دارد. در مقابل سیستم های انبار داده برای فرایند تصمیم سازی استفاده می شوند. در محیط های انبار داده، بر خلاف سیستم های پردازش تراکنش بر خط، تاریخچه ای از داده و داده ها به صورت خلاصه شده و یکپارچه وجود دارند، که باعث می شود در سیستم های انبار داده نیازی به مکانیزم های کنترل همروندی و ریکاوری نیازی نمی باشد. بطور کلی سیستم های “پردازش تراکنش بر خط” در پایگاه داده های رابطه ای و سیستم های “پردازش تحلیلی بر خط” در پایگاه داده های تحلیلی مورد استفاده قرار می گیرند.

سیستم های پشتیبانی تصمیم گیری یا DSS

یک سیستم پشتیبانی تصمیم گری، سیستم اطلاعاتی است که از فعالیت های تصمیم سازی سازمان ها و تجارت ها پشتیبانی می کند .سیستم های پشتیبان تصمیم گیری به عنوان سطوحی از مدیریت و طراحی یک سازمان به کار گرفته می شوند و کمک به روند تصمیم سازی می کنند. یک طراحی درست برای DSS اطلاعات را جمع آوری و آنها را برای روند تصمیم سازی آماده می کند. اطلاعاتی که یک سیستم پشتیبانی می تواند جمع آوری کند شامل :

  • موجودی اطلاعات دارائی (cube,Data Warehouse,Data Mart)

  • آمار فروش میان یک بازه زمانی خاص

  • پیش بینی درآمد بر اساس فروش محصول

این سیستم ها عموما :

  • به دلیل حجم انبوهی از داده ها، معمولا کند تر از سیستم های عملیاتی می باشند.
  • محیطی جهت تولید گزارشات تحلیلی و آماری
  • معمولا مدیران و تصمیم گیرندگان سازمانها، استفاده کننده های آن هستند.

کاربرد هایی از سیستم های DDS در حوزه های تجارتی، مراقبت های بهداشت، نظامی و در هر حوزه ای که در آن مدیریت با وضعیت های پیچیده تصمیم گیری مواجه است. سیستم های عملیاتی به صورت محصولی در اختیار کاربران قرار می گیرند. این سیستم ها برای اعمال و کارهای روزانه را مورد استفاده قرار گرفته و می توانند گزارش های این سیستم ها بیشتر جنبه اطمینان از صحت عملیات روزانه کاربران مورد استفاده قرار می گیرد.

انبار داده چیست

انبار داده مجموعه ای از داده های موضوع گرا، یکپارچه، متغیر در زمان و غیر فرار که برای تصمیم سازی سازمانی استفاده می شود. داده های انبار داده از پایگاه داده عملیاتی سازمان به صورت مجزا نگه داری می شوند. دلیل این است که انبار داده از ” پردازش تحلیلی بر خط یا OLAP ” استفاده می کند و این در صورتی  است که، یک پایگاه داده رابطه ای از “پردازش تراکنش بر خط یا OLTP” استفاده می کند که این دو از نطر کاربرد و عملکرد کاملا با هم متفاوت هستند.

هدف از انبار داده فراهم آوردن محیطی برای امکان تصمیم گیری توسط مدیران سازمان است. به همین منظور انبار داده در سازمان حداقل باید موارد زیر را براورده کند :

  • جمع آوری داده ها از منابع گوناگون. قطعا داده ای منابع گوناگون از جنس های متفاوتی هستند، به همین خاطر یکپارچگی یکی از فرایند های درون انبار داده است.
  • تشخیص و همسان سازی اطلاعات راهبردی درون سازمان.
  • سازمان دهی داده ها و اطلاعات به گونه ای که دسترسی به آن، طبق نیاز، برای تمام سطوح کاربران امکان پذیر باشد.

در انبار داده ها، داده ها از چندین منبع عملیاتی دریافت شده و در غالب یک پایگاه داده واحد ذخیره می شوند، پس تنها یک پرس جو برای نمایش داده ها کافیست. حتی اگر سیستم عملیاتی منبع انجام وظیفه نکند، به دلیل وجود سابقه ای از داده ها مشکلی پیش نخواهد آمد. در انبار داده ها داده ای تغییر نمی کند (داده ها بروز نمی شوند)، بلکه رکورد شامل مقدار جدید داده درج خواهد شد و سابقه ای از داده را پدید خواهد آورد.

چرا انبار داده

مفهوم انبار داده برآمده از نیاز دسترسی آسان به مخزنی از داده ها که برای تصمیم سازی مورد استفاده قرار می گیرند. اطلاعات سرمایه ها و دارایی های مهمی هستند که می توانند فواید و مزایایی را برای سازمان فراهم کنند. سازمان حجم بسیار بالایی از داده ها را دارند که دسترسی به آنها به نظر سخت و غیر قابل استفاده می آید و به خاطر این است داده ها در فرمت های گوناگون و و بر روی پلتفرم های گوناگون (پایگاه داده هایی از شرکت های مختلف) وجود دارند و سازمان ها نیاز به ابزار هایی برای استخراج، آماده سازی و یکپارچه کردن این گونه های مختلف داده ای به منظور تحلیل و گزارش گیری از آنها دارند.

انبار داده فرایندی برای دسترسی و استخراج این داده های ناهمگن و پالایش (تصفیه) و تبدیل آنها به فرمتی واحد و در نهایت ذخیره سازی آنها در یک ساختار واحد که امکان دسترسی آسان و ساده را فراهم می کند. حجم داده های درون انبار داده بسیار بالا است به ویژه زمانی که سابقه ای از داده را نگه داری کنیم. ابزار های تحلیلی نیاز به پویش مقدار بسیار بالایی از داده ها را دارند که تاثیر منفی بر محیط های عملیاتی دارند. به همین خاطر برای بهبود و بالا بردن کارایی نیاز به جداسازی محیط  عملیاتی از محیط انبار داده ها می باشد.

بانک های اطلاعاتی از نوع OLTP، اطلاعات خود را از طریق ورود اطلاعات توسط اپراتورها بدست می آورند و این در حالی است که انبار داده ها اطلاعات خود را از سایر بانک های اطلاعاتی از نوع OLAP و یا سایر انبار داده به صورت دسته ای یا انبوه جمع آوری می کنند.

انبار داده یک راهکار است و نه یک محصول برای خرید از کمپانی ها

معمولا چنین تصور می شود که یک انبار داده یک سیستم، محصول و یا مجموعه ای از نرم افزار ها می باشد که ما می توانیم آنرا خریداری کنیم تا کمکی برای پاسخگویی به مدیران سطح بالا برای بهبود قابلیت های تصمیم سازی سازمانی، ولی مسئله به این سادگی ها نیست، چونکه انبار داده تنها بخشی از بدنه پردازشی مکانیزم DSS را تشکیل می دهد.

برای داشتن چنین سیستمی ابتدا باید به پرسش های زیر پاسخ داد :

  • داده های انبار داده از کجا می آیند؟
  • چگونه باید آنها را نگهداری کنیم؟
  • ساختار درونی انبار داده چگونه است؟

اینها سوالاتی هستند که قبل از هر اقدامی جهت شکل گیری انبار داده باید پاسخ داده شوند.

طراحی و معماری DSS در واقع، اجرای یک سری برنامه  و بکارگیری ابزارهایی است که روندی را شکل می دهند، تا داده ها به شکل مناسبی از منابع مختلف و ناهمگن گردآوری، آماده سازی و نمایش داده شوند. این فرایند باید به گونه ای انجام گیرد که جامع، فراگیر، کامل، بدون کم و کاست، در بازه زمانی قابل قبول و نهایتا روشن و قابل فهم برای کاربران نهایی باشد.

ویژگی های داده های درون انبار داده

Bill Inmon، از اولین پیشگامان این مبحث، یک انبار داده را با واژه‌ های زیر تعریف کرده است :

  • Subject-Oriented : داده‌ها در یک انبار داده به نحوی سازمان ‌دهی می‌ شوند که تمام اجزای داده که با همان واقعه یا موضوع مرتبط هستند، به هم متصل باشند.
  • Time-Variant : تغییرات داده‌ها در یک انبار داده، ردیابی و ثبت می ‌شوند تا امکان تهیه گزارش ‌هایی که تغییرات را در طول زمان نشان می‌ دهند، فراهم شود.
  • Non-Volatile : داده‌های موجود در انبار داده، هیچگاه بروز رسانی یا پاک نمی‌ شوند، داده ثابت و بدون تغییر می ماند اما برای گزارش‌ های آینده حفظ می‌ شود.
  • Integrated : انبار داده‌ها  حاوی داده ‌هایی از همه یا اکثریت فعالیت‌ های اجزای سازمان می‌باشد و این داده ها پایدار است. بعنوان مثال یک انبار داده ممکن است برای یافتن روزی از هفته که در آن یک شرکت حداکثر فروش را در ماه مِی 1992 کرده است به کار برود و یا چگونه مرخصی بیماری کارمندان در هفته‌ی قبل از تعطیلات زمستانی بین کالیفورنیا و نیویورک از 2001-2005 متفاوت بود.در حالیکه سیستم‌های اجرایی برای سهولت استفاده و سرعت اصلاحات از طریق استفاده از نرمال‌سازی بانک داده‌ و یک مدل رابطه‌ی وجودی بهینه شده‌اند، انبار داده برای گزارش‌دهی و آنالیز بهینه شده است.



برچسب ها :

به سیاره لینوکس امتیاز دهید

به اين صفحه امتياز دهيد