Data Mart là một phần nhỏ trong hệ thống lưu trữ thông tin tổng, được tạo ra với mục đích chuyên biệt hoặc tập trung vào một chủ đề hoặc mục đích kinh doanh nhất định. Data Mart là nơi lưu trữ các bản ghi phân tích được thiết kế để phục vụ các chức năng kinh doanh cụ thể cho một nhóm người dùng trong một tổ chức. Data Mart có nguồn gốc từ các phần nhỏ trong hệ thống lưu trữ thông tin, mặc dù trong quá trình thiết kế hệ thống lưu trữ thông tin, Data Mart được tạo thành bằng cách kết hợp các Data Mart con lại.
Trung tâm dữ liệu thường được sử dụng chủ yếu là để thực hiện các ứng dụng Business Intelligence (BI). BI được sử dụng để thu thập, lưu trữ, truy cập và phân tích dữ liệu. Do đó, nó có thể được sử dụng bởi các doanh nghiệp nhỏ hơn để tận dụng dữ liệu do mình tích lũy được mà không cần đầu tư nhiều nguồn lực vào việc triển khai một hệ thống lưu trữ thông tin hoàn chỉnh.
Bạn đang xem: Data Mart là gì? Tìm hiểu tổng quan về Data mart
- Tạo dữ liệu đặc thù bởi một nhóm người dùng cụ thể.
- Dễ dàng truy cập vào dữ liệu cần thiết thường xuyên.
- Khả năng sáng tạo dễ dàng.
- Cải thiện thời gian phản hồi cho khách hàng.
- Chi phí triển khai thấp hơn so với việc triển khai một hệ thống lưu trữ thông tin hoàn chỉnh.
- Xác định rõ ràng khách hàng tiềm năng hơn so với việc sử dụng một hệ thống lưu trữ thông tin toàn diện.
- Chỉ chứa dữ liệu kinh doanh cần thiết và ít loạn xạ hơn.
Có hai phương pháp chính để thiết kế Data Mart:
- Dependent Data Marts (Data Mart phụ thuộc)
- Independent Data Marts (Data Mart độc lập)
Data Mart phụ thuộc là một phần hợp lý của một phần vật lý trong hệ thống lưu trữ thông tin. Trong phương pháp này, các Data Mart được xem là các phần nhỏ của hệ thống lưu trữ thông tin. Ban đầu, một hệ thống lưu trữ thông tin được tạo ra để từ đó có thể tạo ra các Data Mart khác nhau. Các Data Mart này phụ thuộc vào hệ thống lưu trữ thông tin và trích xuất các bản ghi cần thiết từ đó. Trong phương pháp này, khi Data Mart được tạo ra từ hệ thống lưu trữ thông tin, không cần công việc tích hợp Data Mart. Phương pháp này còn được gọi là phương pháp từ trên xuống.
Phương pháp thứ hai là Data Mart độc lập. Trong phương pháp này, trước tiên, các Data Mart độc lập được tạo ra, sau đó một hệ thống lưu trữ thông tin được thiết kế bằng cách sử dụng các Data Mart độc lập này. Theo cách tiếp cận này, vì tất cả các Data Mart được thiết kế độc lập, công việc tích hợp các Data Mart là bắt buộc. Phương pháp này cũng được gọi là phương pháp từ dưới lên vì các Data Mart được tích hợp để phát triển một hệ thống lưu trữ thông tin.
Xem thêm : Lập trình viên là gì? Tố chất để trở thành lập trình viên thành công
Ngoài hai phương pháp này, còn một loại Data Mart khác tồn tại được gọi là “Hybrid Data Marts” (Data Mart lai). Loại này cho phép kết hợp dữ liệu từ bên ngoài hệ thống lưu trữ thông tin. Điều này phù hợp cho nhiều tình huống, đặc biệt là trong việc tích hợp Adhoc, chẳng hạn như bổ sung một nhóm mới trong một tổ chức.
Các bước quan trọng để triển khai Data Mart bao gồm thiết kế cơ sở dữ liệu, xây dựng cơ sở dữ liệu vật lý, điền dữ liệu vào Data Mart từ các nguồn hệ thống, truy cập dữ liệu để đưa ra quyết định thông minh và quản lý Data Mart theo thời gian. Do đó, các bước cụ thể bao gồm:
Bước thiết kế là bước đầu tiên trong quy trình triển khai Data Mart. Giai đoạn này bao gồm các hoạt động từ việc xác định yêu cầu trung tâm dữ liệu thông qua việc thu thập dữ liệu về các yêu cầu và phát triển thiết kế logic và vật lý của trung tâm dữ liệu.
Các nhiệm vụ bao gồm:
- Thu thập yêu cầu kinh doanh và kỹ thuật.
- Xác định nguồn dữ liệu.
- Lựa chọn phần dữ liệu phù hợp.
- Thiết kế kiến trúc logic và vật lý của Data Mart.
Bước này bao gồm việc xây dựng cơ sở dữ liệu vật lý và các cấu trúc logic liên quan đến Data Mart để cung cấp khả năng truy cập nhanh chóng và hiệu quả vào dữ liệu.
Các nhiệm vụ bao gồm:
- Xây dựng cơ sở dữ liệu vật lý và các cấu trúc logic, ví dụ như không gian bảng liên kết với hệ thống lưu trữ thông tin.
- Tạo các đối tượng lược đồ như bảng và chỉ mục được mô tả trong bước thiết kế.
- Xác định cách tốt nhất để cấu trúc bảng và cấu trúc truy cập.
Xem thêm : Vè là gì?
Bước này bao gồm tất cả các nhiệm vụ liên quan đến việc lấy dữ liệu từ nguồn, làm sạch, biến đổi dữ liệu theo đúng định dạng và mức độ chi tiết và chuyển dữ liệu vào Data Mart.
Các nhiệm vụ bao gồm:
- Ánh xạ các nguồn dữ liệu sang nguồn dữ liệu đích.
- Trích xuất dữ liệu.
- Làm sạch và chuyển đổi thông tin.
- Tải dữ liệu vào Data Mart.
- Tạo và lưu trữ siêu dữ liệu.
Bước này liên quan đến việc sử dụng dữ liệu: truy vấn dữ liệu, phân tích dữ liệu, tạo báo cáo, biểu đồ và đồ thị và xuất bản chúng.
Các nhiệm vụ bao gồm:
- Thiết lập lớp trung gian (Meta Layer) để các công cụ front-end sử dụng. Lớp này chuyển các hoạt động cơ sở dữ liệu và tên đối tượng thành các điều kiện kinh doanh để người dùng cuối có thể tương tác với trung tâm dữ liệu bằng cách sử dụng các thuật ngữ liên quan đến chức năng kinh doanh.
- Thiết lập và quản lý kiến trúc cơ sở dữ liệu như bảng tóm tắt giúp các truy vấn được thực hiện nhanh chóng và hiệu quả thông qua các công cụ front-end.
Bước này liên quan đến việc quản lý Data Mart trong suốt thời gian tồn tại của nó. Các chức năng quản lý bao gồm:
- Cung cấp quyền truy cập an toàn vào dữ liệu.
- Quản lý sự tăng trưởng của dữ liệu.
- Tối ưu hóa hệ thống để đạt hiệu suất tốt hơn.
- Đảm bảo tính khả dụng của dữ liệu trong trường hợp xảy ra lỗi hệ thống.
Source: Internet
Để hiểu thêm và tham khảo kiến thức về dữ liệu, bạn có thể truy cập vào https://indaacademy.vn/blog/. Cảm ơn và hẹn gặp bạn trong kiến thức tiếp theo.