1. BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐH NGOẠI NGỮ TIN HỌC TP.HCM
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO THỰC TẬP TỐT NGHIỆP CỬ NHÂN CNTT
TÌM HIỂU KỸ THUẬT PHÂN TÍCH
DỮ LIỆU TRỰC TUYẾN
VÀ ỨNG DỤNG TRONG
HỆ THỐNG QUẢN LÝ BÁN HÀNG
GIẢNG VIÊN HƢỚNG DẪN: Th.S NGUYỄN PHƢỚC ĐẠI
SINH VIÊN THỰC HIỆN: LAI ĐẠI KIỆT
LÊ HOÀNG PHƢƠNG NAM
2. Nội dung trình bày
Phần 1 :Giới thiệu OLAP
Định nghĩa OLAP
Nguyên tắc và đặc trưng Codd
Vì sao sử dụng OLAP
Các thành phần của OLAP
Các loại mô hình dữ liệu đa chiều của OLAP
Phần 2 : Xây dựng hệ thống bán hàng.
Phần 3 : Demo
4. Định nghĩa OLAP
OLAP là từ viết tắt của On-Line Analytical
Processing (phân tích trực tuyến) khác với OLTP On-
Line Transactional Processing (giao dịch trực tuyến).
OLAP thường được định nghĩa bao gồm các đặc
điểm đa chiều, hồi đáp nhanh, được diễn tả như 1 sơ đồ
hình khối.
Các ứng dụng của OLAP khác với các ứng dụng của
OLTP ở chổ lưu trữ dữ liệu, cách thức phân tích dữ liệu
và cách hiển thị dữ liệu cho người dùng. OLAP cho phép
trả lời các câu hỏi phức tạp hơn trong lĩnh vực kinh
doanh.
5. Nguyên tắc và đặc trưng Codd
Edgar F. Codd (1923-2003)
6. Các đặc trƣng cơ bản
Thể hiện ở mức quan niệm đa chiều – Multidimensional
Conceptual View.
Tương tác dữ liệu trực quan – Intuitive Data Manipulation.
Tính liên kết với OLAP là trung gian – Accessibility: OLAP as
a Mediator
Trích xuất thông tin từng phần và dẫn giải – Batch Extraction
vs Interpretive.
Mô hình phân tích OLAP – OLAP Analysis Models
Kiến trúc Client/Server – Client/Server Architecture.
Trong suốt dữ liệu – Transparency
Hỗ trợ đa người dùng – Multi-User Support
7. Các đặc trƣng đặc biệt
Xử lý dữ liệu chưa chuẩn hoá – Treatment of Non-
Normalized Data.z
Lưu trữ kết quả OLAP độc lập với dữ liệu nguồn – Storing
OLAP Results: Keeping them Separate from Source Data
Trích xuất giá trị khuyết – Extraction of Missing Values.
Xử lý giá trị khuyết – Treatment of Missing Values.
8. Các đặc trƣng báo cáo
Báo cáo linh hoạt – Flexible Reporting
Hiển thị báo cáo đồng bộ - Uniform Reporting
Performance
Tự động điều chỉnh tầng vật lý – Automatic Adjustment of
Physical Level.
Các đặc trƣng đa chiều:
Không giới hạn chiều và kết hợp các tầng – Unlimited
Dimensions & Aggregation Levels
Không hạn chế các hoạt động nối nhiều chiều –
Unrestricted Cross-dimensional Operations.
9.
10. Tại sao sử dụng OLAP
Nhu cầu thực tế
Tăng lƣu trữ dữ liệu
Dữ liệu so với thông tin
Bố trí dữ liệu
13. Các thành phần của OLAP
Bảng sự kiện – FACT TABLE
Chiều – DIMENSION
14. Các thành phần của OLAP
Độ đo – MEASURE
Các đơn vị đo của khối là các cột trong bảng Fact. Các
đơn vị đo lƣờng xác định những giá trị số từ bảng Fact mà
đƣợc tổng hợp phân tích nhƣ định giá, trị giá, hoặc số lƣợng
bán.
15. Các mô hình xử lý đa chiều OLAP
Mô hình Multidimensional OLAP(MOLAP)
16. Các mô hình xử lý đa chiều OLAP
Mô hình Relational OLAP (ROLAP)
17. Các mô hình xử lý đa chiều OLAP
Mô hình Hybird OLAP (HOLAP)
19. Nội dung
Phát biểu bài toán
Sơ đồ Usecase
Mô hình cơ sở dữ liệu OLTP
Mô hình cơ sở dữ liệu OLAP
20. Phát biểu bài toán
Sử dụng cơ sở dữ liệu của công ty Adventure Work.
Chương trình rút trích từ cơ sở dữ liệu có sẵn.
21.
22. Sơ đồ Usecase
Bao cao doanh thu giua cac doanh thu cua hang
Bao cao doanh thu cua hang
Bao cao doanh thu ban hang qua mang
Bao cao cong viec giua cac nhan viec
NQL
25. Kết luận
•Hiểu được tổng quan về hệ thống phân tích dữ
liệu trực tuyến OLAP
•Thấy được sự khác biệt về cơ sở dữ liệu OLAP
và cơ sở dữ liệu truyền thống.
•Biết được điểm mạnh của cở sơ dữ liệu OLAP
trong việc xử lý phân tích và tổng hợp dữ liệu.
Kết quả đạt đƣợc – Phần nghiên cứu
26. Kết luận
Kết quả đạt đƣợc – Phần ứng dụng
•Xây dựng được ứng dụng giúp cho nhà quản lý xem
được báo cáo tổng hợp kinh doanh.
•Vận dụng được các khả năng hổ trợ của OLAP trong
việc phân tích tình hình kinh doanh của công ty.
•Tạo được các mẫu báo cáo theo ý muốn, tùy vào
mục đích và yêu cầu phân tích của người quản lý mà
không đòi hỏi phụ thuộc nghiệp vụ.
27. Kết luận
•Chương trình tải giao diện chậm, dẫn đến hiểu
lầm tốc độ truy xuất của dữ liệu.
•Chưa thể hiện hết những khả năng của OLAP.
•Chưa sử dụng khả năng tính toán (calculate) của
OLAP để tạo các báo cáo có khả năng tính toán
xác suất, thống kê.
Hạn chế
Tiến sĩ Codd là một nhà nghiên cứu cơ sở dữ liệu nổi tiếng từ thập niên 1960 đến thập niên 1980, là người phát minh ra mô hình dữ liệu quan hệ năm 1969. Vào năm 1993 ông đã xuất bản một cuốn sách về OLAP trong đó ông đưa ra 12 nguyên tắc nổi tiếng về OLAP, ông đã thêm 5 nguyên tắc nữa vào năm 1995 và tái cấu trúc lại các nguyên tắc này thành 4 nhóm và gọi chúng là các đặc trưng.