các gđ phát hiện tri thứcKDD

Màu nền
Font chữ
Font size
Chiều cao dòng

-Các giai đoạn phát hiện tri thức(KDD):

+Chuẩn bị dữ liệu: đây là 1 giai đoạn chọn lọc trích rút các dữ liệu cần thiết từ CSDL tác nghiệp vào 1 CSDL riêng.Ta chỉ chọn DL cần thiết cho giai đoạn sau. Tuy nhiên việc gom DL vào 1 CSDL gặp rất nhiều khó khăn do DL nằm rải rác và có kiểu khác nhau.

+Làm sạch DL:phần lớn các CSDL đều ít nhiều mang tính nhất quán vì vậy trước khi thực hiện KPDL cần phải làm sạch DL.Chống trùng lặp:xoá bỏ các thong tin trùng lặp của các bản ghi.Giới hạn vùng giá trị.

+Làm giàu DL: mục đích của giai đoạn này là bổ sung thêm nhiều loại thông tin có liên quan vào CSDL gốc để làm được điều này ta cần phải có các CSDL khác ở bên ngoài có liên quan đến CSDL gốc, ban đầu ta tiến hành bổ sung thêm những thông tin cần thiết để làm tăng khả năng khám phá tri thức.

+Mã hoá DL: mục đích của giai đoạn này là chuyển đổi kiểu DL về những dạng thuận tiện để tiến hành khám phá DL.Phân vùng:chẳng hạn DL là giá trị của chuỗi thì chúng phải nằm trong tập các chuỗi cố định.Biến đổi giá trị:chuyển đổi thành Yes hoặc No.

-Trình diễn DL: đánh giá tri thức được rút ra từ giai đoạn KPDL để từ đó rút ra quyết định chọn lọc tri thức cần thiết.

Bạn đang đọc truyện trên: Truyen2U.Pro