Minitab - các Mẹo & Thủ thuật CART

03/12/2020 155 lượt xem

Cây phân loại và cây hồi quy (CART) là gì?
CART là một kỹ thuật mô hình hóa dựa trên phân vùng đệ quy có thể được sử dụng để dự đoán cả phản hồi liên tục và phân loại. Các mô hình dự đoán này cung cấp lựa chọn biến tự động, dễ xây dựng trong Minitab và tốt nhất, mô hình có thể được hình dung như một cây quyết định dễ diễn giải. CART hữu ích như một giải pháp thay thế cho hồi quy tuyến tính hoặc logistic khi làm việc với các bộ dữ liệu quan sát lớn hoặc khi có các mối quan hệ phi tuyến phức tạp ..

Mẹo số 1: Sử dụng Node Split View để có cái nhìn cấp cao về decision tree của bạn

Chế độ xem chi tiết của một mô hình GIỎ HÀNG lớn có thể hơi khó hình dung, nhưng may mắn thay Minitab cung cấp một tùy chọn để xem chế độ xem cô đọng của cái cây. Chỉ cần nhấp chuột phải vào mô hình GIỎ HÀNG của bạn trong Minitab và chọn Node Split View. Chế độ xem cô đọng này chỉ hiển thị công cụ dự đoán được sử dụng mỗi khi dữ liệu được phân vùng.

 

 
Mẹo số 2: Lưu trữ dự đoán CART trong trang tính

Khi phản hồi hoặc biến mục tiêu là liên tục, mô hình cây hồi quy dự đoán giá trị trung bình trong mỗi nút đầu cuối. Đối với các biến kết quả phân loại, dự đoán là xác suất cho từng mức phản hồi, cũng như mức phản hồi được dự đoán. Để khám phá đồ thị các dự đoán của mô hình bằng cách sử dụng các hình ảnh trực quan khác trong Minitab, chỉ cần lưu trữ các dự đoán CART trong trang tính bằng cách sử dụng tùy chọn Storage.

 

 
Biểu đồ Tầm quan trọng của biến tương đối của CART hiển thị các yếu tố dự đoán theo thứ tự quan trọng của chúng. Có thể hình dung tác động của những yếu tố dự đoán quan trọng đó lên phản hồi bằng cách sử dụng các tùy chọn vẽ đồ thị của Minitab. Trong ví dụ dưới đây, hai yếu tố dự đoán liên tục quan trọng nhất trong mô hình phân loại được sử dụng để hình dung xác suất dự đoán của sự kiện phản hồi trên một biểu đồ đường đồng mức.
 


 
Mẹo số 3: Áp dụng hình phạt cho các công cụ dự đoán có nhiều giá trị bị thiếu hoặc các công cụ dự đoán phân loại có nhiều giá trị duy nhất

Các công cụ dự báo liên tục hoặc phân loại có nhiều giá trị bị thiếu hoặc các công cụ dự đoán phân loại có nhiều cấp có thể có lợi thế hơn các công cụ dự đoán có ít cấp hơn hoặc không có giá trị bị thiếu. Kết quả là, một trong những yếu tố dự báo này có thể “tiếp quản” cây, che đi ảnh hưởng của các yếu tố dự báo khác. Để giải quyết các điều kiện dữ liệu này, Minitab cung cấp một tùy chọn áp dụng hình phạt đối với những người dự đoán có nhiều giá trị bị thiếu hoặc những người dự đoán phân loại có nhiều giá trị duy nhất.
 

 
Những hình phạt này có thể được tìm thấy thông qua Options menu, Dưới File > Options. Các hình phạt có thể được áp dụng cho cả cây phân loại hoặc cây hồi quy, và các giá trị phạt nằm trong khoảng từ 0 đến 2 đối với các giá trị bị thiếu và 0 đến 5 đối với các công cụ dự đoán phân loại (trong đó 0 là không có hình phạt và giá trị cao tương ứng là hình phạt tối đa).


📣📣📣Liên hệ ngay với #JYWSOFT để được nhận báo giá và tư vấn về sản phẩm kỹ hơn. 
Hotline : 0246 682 0511
Email : softwware@jywvina.com
🌐Website : https://jywsoft.com Add : Tầng 4, Tòa nhà N01-T4, Khu Đoàn Ngoại Giao, P. XuânTảo, Q. Bắc Từ Liêm, TP. Hà Nội
🎵🎵🎵
Have a nice day !