Giới thiệu Bộ phần mềm của Salford Prediction Modeler® 8 Minitab - Minitab's Integrated Suite of Machine Learning Software

03/09/2020 82 lượt xem



Bộ phần mềm Salford Prediction Modeler® bao gồm các công cụ CART®, MARS®, TreeNet®, Random Forest® với các khả năng tự động hóa và mô hình hóa mới mạnh mẽ.
Các công nghệ khai thác dữ liệu của bộ phần mềm SPM bao gồm phân loại, hồi quy, phân tích tồn tại, phân tích giá trị bị thiếu, phân loại và phân cụm/ phân đoạn. các thuật toán SPM được coi là rất cần thiết trong khoa học dữ liệu phức tạp.
Tính năng tự động hóa của bộ phần mềm SPM đẩy nhanh quá trình xây dựng mô hình bằng cách thực hiện các phần quan trọng của quá trình khám phá và tinh chỉnh mô hình cho nhà phân tích.

* Yêu cầu hệ thống.

Hệ điều hành Windows.

  • Hệ điều hành (Chỉ dành cho 64-Bit): Windows 7 SP 1 trở lên, Windows 8 hoặc 8.1, Windows 10.

  • RAM: 4 GB.

  • Bộ xử lý: Intel® Pentium® 4 hoặc AMD Athlon ™ Dual Core, với công nghệ SSE2.

  • Dung lượng đĩa cứng: Còn trống 2 GB (tối thiểu).

  • Độ phân giải màn hình: 1024 x 768 trở lên.

Hệ điều hành Linux.

  • Hệ điều hành (Chỉ dành cho 64-Bit): Ubuntu 14.04 hoặc 16.04, CentOS 6.9 hoặc 7.5, RHEL 6.9 hoặc 7.5.

  • RAM: 4 GB.

  • Bộ xử lý: Intel® Pentium® 4 hoặc AMD Athlon ™ Dual Core, với công nghệ SSE2.

  • Dung lượng đĩa cứng: Còn trống 2 GB (tối thiểu).

    I/  CART.

Phân loại CART và cây hồi quy: Công cụ lập mô hình CART của Salford Predictive Modeler (SPM) tạo nên một cuộc cách mạng trong lĩnh vực phân tích  nâng cao mở đầu cho kỷ nguyên khoa học dữ liệu. CART là một trong những công cụ quan trọng nhất trong khai thác dữ liệu hiện đại.
Một số hãng phần mềm khác đã cố gắng sao chép phương pháp CART về độ chính xác, hiệu suất, bộ tính năng, tự động hóa tích hợp và tính tiện dụng trong sử dụng 
nhưng chưa thành công. Được được thiết kế cho cả những người dùng không có kỹ năng kỹ thuật, mô hình CART có thể nhanh chóng đưa ra các dữ liệu quang trọng liên quan đến nhau bị ẩn bằng cách sử dụng các công cụ phân tích khác.


Mã độc quyền:

Về mặt kỹ thuật, phương pháp CART dựa trên lý thuyết toán học mang tính bước ngoặt được giới thiệu vào năm 1984 bởi bốn nhà thống kê nổi tiếng thế giới tại Đại học Stanford và Đại học California tại Berkeley. Công cụ mô hình hóa CART, việc triển khai Cây phân loại và cây hồi quy của SPM, là phần mềm cây quyết định duy nhất thể hiện mã độc quyền ban đầu.

Nhanh chóng và linh hoạt:

Các phần mở rộng đã được cấp bằng sáng chế cho công cụ lập mô hình CART được thiết kế đặc biệt để nâng cao kết quả cho nghiên cứu thị trường và phân tích trang web. Công cụ mô hình hóa CART hỗ trợ triển khai tốc độ cao, cho phép các mô hình của Nhà mô hình dự đoán của Salford dự đoán và ghi điểm trong thời gian thực trên quy mô lớn. Trong những năm qua, công cụ lập mô hình CART đã được biết đến như một trong những thuật toán mô hình dự đoán phổ biến và dễ sử dụng nhất dành cho nhà phân tích, nó cũng được sử dụng làm nền tảng cho nhiều phương pháp khai thác dữ liệu hiện đại dựa trên việc đóng gói và tăng cường.

II/ Breiman và Cutler's 
Random Forests®

Random Forest® là một công cụ mô hình hóa tận dụng sức mạnh của nhiều phân tích thay thế, chiến lược ngẫu nhiên hóa và học tập theo nhóm.
Công cụ lập mô hình Ramdom Forest là tập hợp nhiều cây CART không bị ảnh hưởng lẫn nhau khi xây dựng. Tồng các dự đoán được thực hiện từ cây dữ liệu quyết định xác định dự đoán chung của Forest.
Điểm mạnh của Random Forest là phát hiện các điểm khác thường và bất thường trong dữ liệu, hiển thị các cụm gần nhau, dự đoán kết quả trong tương lai, xác định các yếu tố dự báo quan trọng, khám phá các mẫu dữ liệu, thay thế các giá trị bị thiếu bằng các hàm ý và cung cấp đồ họa sâu sắc.

Cụm và Phân đoạn:

Phần lớn thông tin chi tiết được cung cấp bởi công cụ mô hình Random Forest được tạo ra bằng các phương pháp được áp dụng sau khi cây dữ liệu được hình thành và bao gồm công nghệ mới để xác định các cụm hoặc phân đoạn trong dữ liệu cũng như các phương pháp mới để xếp hạng tầm quan trọng của các biến. Phương pháp này được phát triển bởi Leo Breiman và Adele Cutler của Đại học California, Berkeley, và được cấp phép độc quyền cho Minitab.

III/ MARS®

Công cụ lập mô hình MARS® lý tưởng cho những người dùng thích kết quả ở dạng tương tự như hồi quy truyền thống trong khi vẫn nắm bắt được các tương tác và phi tuyến tính cần thiết.
Các đường hồi quy và thích ứng đã biến : Cộng cụ lập mô hình MARS lý tưởng cho những người dùng thích kế quả ở dạng tương tự như hồi quy truyền thống trong khi vẫn nắm bắt được các tuuwong tác phi tuyến tính cần thiết. 

Phương pháp tiếp cận mô hình hồi quy của phương pháp MARS phát hiện một cách hiệu quả các mẫu và mối quan hệ dữ liệu quan trọng mà các phương pháp hồi quy khác rất khó, nếu không muốn nói là không thể tiết lộ. Công cụ mô hình MARS xây dựng mô hình của nó bằng cách ghép một loạt các đoạn thẳng với nhau với độ dốc cho phép của riêng nó. Điều này cho phép công cụ mô hình hóa MARS theo dõi bất kỳ mẫu nào được phát hiện trong dữ liệu.

Hồi quy và phân loại chất lượng cao

Mô hình MARS được thiết kế để dự đoán các kết quả bằng số, chẳng hạn như hóa đơn trung bình hàng tháng của một khách hàng sử dụng điện thoại di động hoặc số tiền mà một người mua sắm dự kiến ​​sẽ chi trong một lần truy cập trang web. Công cụ MARS cũng có khả năng tạo ra các mô hình phân loại chất lượng cao cho kết quả có / không. Công cụ MARS thực hiện lựa chọn biến, biến đổi, phát hiện tương tác và tự kiểm tra, tất cả đều tự động và ở tốc độ cao.

Kết quả hiệu suất cao

Các lĩnh vực mà  MARS đã thể hiện kết quả hiệu suất rất cao bao gồm dự báo nhu cầu điện cho các công ty phát điện, liên hệ điểm hài lòng của khách hàng với các thông số kỹ thuật của sản phẩm và mô hình hiện diện / vắng mặt trong hệ thống thông tin địa lý (GIS).

IV/ TreeNet®

TreeNet® Gradient Boosting là công cụ khai thác dữ liệu linh hoạt và mạnh mẽ nhất của SPM, có khả năng tạo ra các mô hình cực kỳ chính xác một cách nhất quán. Mức độ chính xác của công cụ tạo mô hình TreeNet thường không thể đạt được bằng mô hình đơn lẻ hoặc bởi các cụm như đóng bao hoặc tăng cường thông thường.
Công cụ TreeNet thể hiện hiệu suất đáng kể cho cả hồi quy và phân loại. Thuật toán thường tạo ra hàng nghìn cây quyết định nhỏ được xây dựng trong một quy trình sửa lỗi tuần tự để hội tụ thành một mô hình chính xác. Công cụ tạo mô hình TreeNet đã chịu trách nhiệm về phần lớn các giải thưởng cuộc thi mô hình của Minitab.

 

Độ chính xác tối cao:

Công cụ mô hình hóa TreeNet® bổ sung thêm lợi thế về mức độ chính xác thường không đạt được bởi một mô hình đơn lẻ hoặc bởi các bộ phận như đóng bao hoặc tăng cường thông thường. Trái ngược với mạng nơ-ron, phương pháp TreeNet không nhạy cảm với các lỗi dữ liệu và không cần chuẩn bị, xử lý trước hoặc nhập các giá trị bị thiếu mất thời gian. Loại lỗi dữ liệu này có thể rất khó khăn đối với các phương pháp khai thác dữ liệu thông thường và sẽ là thảm họa đối với việc thúc đẩy thông thường. Ngược lại, mô hình TreeNet thường miễn nhiễm với các lỗi như vậy vì nó tự động từ chối các điểm dữ liệu huấn luyện sai lệch quá nhiều so với mô hình hiện có. Tính mạnh mẽ của công cụ tạo mô hình TreeNet mở rộng đến dữ liệu bị nhiễm các nhãn đích sai.

Các tính năng tiên tiến:

Tính năng phát hiện tương tác thiết lập xem liệu các tương tác thuộc bất kỳ loại nào có cần thiết trong mô hình dự đoán hay không và là công cụ tìm kiếm phát hiện cụ thể những tương tác nào được yêu cầu. Hệ thống phát hiện tương tác không chỉ giúp cải thiện hiệu suất mô hình (đôi khi đáng kể) mà còn hỗ trợ phát hiện các phân đoạn mới có giá trị và các mẫu chưa được công nhận trước đây.

Hãy liên hệ với Hotline 024.6682,0511 email:software@jywsoft.com để biết thêm chi tiết về sản phẩm cũng như hỗ trợ kỹ thuật.