Phân tích dữ liệu với phần mềm thống kê Minitab

16/01/2023 48 lượt xem
Phần mềm Minitab giải pháp phân tích và thống kê số liệu hiệu quả, được sử dụng rộng dãi cho các doanh nghiệp có quy mô nhỏ, vừa và lớn. Vậy phân tích dữ liệu với Minitab như thế nào? Bài viết dưới đây JYWSOFT sẽ hướng dẫn bạn phân tích dữ liệu và thực hiện ANOVA với phần mềm Minitab phiên bản mới nhất, dựa trên tài liệu Getting Started with Minitab Statistical Software.

Phân tích dữ liệu với phần mềm Minitab

1. Tổng Quan

Lĩnh vực thống kê cung cấp các nguyên tắc và phương pháp để thu thập, tóm tắt và phân tích dữ liệu cũng như để giải thích kết quả. Bạn sử dụng số liệu thống kê để mô tả dữ liệu và đưa ra suy luận. Sau đó, bạn sử dụng các suy luận để cải tiến quy trình và sản phẩm. Bản quyền Minitab cung cấp nhiều phân tích thống kê, chẳng hạn như hồi quy, ANOVA, các công cụ chất lượng và chuỗi thời gian. Đồ thị dựng sẵn giúp bạn trực quan hóa dữ liệu và xác thực kết quả của mình. Trong Minitab, bạn cũng có thể hiển thị và lưu trữ số liệu thống kê và các biện pháp chẩn đoán.
Trong phần này (phần 3), bạn sẽ học được cách đánh giá số lượng đơn đặt hàng trễ và đơn hàng trả lại, đồng thời kiểm tra xem liệu sự khác biệt về thời gian giao hàng giữa ba trung tâm vận chuyển có đáng kể về mặt thống kê hay không.
Xem thêm Hướng dẫn sử dụng phần mềm thống kê Minitab cho người mới bắt đầu từ A-Z phần 1 tại đây.

2. Thống kê là gì?

Thống kê mô tả tóm tắt và mô tả các đặc điểm nổi bật của dữ liệu. Sử dụng Thống kê mô tả trên Hiển thị để xác định có bao nhiêu đơn đặt hàng sách đã được giao đúng hạn, bao nhiêu đơn đặt hàng bị trễ và bao nhiêu đơn đặt hàng đã được đặt hàng lại ban đầu cho mỗi trung tâm vận chuyển.

Hiển thị thống kê mô tả trong Minitab

1. Các bước thực hiện thống kê mô tả với Minitab

  • Bước 1: Mở dữ liệu, MTW.
  • Bước 2: Chọn Stat > Basic Statistics > Display Descriptive Statistics.
  • Bước 3: Trong Variables, nhập Days.
  • Bước 4: Trong By variables (optional), nhập Center Status. Đối với hầu hết các lệnh Minitab, bạn chỉ cần hoàn thành hộp thoại chính để thực thi lệnh. Thông thường, bạn sử dụng các hộp thoại phụ để sửa đổi phân tích hoặc để hiển thị đầu ra bổ sung, chẳng hạn như đồ thị.
  • Bước 5: Nhấp Statistics.
  • Bước 6: Bỏ chọn First quartile, Median, Third quartile, N nonmissing, và N missing.
  • Bước 7: Chọn N total
Phan mem Minitab: Huong dan phan tich du lieu
Thống kê mô tả với phần mềm Minitab 
  • Bước 8: Nhấp OK trong mỗi hộp thoại

Lưu ý: Những thay đổi bạn thực hiện trong hộp thoại con Thống kê chỉ ảnh hưởng đến phiên hiện tại. Bạn có thể thay đổi các tùy chọn mặc định cho các phiên trong tương lai. Chọn Tệp> Tùy chọn. Mở rộng Các lệnh riêng lẻ và chọn Hiển thị Thống kê Mô tả. Chọn thống kê mà bạn muốn hiển thị. Khi bạn mở lại hộp thoại con Thống kê, nó sẽ hiển thị các tùy chọn mới của bạn.

Mô tả phân tích: Ngày

Results for Center =
Statistics
Variable         Status
Central
Total Count
Mean SE Mean StDev Minimum Maximum
Days              Back order 6 * * * * *
Late 6 6.431 0.157 0.385 6.078 7.070
On time 93 3.826 0.119 1.149 1.267 5.983
Results for Center = Eastern          
Statistics            
 
Variable         Status
Total Count  
Mean
 
SE Mean
 
StDev
 
Minimum
 
Maximum
Days              Back order 8 * * * * *
Late 9 6.678 0.180 0.541 6.254 7.748
On time 92 4.234 0.112 1.077 1.860 5.953
Results for Center = Western          
Statistics            
 
Variable         Status
Total Count  
Mean
 
SE Mean
 
StDev
 
Minimum
 
Maximum
Days              Back order 3 * * * * *
On time 102 2.981 0.108 1.090 0.871 5.681

Lưu ý: Bạn có thể gửi bất kỳ đầu ra nào tới các phiên bản Microsoft® Word, Microsoft® PowerPoint, Minitab Engage ™ và Minitab Workspace® được cài đặt cục bộ. Để gửi một biểu đồ hoặc bảng riêng lẻ, hãy nhấp chuột phải vào phần đầu ra và chọn chương trình mà bạn muốn gửi đầu ra. Để gửi nội dung của toàn bộ tab đầu ra, bấm chuột phải vào tiêu đề đầu ra phía trên dòng ở đầu ngăn.

2. Giải thích kết quả

Ngăn đầu ra hiển thị kết quả của từng trung tâm một cách riêng biệt. Trong mỗi trung tâm, bạn có thể thấy số lượng đơn đặt hàng trả lại, đơn đặt hàng trễ và đơn đặt hàng đúng hạn trong cột Tổng số:

  • Trung tâm vận chuyển miền Đông có nhiều đơn hàng lùi nhất (8) và đơn hàng trễ (9).
  • Trung tâm vận chuyển miền Trung có nhiều đơn hàng lùi tiếp theo (6) và đơn hàng trễ (6).
  • Trung tâm vận chuyển miền Tây có ít đơn hàng gửi lại nhất (3) và không có đơn hàng trễ hạn

Đầu ra cũng bao gồm giá trị trung bình, sai số chuẩn của giá trị trung bình, độ lệch chuẩn, tối thiểu và tối đa của thời gian giao hàng tính theo ngày cho mỗi trung tâm. Những thống kê này không tồn tại cho các đơn đặt hàng trở lại.
Một trong những phương pháp phổ biến nhất được sử dụng trong phân tích thống kê là kiểm định giả thuyết. Bản quyền Minitab cung cấp nhiều thử nghiệm giả thuyết, bao gồm kiểm định t và ANOVA (phân tích phương sai). Thông thường, khi bạn thực hiện kiểm tra giả thuyết, bạn giả định một khẳng định ban đầu là đúng, sau đó kiểm tra khẳng định này bằng cách sử dụng dữ liệu mẫu.
Kiểm định giả thuyết bao gồm hai giả thuyết (khẳng định), giả thuyết vô hiệu (H0) và giả thuyết thay thế (H1). Giả thuyết vô hiệu là khẳng định ban đầu và thường được xác định dựa trên nghiên cứu trước đó hoặc kiến ​​thức thông thường. Giả thuyết thay thế là những gì bạn tin là có thể đúng.
Với phân tích đồ họa trong phần trước (phần 2) phân tích mô tả ở trên, bạn nghi ngờ rằng sự khác biệt về số ngày giao hàng trung bình giữa các trung tâm vận chuyển là có ý nghĩa thống kê. Để xác minh điều này, bạn thực hiện ANOVA một chiều, kiểm tra tính bình đẳng của hai hoặc nhiều phương tiện. Bạn cũng thực hiện kiểm tra so sánh nhiều lần của Tukey để xem phương tiện của trung tâm vận chuyển nào khác nhau. Đối với ANOVA một chiều này, ngày giao hàng là phản hồi và trung tâm vận chuyển là yếu tố.

Thực Hiện ANOVA

1. Các bước thực hiện ANOVA trong phần mềm Minitab

  • Bước 1: Chọn Stat > ANOVA > One-Way.
  • Bước 2: Chọn Response data are in one column for all factor levels.
  • Bước 3: Trong Response, nhập Days. In Factor, nhập Center.
Thuc hien ANOVA voi phan mem Minitab
Thực hiện ANOVA với Minitab
  • Bước 4: Nhấp Comparisons.
  • Bước 5: Bên dưới Comparison procedures assuming equal variances
Phan mem Minitab: Huong dan thuc hien ANOVA
Thực hiện ANOVA với phần mềm Minitab
  • Bước 6: Bấm chọn Tukey.
  • Bước 7: Nhấp OK.
  • Bước 8: Nhấp Graphs. Đối với nhiều lệnh thống kê, Minitab bao gồm các biểu đồ giúp bạn giải thích kết quả và đánh giá tính hợp lệ của các giả định thống kê. Các đồ thị này được gọi là đồ thị dựng sẵn.
  • Bước 9: Bên dưới Data plots, Bấm chọn Interval plot, Individual value plot, và Boxplot of data.
Phan mem Minitab: Huong dan thuc hien ANOVA
Các bước thực hiện ANOVA
  • Bước 10: Phần Residual plots, chọn Four in one
  • Bước 11: Chọn OK trong mỗi hộp thoại
​One-way ANOVA: Days versus Center
Phương thức

Giả thuyết vô hiệu: Tất cả nghĩa đều bằng nhau
Giả thuyết thay thế: Không hầu hết bằng nhau
Mức độ đáng kể: α = 0.05
Hàng không sử dụng: 17
Các phương sai bằng nhau giả định phân tích
Yếu tố thông tin
Các cấp độ: trọng tâm 3
Các giá trị: trung tâm, miền đông, miền tây

Phân tích phương sai

 
Gộp StDev = 1.20933
Các phép so sánh theo cặp Tukey
Nhóm thông tin bằng phương pháp Tukey và độ tin cậy 95%
Means nghĩa là không chia sẻ thư đều là khác nhau đáng kể
Tukey 95% Cls
Khoảng thời gian giữa Days vs Center
Giá trị cá nhân giữa Days vs Center
Boxplot cho Days
Plot còn lại cho Days

  1. Diễn giải đầu ra

Quá trình ra quyết định cho một bài kiểm tra giả thuyết dựa trên giá trị p, cho biết xác xuất bác bỏ giả thuyết rỗng khi nó thực sự đúng.

  • Nếu giá trị p nhỏ hơn hoặc bằng mức ý nghĩa xác định trước (ký hiệu là hoặc alpha), thì bạn bác bỏ giả thuyết vô hiệu và hỗ trợ giả thuyết thay thế.

  • Nếu giá trị p lớn hơn , thì bạn không thể bác bỏ giả thuyết

Với α là 0,05, giá trị p (0,000) trong bảng Phân tích phương sai cung cấp đủ bằng chứng để kết luận rằng thời gian giao hàng trung bình của ít nhất hai trong số các trung tâm vận chuyển là khác nhau đáng kể.

  1. Diễn Giải Đồ Thị ANOVA

Giải Thích Các Ô Còn Lại

Sử dụng các ô còn lại, có sẵn với nhiều lệnh thống kê, để xác minh các giả định thống kê

Xác suất bình thường

Sử dụng đồ thị này để phát hiện tính bất thường. Các điểm xấp xỉ theo một đường thẳng chỉ ra rằng phần dư được phân phối bình thường.

Biểu đồ

Sử dụng biểu đồ này để phát hiện nhiều đỉnh, giá trị ngoại lệ và bất thường. Hãy tìm một biểu đồ bình thường, gần đối xứng và có hình chuông.

Versus Fits

Sử dụng biểu đồ này để phát hiện phương sai không thay đổi, thiếu các thuật ngữ bậc cao hơn và các ngoại lệ. Tìm phần dư nằm rải rác ngẫu nhiên xung quanh số không.

Versus Order

Sử dụng biểu đồ này để phát hiện sự phụ thuộc vào thời gian của các phần dư. Kiểm tra biểu đồ để đảm bảo rằng các phần còn lại không hiển thị hình mẫu rõ ràng. Đối với dữ liệu vận chuyển, các ô dư bốn trong một cho thấy không vi phạm các giả định thống kê. Mô hình ANOVA một chiều phù hợp với dữ liệu tương đối tốt.
Lưu ý: Trong Minitab, bạn có thể hiển thị từng ô còn lại trong một biểu đồ riêng biệt trên cùng một tab

Diễn Giả Biểu Đồ Thời Gian, Biểu Đồ Giá Trị Riêng Lẻ Và Biểu Đồ Hình Hộp

Kiểm tra biểu đồ thời gian, biểu đồ giá trị riêng lẻ và biểu đồ hình hộp. Mỗi biểu đồ chỉ ra rằng thời gian giao hàng khác nhau tùy theo trung tâm vận chuyển, điều này phù hợp với biểu đồ từ chương trước. Hộp thư cho trung tâm vận chuyển miền Đông có dấu hoa thị. Dấu hoa thị xác định một ngoại lệ. Đơn hàng ngoại lệ này là đơn hàng có thời gian giao hàng dài bất thường.
Kiểm tra lại đồ thị  thời gian. Biểu đồ khoảng thời gian hiển thị khoảng tin cậy 95% cho mỗi giá trị trung bình. Giữ con trỏ qua các điểm trên biểu đồ để xem phương tiện. Giữ con trỏ trên các thanh khoảng thời gian để xem khoảng tin cậy 95%. Biểu đồ thời gian cho thấy trung tâm vận chuyển miền Tây có thời gian giao hàng trung bình nhanh nhất (2,981 ngày) và khoảng tin cậy là 2,75 đến 3,22 ngày.

Giải Thích Biểu Đồ Tin Cậy 95% Tukey

Biểu đồ khoảng tin cậy Tukey 95% là đồ thị tốt nhất để sử dụng để xác định các phạm vi có khả năng xảy ra cho sự khác biệt và để đánh giá ý nghĩa thực tế của những khác biệt đó. Khoảng tin cậy Tukey hiển thị các so sánh theo từng cặp sau:
• Trung tâm vận chuyển miền Đông trừ đi trung tâm vận chuyển miền Trung
• Trung tâm vận chuyển miền Tây trung tâm trừ đi trung tâm vận chuyển miền Trung
• Trung tâm vận chuyển miền Tây trừ đi trung tâm vận chuyển miền Đông
Giữ con trỏ qua các điểm trên biểu đồ để xem các ước tính giữa, trên và dưới. Khoảng thời gian cho phép so sánh miền Đông trừ miền Trung là 0,068 đến 0,868. Tức là thời gian giao hàng trung bình của trung tâm vận chuyển miền Đông trừ đi thời gian giao hàng trung bình của trung tâm vận chuyển miền trung là từ 0.068 đến 0.868 ngày. Việc giao hàng của trung tâm vận chuyển miền Đông mất nhiều thời gian hơn so với giao hàng của trung tâm vận chuyển miền Trung. Bạn giải thích các khoảng tin cậy Tukey khác tương tự. Ngoài ra, hãy chú ý đến đường đứt nét ở số không. Nếu một khoảng không chứa 0, các giá trị tương ứng sẽ khác nhau đáng kể. Do đó, tất cả các trung tâm vận chuyển có thời gian giao hàng trung bình khác nhau đáng kể.
Giả sử bạn muốn biết thêm thông tin về cách diễn giải ANOVA một chiều, cụ thể là phương pháp so sánh nhiều lần của Tukey. Minitab cung cấp thông tin chi tiết về kết quả đầu ra cho hầu hết các lệnh thống kê.
• Từ ngăn đầu ra, nhấp vào mũi tên và chọn Trợ giúp.

Lưu Dự Án

Lưu tất cả công việc của bạn trong dự án Minitab

  1. Nếu bạn chưa hoàn toàn lưu dự án, chọn File > Save Project.

  2. Chọn vị trí muốn lưu

  3. Đặt tên dự án MyStats.

  4. Nhấp Save.

Chương Kế Tiếp

Thống kê mô tả và kết quả ANOVA chỉ ra rằng trung tâm vận chuyển miền Tây có ít đơn đặt hàng trễ và đơn hàng trả lại nhất và có thời gian giao hàng ngắn nhất. Trong chương tiếp theo, bạn tạo một biểu đồ kiểm soát và thực hiện phân tích khả năng để điều tra xem quy trình của trung tâm vận chuyển Western có ổn định theo thời gian và có khả năng hoạt động trong các thông số kỹ thuật hay không.