T statistic là gì

Đây là bài xích dịch giờ Việt của chính mình về một nội dung bài viết rất lôi cuốn giải thích chân thành và ý nghĩa của pmùi hương pháp t-test (hay cách thức chu chỉnh t – trong nội dung bài viết mình chỉ hotline là t-thử nghiệm mang đến nthêm gọn) của tác giả Patriông xã Runkel. Bài gốc bởi tiếng Anh mang tên không thiếu là “What Is a t-test? And Why Is It Like Telling a Kid to lớn Clean Up that Mess in the Kitchen?” cùng các chúng ta cũng có thể phát âm bài xích cội trên trên đây.

Bạn đang xem: T statistic là gì

Phương pháp t-chạy thử là một giữa những giấy tờ thủ tục được sử dụng phổ cập nhất trong kỹ thuật thống kê.

Nhưng thậm chí còn hầu như người sử dụng t-chạy thử một cách liên tục cũng ngần ngừ đúng mực cách thức này vận động ra sao vì chưng tất cả các tài liệu hồ hết được xử lý sau tấm màn đậy của các phần mềm thống kê lại, ví dụ như Minitab.

Và thật là xứng đáng để bọn họ quăng quật một ít thời hạn giúp thấy phương pháp t-kiểm tra chuyển động ra làm sao nghỉ ngơi phía sau tấm màn che đó.

Bởi bởi nếu như bạn hiểu được giải pháp phương thức t-test vận động, chúng ta cũng có thể phát âm tại một mức độ sâu rộng về dữ liệu của chúng ta dựa trên kết quả mà lại cách thức t-thử nghiệm mang đến. Và chúng ta cũng phát âm sâu hơn tại sao kết quả phân tích của khách hàng giành được (hoặc không đạt được) “ý nghĩa thống kê” (statistical significant).

Thực tế là nếu bạn gồm một đứa con vẫn trong tuổi teen yêu thích nạp năng lượng đùa nhiều hơn là phù hợp thao tác làm việc bên thì chắc rằng là bạn đã có một yêu cầu y như số đông nguyên lý cơ phiên bản ẩn dưới phương pháp t-kiểm tra.

*

Giải phẫu phương thức t-test

Phương thơm pháp t-chạy thử được sử dụng một biện pháp thông dụng nhằm xác minh xem liệu giá trị vừa đủ của một quần thể (the mean of a population) có khác biệt với 1 quý giá làm sao đó (Điện thoại tư vấn là quý hiếm vừa đủ trả ttiết – a hypothesized mean) hoặc với giá trị vừa phải của một quần thể khác.

ví dụ như, phương thức 1-sample t-test (giỏi phương pháp chu chỉnh t cho một mẫu) được dùng để làm chu chỉnh xem liệu thời gian hóng vừa phải của những bệnh nhân vào một bệnh viện y khoa tất cả vĩnh viễn đối với thời hạn ước muốn là 15 phút hay không, dựa trên dữ liệu từ một đội nhóm bỗng dưng các người bị bệnh.

Để xác định xem liệu sự biệt lập (thân thời gian hóng thực tế và thời hạn mong mỏi muốn) tất cả ý nghĩa thống kê hay không, phương pháp t-kiểm tra công thêm toán một giá trị gọi là t-value (cực hiếm p-value nổi tiếng cũng rất được rước trực tiếp trường đoản cú t-value). Giá trị này được xem nhỏng sau:

t = fracarx - mu _0fracssqrtn

Công thức toán thù học tập này trông có vẻ như bí ẩn cơ mà thực ra chúng ta hoàn toàn có thể quản lý được nó nếu như khách hàng phát âm được nhị động lực quan trọng đằng sau nó : thành phần số (ở phía trên) với phần chủng loại số (ngơi nghỉ phía dưới).

Phần tử số là Tín Hiệu

Phần tử số vào phương pháp 1-sample t-thử nghiệm đo lường độ mạnh của tín hiệu (signal): sự khác hoàn toàn giữa quý hiếm vừa phải của mẫu mã dữ liệu của người sử dụng (arx) cùng quý giá vừa phải đưa tngày tiết của quần thể (mu_0).

*

Trở lại với ví dụ về thời gian chờ của những người bệnh, quý giá vừa đủ đưa thuyết là 15 phút.

Nếu những người mắc bệnh vào mẫu mã dữ liệu bất chợt của người tiêu dùng có thời gian chờ trung bình là 15.1 phút ít, biểu đạt bằng 15.1 – 15 = 0.1 phút. Giá trị khác biệt này kha khá bé dại, do thế bộc lộ sống bộ phận số thì yếu.

Tuy nhiên, ví như thời gian ngóng mức độ vừa phải của người bị bệnh là 68 phút, sự khác hoàn toàn sẽ to hơn và bởi 68-15=53 phút ít. Do vậy, dấu hiệu sẽ mạnh hơn.

Xem thêm: Cách Cài Mật Khẩu Ứng Dụng Cho Iphone, Cách Đặt Mật Khẩu Mở Ứng Dụng Trên Iphone Và Ipad

Phần mẫu mã số là Nhiễu

Phần mẫu số giám sát và đo lường mức độ xê dịch giỏi “nhiễu” (noise) trong chủng loại dữ liệu của chúng ta.

*

Kí hiệu 

*
là độ lệch chuẩn chỉnh (standard deviation) – miêu tả mức xê dịch vào tài liệu của chúng ta. Nếu bạn tất cả một người bị bệnh hóng 50 phút ít, một người mắc bệnh khác ngóng 12 phút, một bạn không giống nữa đợi 0.5 phút, một người khác nữa chờ 175 phút,… thì có thể nói rằng rằng dữ liệu của người tiêu dùng có không ít giao động. Điều này còn có nghĩa rằng ví như quý giá s càng mập, cường độ nhiễu vào dữ liệu của chúng ta càng phệ. Mặc khác, nếu như khách hàng gồm một người bệnh chờ 14 phút ít, một fan không giống hóng 16 phút, một bệnh nhân khác chờ 12 phút ít, thì nói theo cách khác rằng dữ liệu của doanh nghiệp bao gồm không nhiều xấp xỉ. Điều này có nghĩa rằng trường hợp giá trị s càng nhỏ dại thì tài liệu của bạn sẽ ít “nhiễu” hơn.

Còn kí hiệu sqrtn sống phía bên dưới s tất cả ý nghĩa sâu sắc là gì? Đó là căn uống bậc nhị size mẫu tài liệu của người tiêu dùng (ví dụ giả dụ chủng loại của công ty gồm 30 fan thì n = 30). Nếu các trang bị rất nhiều đều nhau thì dữ liệu của các bạn sẽ bị nhiễu nhiều hơn thế nếu size chủng loại dữ liệu của người sử dụng bé dại và đang không nhiều nhiễu hơn trường hợp kích thước mẫu mã tài liệu của người sử dụng lớn.

Giá trị t-value là tỉ trọng của Tín Hiệu so với Nhiễu

Công thức phía trên cho biết t-value đơn giản dễ dàng là so sánh độ mạnh mẽ của dấu hiệu cùng với độ nhiễu vào mẫu mã tài liệu của bạn.

Nếu biểu lộ tương đối yếu đuối so với khoảng độ nhiễu thì t-value vẫn nhỏ dại hơn. Do đó cường độ khác biệt sẽ ít có khả năng tất cả ý nghĩa sâu sắc những thống kê.

*

Tại biểu đồ dùng bên buộc phải của hình phía bên trên, sự khác biệt thân cực hiếm vừa phải của tài liệu arx và giá trị vừa phải mang tmáu mu_0 là 16 phút. Nhưng bởi vì những tài liệu trong chủng loại bị trải rộng ra buộc phải sự khác biệt này không có ý nghĩa thống kê. Tại sao lại nhỏng vậy? Bởi do t – value — tỉ lệ giữa tín hiệu và nhiễu — thì tương đối nhỏ xíu bởi mẫu số Khủng.

Tuy nhiên, giả dụ bộc lộ thì bạo phổi tương đối đối với nhiễu, form size (tốt đối) của t-value vẫn to hơn. Do kia, sự khác biệt giữa arx cùng mu_0 sẽ có rất nhiều kỹ năng bao gồm ý nghĩa sâu sắc thống kê lại hơn.

*

Tại hình bên trên, sự khác biệt giữa arxmu_0 cũng là 16 phút. Kích thước tài liệu cũng bằng nhau. Nhưng lần này, các điểm tài liệu co các lại gần nhau rộng. Vì dữ liệu không nhiều xấp xỉ hơn, yêu cầu sự biệt lập của 16 phút ít bây giờ lại có chân thành và ý nghĩa thống kê.

Thông điệp về ý nghĩa sâu sắc thống kê

Phương thơm pháp t-kiểm tra là như thế nào cùng với bài toán bảo nhãi nhép teenager nhà của bạn đi lau bếp?

Nếu nhỏng nhãi nhép teenager đã nghe nhạc, đã nghịch video clip game, gửi tin nhắn mang đến bạn bè, hoặc bị chây lười vày các nguồn “nhiễu” khác, bạn phải nói to hơn và dạn dĩ rộng nhằm rất có thể đã có được mức “ý nghĩa”. Hoặc ví như bạn cũng có thể xóa bỏ được những nguồn nhiễu thì chúng ta trọn vẹn không cần thiết phải ăn khổng lồ nói phệ với nhãi con teenager nhà bạn.

Một biện pháp tương tự như, nếu nhỏng hiệu quả t-demo của người tiêu dùng không có được ý nghĩa sâu sắc những thống kê thì hoàn toàn có thể là do một trong các nguyên ổn nhân sau đây:

Độ khác biệt (tín hiệu) là không đầy đủ lớn. quý khách hàng thiết yếu làm gì được rộng nếu như vấn đề đó xẩy ra, trả sử rằng nghiên cứu của doanh nghiệp sử dụng đúng phương thức cùng mẫu mã tài liệu nhưng mà các bạn tích lũy mang ý nghĩa thay mặt đến quần thể.Độ giao động dữ liệu (nhiễu) quá lớn. Đây là lý do tại vì sao Việc remove các điểm không bình thường (outlier) vào dữ liệu của người sử dụng là điều siêu quan trọng đặc biệt. Quý khách hàng rất có thể sử dụng control chart để phân phát hiện nay cùng sa thải các điểm outlier thoát khỏi dữ liệu trước khi triển khai t-kiểm tra.

Xem thêm: Tại Sao Con Gái Ra Nước ? Phụ Nữ Chảy Nước Khi Quan Hệ Quan Hệ Ra Næ°Á»›C Màu TrắNg

Mẫu tài liệu vượt nhỏ. Mức độ xấp xỉ sẽ nhỏ dại đi trường hợp kích thước tài liệu bự. Vấn đề này tức là nếu như tất cả và một độ biệt lập với cùng một quý hiếm dao động, nếu như kích thước tài liệu càng mập thì sẽ càng có tác dụng đã đạt được ý nghĩa sâu sắc thống kê lại – nlỗi biểu thứ bên dưới.

*

( Vấn đề này lý giải vì sao một chủng loại tài liệu có form size cực to hoàn toàn có thể tạo thành được chân thành và ý nghĩa thống kê lại tuy nhiên độ khác hoàn toàn hết sức bé dại và trọn vẹn không có tác động thực tế.)

Công thức này cũng lý giải vì sao những đơn vị những thống kê học tập lại thở than vào phản bội ứng với ngữ điệu thỉnh thoảng được áp dụng để Kết luận về một hiệu quả t-thử nghiệm. lấy ví dụ, một tác dụng t-kiểm tra ko mong muốn ngóng sẽ tiến hành phát biểu : “There is no significant difference…”

Không độc nhất vô nhị thiết buộc phải như vậy…

Thực tế là rất có thể gồm một độ khác hoàn toàn có chân thành và ý nghĩa. Nhưng hoàn toàn có thể bởi vì mẫu dữ liệu của người sử dụng thừa bé dại, hoặc rất có thể độ giao động của các điểm dữ liệu quá to khiến cho nghiên cứu và phân tích của công ty ko diễn tả được ý nghĩa sâu sắc thống kê. Bạn hoàn toàn có thể phát biểu một bí quyết bình yên hơn rằng: “Nghiên cứu vãn của chúng tôi vẫn không tìm kiếm thấy bệnh cứ của một độ khác biệt sở hữu ý nghĩa thống kê.”


Chuyên mục: Kiến Thức