Thành viên hiepsithiennhien

phân phối chuẩn

- 9 tháng trước
Chia sẻ
/74 trang
Tải xuống 2,000 VNĐ
LIÊN HỆ QUẢNG CÁO 0906.345.800
Tải xuống 2,000 VNĐ (74 trang)
Thành viên hiepsithiennhien

phân phối chuẩn

- 9 tháng trước
577
Báo lỗi

xác xuất thống kê

Nội dung

Phân phối chuẩn

Bách khoa toàn thư mở Wikipedia

Phân phối chuẩn

Hàm mật độ xác suất � Màu sắc tương ứng với hình trên

Tham số

embedded:image3.png cho biết vị trí (thực) embedded:image4.png bình phương tỉ lệ (thực)

Giá

embedded:image5.png

Hàm mật độ xác suất

embedded:image6.png

Hàm phân phối tích lũy

embedded:image7.png

Giá trị kỳ vọng

embedded:image8.png

Trung vị

embedded:image9.png

Mode

embedded:image10.png

Phương sai

embedded:image11.png

Độ xiên

0

Độ nhọn

embedded:image12.png

Entropy

embedded:image13.png

Hàm sinh moment

embedded:image14.png

Hàm đặc trưng

embedded:image15.png

Phân phối chuẩn, còn gọi là phân phối Gauss, là một phân phối xác suất cực kì quan trọng trong nhiều lĩnh vực. Nó là họ phân phối có dạng tổng quát giống nhau, chỉ khác tham số vị trí (giá trị trung bình μ) và tỉ lệ (phương sai σ2).

Phân phối chuẩn chuẩn hóa (standard normal distribution) là phân phối chuẩn với giá trị trung bình bằng 0 và phương sai bằng 1 (đường cong màu đỏ trong hình bên phải). Phân phối chuẩn còn được gọi là đường cong chuông(bell curve) vì đồ thị của mật độ xác suất có dạng chuông.

Mục lục

  [ẩn] 

1 Lịch sử

2 Đặc tính của phân phối chuẩn

2.1 Hàm mật độ xác suất

2.2 Hàm phân phối tích lũy

2.3 Hàm khởi tạo

2.3.1 Hàm khởi tạo Mômen

2.3.2 Hàm đặc trưng

3 Tính chất

3.1 Chuẩn hóa biến ngẫu nhiên có phân phối chuẩn

3.2 Mô-men

3.3 Khởi tạo biến ngẫu nhiên có phân phối chuẩn

3.4 Định lí giới hạn trung tâm

3.5 Khả năng phân chia vô hạn

3.6 Độ ổn định

3.7 Độ lệch chuẩn

4 Kiểm định giả thiết về phân phối chuẩn

5 Các phân phối liên quan

6 Ước lượng tham số

6.1 Ước lượng hợp lí cực đại của các tham số

6.1.1 Điều khái quát gây ngạc nhiên

6.2 Ước lượng không chệch của các tham số

7 Xem thêm

8 Tham khảo

9 Liên kết ngoài

Lịch sử[sửa]

Abraham de Moivre là người đầu tiên đưa ra phân phối chuẩn trong bài báo năm 1734 (được in lại trong ấn bản lần 2The Doctrine of Chances, 1738) khi muốn xấp xỉ một phân phối nhị thức với n lớn. Kết quả được mở rộng bởi Laplacetrong cuốn sách Analytical Theory of Probabilities (1812), và bây giờ gọi là định lý Moivre-Laplace.

Laplace dùng phân phối chuẩn để phân tích sai số của các thử nghiệm. Phương pháp quan trọng bình phương tối thiểu được Legendre đưa ra năm 1805. Năm 1809, Gauss, người tuyên bố đã từng sử dụng phương pháp này từ năm1794, đã chứng minh phương pháp này bằng cách giả thiết rằng các sai số có phân phối chuẩn.

Tên gọi "đường cong chuông" do Jouffret, người đầu tiên dùng thuật ngữ "bề mặt hình chuông" năm 1872 cho phân phối chuẩn hai chiều với các thành phần độc lập. Tên gọi "phân phối chuẩn" được tạo ra bởi Charles S. Peirce,Francis Galton và Wilhelm Lexis khoảng năm 1875.

Đặc tính của phân phối chuẩn[sửa]

Có nhiều cách để thể hiện các đặc tính của một phân phối xác suất. Cách dễ thấy nhất là thông qua hàm mật độ xác suất (vẽ ở hình đầu tiên), nó cho biết khả năng xảy ra của mỗi giá trị của biến ngẫu nhiên. Hàm phân phối tích lũy cũng cho cùng thông tin, nhưng hình ảnh của nó thì thông tin chứa đựng không được dễ nhận thấy cho lắm (hình đi sau). Các cách tương đương khi chỉ định một phân phối chuẩn là thông qua: mômen, ước lượng, hàm đặc trưng, hàm khởi tạo mômen, và hàm khởi tạo ước lượng và định lí Maxwell. Một số rất hữu ích về mặt lí thuyết, nhưng không trực quan. Xem phân phối xác suất.

Mọi ước lượng của phân phối chuẩn đều bằng 0, ngoại trừ 2 cái đầu tiên.

Hàm mật độ xác suất[sửa]

Hàm phân phối tích lũy tương ứng với các hàm mật độ ở trên

Hàm phân phối tích lũy (cdf) chính là xác suất để một biến embedded:image37.png có giá trị nhỏ hơn hay bằng embedded:image38.png, và nó được biểu diễn dưới dạng hàm mật độ sau:

embedded:image39.png

Hàm cdf chuẩn chuẩn hóa, qui ước viết là embedded:image40.png, chỉ là từ dạng cdf tổng quát và được tính với embedded:image41.png và embedded:image42.png,

embedded:image43.png

Hàm cdf chuẩn hóa có thể được biểu diễn dưới dạng một hàm đặc biệt gọi là hàm sai số, như sau

embedded:image44.png

Hầm cdf nghịch đảo, hay hàm "quantile", có thể được biểu dưới dạng nghịch đảo của hàm sai số:

embedded:image45.png

Hàm "quantile" này đôi khi còn gọi là hàm "probit". Hàm "probit" không có nguyên hàm. Không có ở đây không phải là không tìm thấy, mà nghĩa là người ta chứng minh rằng không tồn tại một nguyên hàm như vậy

Giá trị của hàm Φ(x) có thể xấp xỉ một cách chính xác bằng nhiều phương pháp khác nhau, như tích phân số, chuỗi Taylor, hay chuỗi tiệm cận.

Hàm khởi tạo[sửa]

Hàm khởi tạo Mômen[sửa]

Hàm khởi tạo mômen được định nghĩa là giá trị kỳ vọng của embedded:image46.png. Với phân phối chuẩn, hàm được viết thành

embedded:image47.png

embedded:image48.png

 

embedded:image49.png

 

embedded:image50.png

và có thể thấy bằng cách khai triển biểu thức trong ngoặc thành bình phương đúng.

Hàm đặc trưng[sửa]

Hàm đặc trưng được định nghĩa là giá trị kì vọng của embedded:image51.png, với embedded:image52.png là phần ảo đơn vị. Với phân phối chuẩn, hàm đặc trưng được viết thành

embedded:image53.png

embedded:image54.png

 

embedded:image55.png

 

embedded:image56.png

Hàm đặc trưng được tính bằng cách thay thế embedded:image57.png cho embedded:image58.png trong hàm khởi tạo mômen.

Tính chất[sửa]

Một số tính chất của phân phối chuẩn:

Nếu embedded:image59.png và embedded:image60.png và embedded:image61.png là các số thực, thì embedded:image62.png (xem giá trị kì vọng và phương sai).

Nếu embedded:image63.png và embedded:image64.png là các biến ngẫu nhiên chuẩn độc lập, thì:

Tổng của chúng là có phân phối chuẩn với embedded:image65.png (proof).

Hiệu của chúng là có phân phối chuẩn với embedded:image66.png.

Cả hai embedded:image67.png và embedded:image68.png là độc lập với nhau.

Nếu embedded:image69.png và embedded:image70.png là các biến ngẫu nhiên chuẩn độc lập, thì:

Tích của chúng embedded:image71.png tuân theo phân phối với hàm mật độ embedded:image72.png cho bởi

embedded:image73.png với embedded:image74.png là hàm Bessel được chỉnh sửa loại 2.

Tỉ số giữa chúng tuân theo phân phối Cauchy với embedded:image75.png.

Nếu embedded:image76.png là các biến ngẫu nhiên chuẩn chuẩn hóa độc lập, thì embedded:image77.png có phân phối chi-bình phương với n bậc tự do.

Chuẩn hóa biến ngẫu nhiên có phân phối chuẩn[sửa]

Một hệ quả của Tính chất 1 là ta có thể quy mọi biến ngẫu nhiên phân phối chuẩn về dạng phân phối chuẩn hóa.

Nếu embedded:image78.png ~ embedded:image79.png, thì

embedded:image80.png

là một biến có phân phối chuẩn hóa: embedded:image81.png ~ embedded:image82.png. Từ đó lại dẫn đến một hệ quả quan trọng là hàm phân phối tích lũy của một phân phối chuẩn nói chung sẽ là:

embedded:image83.png

Ngược lại, nếu embedded:image84.png ~ embedded:image85.png, thì

embedded:image86.png

là một biến ngẫu nhiên có phân phối chuẩn với trị trung bình embedded:image87.png và phương sai embedded:image88.png.

Giá trị của phân phối chuẩn hóa đã được lập thành bảng, và các phân phối chuẩn khác đều là các dạng biến đổi đơn giản từ phân phối chuẩn hóa. Do đó, có thể tra bảng giá trị phân phối tích lũy của hàm phân phối chuẩn hóa để tính các giá trị phân phối tích lũy của phân phối chuẩn.

Mô-men[sửa]

Một số mô-men bậc nhỏ của phân phối chuẩn:

Number

Raw moment

Central moment

Cumulant

0

1

0

1

embedded:image89.png

0

embedded:image90.png

2

embedded:image91.png

embedded:image92.png

embedded:image93.png

3

embedded:image94.png

0

0

4

embedded:image95.png

embedded:image96.png

0

Mọi ước lượng của phân phối chuẩn lớn hơn bậc hai đều bằng zero.

Khởi tạo biến ngẫu nhiên có phân phối chuẩn[sửa]

Khi mô phỏng bằng máy tính, người ta thường khởi tạo các giá trị số có phân phối chuẩn. Có nhiều cách và cách đơn giản nhất là chuyển ngược bằng hàm phân phối tích lũy chuẩn chuẩn hóa. Có nhiều phương pháp hiệu quả được dùng đến, một trong chúng là biến đổi Box-Muller.

Biến đổi Box-Muller nhận hai giá trị có phân phối đều làm đầu vào và ánh xạ chúng thành giá trị có phân phối chuẩn. Phương pháp này đòi hỏi phải khởi tạo giá trị từ phân phối đều, và có nhiều phương pháp như vậy. Xem thêm khởi tạo số ngẫu nhiên.

Biến đổi Box-Muller là dựa vào: phân phối chi-bình phương với hai bậc tự do (xem tính chất 4 ở trên) là một biến ngẫu nhiên lũy thừa có thể khởi tạo dễ dàng.

Định lí giới hạn trung tâm[sửa]

Phần diện tích màu xanh lam thuộc phạm vi một độ lệch chuẩn từ trị trung bình. Đối với phân phối chuẩn, nó chiếm 68% toàn bộ tổng thể trong khi đó phần diện tích nằm trong khoảng 2 lần độ lệch chuẩn (màu xanh và nâu) chiếm 95% và 3 lần độ lệch chuẩn (xanh lam, nâu, lá cây) chiếm 99.7%.

Trong thực nghiệm, ta thường giả thiết rằng dữ liệu lấy từ tổng thể có dang phân phối xấp xỉ chuẩn. Nếu giả thiết này được kiểm chứng thì có khoảng 68% số giá trị nằm trong khoảng 1 độ lệch chuẩn so với trị trung bình, khoảng 95% số giá trị trong khoảng hai lần độ lệch chuẩn và khoảng 99.7% nằm trong khoảng 3 lần độ lệch chuẩn. Đó là "quy luật 68-95-99.7" hoặc quy tắc kinh nghiệm.

Kiểm định giả thiết về phân phối chuẩn[sửa]

Phép kiểm định cho ta biết một bộ số liệu cho trước có dạng phân phối tương tự phân phối chuẩn hay không.Giả thiết không là số liệu giống dạng phân phối chuẩn, do đó một giá trị P đủ nhỏ sẽ chứng tỏ dữ liệu không có phân phối chuẩn.

Phép kiểm định Kolmogorov-Smirnov

Phép kiểm định Lilliefors

Phép kiểm định Anderson-Darling

Phép kiểm định Ryan-Joiner

Phép kiểm định Sapiro-Wilk

Đường cong phân phối chuẩn (rankit plot)

Phép kiểm định Jarque-Bera

Các phân phối liên quan[sửa]

embedded:image111.png là một phân phối Rayleigh nếu embedded:image112.png với embedded:image113.png và embedded:image114.png là 2 phân phối chuẩn độc lập.

embedded:image115.png là một phân phối khi-bình phương với embedded:image116.png bậc tự do nếu embedded:image117.png với embedded:image118.png cho embedded:image119.png và là độc lập

embedded:image120.png là một phân phối Cauchy nếu embedded:image121.png và embedded:image122.png và embedded:image123.png là 2 phân phối chuẩn độc lập.

embedded:image124.png là một phân phối log-normal nếu embedded:image125.png and embedded:image126.png.

Liên quan đến phân phối Lévy skew alpha-stable: nếu embedded:image127.png thì embedded:image128.png.

Phân phối chuẩn rút gọn. Nếu, embedded:image129.png thì, việc rút gọn dưới tại embedded:image130.png và trên tại embedded:image131.png sẽ dẫn đến một biến ngẫu nhiên với mean embedded:image132.png, trong đó embedded:image133.png và embedded:image134.png và embedded:image135.png, trong đó embedded:image136.png là hàm mật độ xác suất của biến ngẫu nhiên chuẩn chuẩn hóa.

Ước lượng tham số[sửa]

Ước lượng hợp lí cực đại của các tham số[sửa]

Giả sử

embedded:image137.png

độc lập thống kê và mỗi biến đều có phân phối chuẩn với kì vọng μ và phương sai σ2. Theo ngôn ngữ thống kê, các giá trị quan trắc của các biến ngẫu nhiên này tạo thành một "mẫu từ tổng thể có phân phối chuẩn". Ta cần ước lượng "trị trung bình của tổng thể μ và độ lệch chuẩn của tổng thể σ, dựa trên các giá trị quan sát được của mẫu. Hàm mật độ xác suất liên hiệp của các biến ngẫu nhiên này là:

embedded:image138.png

(Chú ý: Ở đây kí hiệu tỉ lệ embedded:image139.png có nghĩa là tỉ lệ như một hàm của embedded:image140.png và embedded:image141.png, chứ không phải tỉ lệ như một hàm của embedded:image142.png. Điểu này có thể xem như là điểm khác biệt giữa quan điểm của các nhà thống kê và nhà xác suất. Lí do về tầm quan trọng của điểm khác nhau này sẽ được đề cập dưới đây.)

Hàm hợp lí - một hàm của μ và σ là

embedded:image143.png

Trong phương pháp hợp lí cực đại, các giá trị của μ và σ làm cho hàm hợp lí đạt cực đại sẽ cho ta các giá trị của ước lượng các thông số μ và σ của tổng thể.

Thông thường trong khi cực đại hóa một hàm 2 biến ta có thể xét các đạo hàm riêng. Nhưng ở đây ta sẽ khai thác một đặc điểm là giá trị của μ làm cực đại hóa hàm hợp kí với σ là cố định, không phụ thuộc vào σ. Do đó, ta có thể tìm giá trị của μ, sau đó thay thế nó vào trong phương trình hợp lí, để cuối cùng thu được giá trị của σ làm cực đại biểu thức tìm được.

Rõ ràng là hàm hợp kí là một hàm giảm của tổng

embedded:image144.png

Do đó ta muốn giá trị của μ làm cực tiểu hóa tổng này. Đặt:

embedded:image145.png

là "trị trung bình mẫu". Nhận thấy

embedded:image146.png

embedded:image147.png

embedded:image148.png

Chỉ có số hạng cuối phụ thuộc vào μ và nó được cực tiểu hóa bằng

embedded:image149.png

Đó là ước lượng hợp lí cực đại của μ. Khi ta thay thế giá trị này cho μ trong hàm hợp lí, ta nhận được:

embedded:image150.png

Ta quy ước kí hiệu hàm "log hợp lí", nghĩa là, logarit của hàm hợp lí, bằng một chữ embedded:image151.png thường, và ta có

embedded:image152.png

và sau đó

embedded:image153.png

Đạo hàm này dương, bằng 0, hoặc âm tùy thuộc vào σ2 nằm giữa 0 và

embedded:image154.png

hoặc bằng đại lượng đó, hoặc lớn hơn đại lượng đó.

Kết quả là trị trung bình của bình phương các sai số là một ước lượng hợp lí cực đại của σ2, và căn bậc hai của nó là ước lượng hợp lí cực đại của σ. Ước lượng này là mộtước lượng chệch, nhưng có một sai số căn quân phương nhỏ hơn so với ước lượng không chệch, vốn là n/(n − 1) lần ước lượng trên.

Điều khái quát gây ngạc nhiên[sửa]

Đạo hàm của ước lượng hợp lí cực đại của ma trận hiệp phương sai của một phân phối đa biến chuẩn rất khó nhận ra. Nó liên quan đến định lí phổ và lí do có thể coi một đại lượng vô hướng như là vết của ma trận 1×1 hơn là chỉ một biến vô hướng. Xem thêm cách xác định các ma trận hiệp phương sai.

Ước lượng không chệch của các tham số[sửa]

Ước lượng hợp lí cực đại cho tổng thể đồng nghĩa với việc embedded:image155.png của một mẫu là một ước lượng không chệch của trị trung bình, và phương sai cũng vậy. Tuy nhiên điều đó chỉ có được khi trị trung bình của tổng thể đã được biết trước. Thực tế ta chỉ có một mẫu lấy từ tổng thể, và không hề có thông tin gì về trị trung bình cũng như phương sai của tổng thể. Trường hợp này ước lượng không chệch của phương sai embedded:image156.png là:

embedded:image157.png

"Phương sai mẫu" này tuân theo phân phối Gamma nếu như tất cả các biến ngẫu nhiên X đều có dạng phân phối giống nhau và độc lập với nhau:

embedded:image158.png

Xem thêm[sửa]

Phân phối chuẩn và không tương quan không có nghĩa là độc lập thống kê (một ví dụ về hai biến ngẫu nhiên có phân phối chuẩn, không tương quan nhưng không độc lập; điều này không xảy ra trong trường hợp có phân phối chuẩn đa biến)

Phân phối log-chuẩn

Phân phối chuẩn đa biến

Phân phối Gauss khái quát

Hàm probit

Phân phối t của Student

Bài toán của Behrens-Fisher

Tham khảo[sửa]

John Aldrich. Earliest Uses of Symbols in Probability and Statistics. Electronic document, retrieved March 20, 2005. (See "Symbols associated with the Normal Distribution".)

Abraham de Moivre (1738). The Doctrine of Chances.

Stephen Jay Gould (1981). The Mismeasure of Man. First edition. W. W. Norton. ISBN 0-393-01489-4.

R. J. Herrnstein and Charles Murray (1994). The Bell Curve: Intelligence and Class Structure in American Life. Free Press. ISBN 0-02-914673-9.

Pierre-Simon Laplace (1812). Analytical Theory of Probabilities.

Jeff Miller, John Aldrich, et al. Earliest Known Uses of Some of the Words of Mathematics. In particular, the entries for "bell-shaped and bell curve", "normal" (distribution), "Gaussian", and "Error, law of error, theory of errors, etc.". Electronic documents, retrieved December 13, 2005.

S. M. Stigler (1999). Statistics on the Table, chapter 22. Harvard University Press. (History of the term "normal distribution".)

Eric W. Weisstein et al. Normal Distribution at MathWorld. Electronic document, retrieved March 20, 2005.

Marvin Zelen and Norman C. Severo (1964). Probability Functions. Chapter 26 of Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables, ed, byMilton Abramowitz and Irene A. Stegun. National Bureau of Standards.

Liên kết ngoài[sửa]

embedded:image159.png

Wikimedia Commons có thêm thể loại hình ảnh và tài liệu về Phân phối chuẩn

Mô hình tương tác tính toán các phân phối (bao gồm phân phối chuẩn).

Công cụ tính toán diện tích tự do phía dưới đưòng phân phối chuẩn từ Website Free Statistics Calculators của Daniel Soper. Tính toán diện tích lũ tích phía dưới đường cong phân phối (tức là xác suất lũy tích), cho trước z.

Các công cụ cơ bản cho vấn đề 6-sigma

PlanetMath: biến ngẫu nhiên phân phối chuẩn

Thư viện khoa học GNU – Reference Manual – The Gaussian Distribution

Công cụ tính toán phân phối – Tính xác suất và các giá trị phân giới cho phân phối chuẩn, t, khi-bình phương và phân phối F.

Bảng phân phối chuẩn (tài liệu công cộng)

Có phải phân phối chuẩn lấy theo tên Karl Gauss? Euler và họ đường cong gamma của ông; vai trò của thống kê học

Maxwell demons: Simulating probability distributions with functions of propositional calculus

Bảng tính phân phối chuẩn

Máy tính trực tuyến Phân phối chuẩn

Thể loại: 

Phân phối xác suất liên tục

Đơn vị chủ quản: CÔNG TY TNHH THƯƠNG MẠI ĐIỆN TỬ THIÊN THI
372/10 Điện Biên Phủ, Phường 17, Q.Bình Thạnh, HCM
giấy phép MXH: 102/GXN - TTĐT
Lên đầu trang