Bờ-nốc bình dân

Giản dị như gió, nhẹ nhàng như mây…

Vote poll estimation

Bài toán: 2012 là năm bầu cử tổng thống Pháp. Tháng 2/2011 anh em điều tra tham khảo ý kiến quần chúng. Dominique Strauss Kahn (SKD), đương nhiệm vị trí chủ tịch quỹ tiền tệ quốc tế được, anh em dánh giá cao mặc dù thí sinh này chưa tuyên bố rõ ràng ý định tham gia. Điều tra trên 1000 dân đen thì có 515 người tuyên bố ủng hộ nhiệt liệt SKD. Bây giờ anh em mới phân vân nếu quần chúng vẫn giữ nguyên thái độ thì đến hôm bầu cử thí sinh SDK có đỗ hay không?

Đây là bài toán liên quan đến ước lượng trong thống kê. Trước hết ta thấy SDK đỗ tổng thống khi số phiếu bầu cho thí sinh này chiếm trên 50% tổng số người đi bầu. Ta cần tính xem với niềm tin là bao nhiêu thì SDK sẽ đỗ, nghĩa là ta cần tính confidence interval cho khả năng tỉ lệ phiếu thuận lớn hơn 50%.

Giả sử X là biến ngẫu nhiên theo luật Bernoulli tham số p (nghĩa là X=1 với xác suất pX=0 với xác suất 1-p). Ta coi X như là mô hình hóa quyết định bầu của quần chúng đối với SKD : giả sử rằng quyết định bầu cho SDK của mỗi người là hoàn toàn độc lập nhau và ta coi p như là xác suất để người dân bất kỳ bầu cho SDK. Thế thì tỉ lệ phiếu thuận dành cho SDK ngày bầu cử sẽ là kì vọng của X, tức là p.

Ta cần phải ước lượng khoảng tin cậy để cho p>0.5.

Vào ngày điều tra, ta có n=1000 và giá trị trung bình của của kết quả điều tra là

\hat{p}=\frac{X_1+X_2+\cdots+X_{1000}}{1000}=51.5\%

Kết quả điều tra được coi như sampling của kết quả thật. Dựa vào phương pháp tối đa tương đồng (maximum likelihood), \hat{p} và variance \sigma^2 của X được ước lượng bởi :

p\approx\hat{p}\sigma^2\approx \hat{p}(1-\hat{p})

Với số lượng người đi bầu ngày 07/05/2012( ngày bầu cử) lớn (n lớn), định lý Moivre-Laplace nói rằng phân bố của

\bar{X_n}=\frac{X_1+X_2+\cdots+X_{n}}{n}

sẽ xấp xỉ phân bố chuẩn với trung bình \hat{p} và variance \sigma^2/n, \bar{X_n}\approx \mathcal{N}(p,\sigma^2/n). Khi đó ta có:

\mathbf{P}\left(\frac{\bar{X_n}-p}{\sigma/\sqrt{n}}<c\right )=\Phi(c) với mọi c>0

ở đó \Phi là hàm phân bố của biến ngẫu nhiên chuẩn \mathcal{N}(0,1). Hay ta có thể viết

\mathbf{P}(\bar{X_n} - c\sigma/\sqrt{n})<p)=\Phi(c)

Dựa vào kết quả điều tra ta có : n=1000, X_1000=0.515\sigma^2\approx \hat{p}(1-\hat{p}) = 0.2497. SDK thắng cử khi p>0.5. Muốn xác định khả năng này, ta cần tìm c để :

0.5 = \bar{X_{1000}}-c\sqrt{ \sigma^2/{n}} = 0.515 - c\sqrt{0.515(1-0.515)/{1000}}

tức c=0.9491. Khi đó, khả năng cho sự kiện SDS đẩy Sarkozy vào dĩ vãng sẽ là

\mathbf{P}(0.5<p) =\Phi(c) = 0.8287

Tức 82.87% là SDK sẽ làm tổng thống từ năm 2012, dựa vào điều tra của tháng 2 năm 2011.

Advertisements

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất / Thay đổi )

Connecting to %s

%d bloggers like this: