Saturday, June 10, 2017

Karl Pearson: "cha đẻ" khoa học thống kê

Có lẽ đa số các bạn không chú ý đến ngày 27/3, nhưng đó là ngày sinh nhật 160 của Karl Pearson (ông sinh ngày 27/3/1857), được xem là một "cha đẻ" của khoa học thống kê hiện đại, là một trong những nhà khoa học và nhà thống kê học vĩ đại trong lịch sử. Ông còn là một lí thuyết gia khoa học (1) và đặt nền tảng cho những gì chúng ta làm ngày nay.



Ông sinh ra trong một gia đình trung lưu. Thân phụ là William Pearson là luật sư và thân mẫu là Fanny Smith, một người đàn bà có học cao. Có lẽ xuất phát từ truyền thống đó, ông theo học tại những trường "tên tuổi". Bắt đầu từ University College School London (sau này là UCL), sau đó (1857) vào Cambridge học toán dưới sự hướng dẫn của các nhà toán học lừng danh như James Maxwell, Arthur và George Stokes. Nói chung, ông toàn học ở những "right addresses".

Ngay từ thời sinh viên, Pearson đã tỏ ra là một người độc lập, ghét giáo điều, và bất tuân quyền thế. Thời đó, sinh viên bắt buộc phải học tôn giáo (có lẽ giống như sinh viên Việt Nam ngày nay bị bắt phải học chủ nghĩa Mác Lê), nhưng ông rất ghét môn học đó. Bằng lí giải logic ông thuyết phục thành công Đại học Cambridge bỏ qui định bắt buộc học tôn giáo. Điều lạ lùng là người ta thấy chàng thanh niên Pearson hay đi nhà thờ, nhưng ông xem việc đi nhà thờ là việc tự nguyện, còn ông ghét là ghét sự áp đặt máy móc.

Năm 1879 ông tốt nghiệp từ Cambridge, với hạng danh dự. Sau đó, ông đi "chu du" sang Đức để học vật lí tại Đại học Heidelberg. Sau Heidelberg, Pearson lang thang sang ĐH Berlin và lúc đó ông theo học sinh học với nhà sinh học lừng danh Émile du Bois-Reymond lúc đó đang giảng về thuyết Darwin. Ngoài học sinh học, Pearson còn học Luật La Mã, văn học Đức, và ... chủ nghĩa xã hội. Ông đam mê văn học Đức đến nổi sau này về Anh ông được bổ nhiệm làm giảng dạy về văn học tại ĐH Cambridge.

Sau khi rời Cambridge, ông được bổ nhiệm chức Giáo sư tại UCL (University College, London), và phần lớn sự nghiệp của ông được xây dựng tại đây. Đóng góp lớn nhất và quan trọng nhất của Pearson trong thống kê học là phương pháp Ki bình phương, hệ số tương quan Pearson, mô hình hồi qui tuyến tính, phân tích đa biến (multivariate analysis). Ngay cả t-test của Student cũng phải qua tay ông mới thành nổi tiếng. Nhưng ngoài những đóng góp để đời mà nhiều người biết, ông còn có nhiều đóng góp quan trọng trong di truyền học, triết lí khoa học. Cuốn sách nổi tiếng của ông, "The Grammar of Science", là một tuyệt tác. Cho đến nay, rất khó có người nào có cái nhìn bao quát và viễn kiến như Pearson trong cuốn đó.

Tại UCL, ông được bổ nhiệm chức "Galton Professor of Eugenics" từ 1911 đến 1933. Chính từ vị trí này ông đã có công đào tạo rất nhiều học trò lừng danh sau này. Phương pháp Ki bình phương và phân tích tương quan cũng từ các vấn đề của chủ nghĩa ưu sinh mà ra. Do đó, có thể nói rằng khoa học thống kê có một mảng đen trong lịch sử hình thành.

Năm 1901, Pearson sáng lập Tập san Biometrika để chuyên công bố các bài nghiên cứu về di truyền và chủ nghĩa ưu sinh. Biometrika còn là một tập san thống kê số 1 thời đó (và cả thời nay), và vẫn còn hoạt động cho đến nay. Ông giữ vai trò tổng biên tập một thời gian, và trong thời gian đó ông liên luỵ đến một tranh cãi với một nhà thống kê học lừng danh khác là Ronald Fisher. Fisher gửi bản thảo đến Biometrika để công bố, nhưng Pearson không hài lòng với công trình vì ông nghĩ Fisher sai. Thế là hai bên cãi qua cãi lại, cuối cùng thì Pearson không công bố bài của Fisher. Fisher là người cực kì thông minh nhưng cũng cực kì ... nhỏ mọn, và giữ "mối thù" đó cho đến đời con của Pearson! Sau này, Fisher tranh cãi kịch liệt với con trai của Pearson là Egon Pearson, người cùng với Jerzy Neymann phát triển học thuyết "test of hypothesis" mà Fisher nghĩ là ... vớ vẩn.

Tên khai sinh của ông là Carl Pearson, nhưng sau chuyến "du học" bên Đức về ông đổi tên là Karl Pearson. Có suy luận rằng vì ông ngưỡng mộ Karl Marx quá nên ông tự đổi tên cúng cơm sang "Karl". Ngay cả tên tập san là BiometriKA (chứ không phải BiometriCa). Dù xuất thân là một gia đình trung lưu bảo thủ, ông lại là người theo chủ nghĩa xã hội (socialist) và tự do. Thời đó mà ông đã dám bàn đến nữ quyền! Chính vì lí tưởng xã hội chủ nghĩa nên ông từ chối không nhận huân chương OBE (Order of the British Empire) và cũng không thèm nhận "Knighthood" để được gọi là "Sir". Do đó, khác với những người xã hội chủ nghĩa dỏm, ông là người làm theo lí tưởng của mình.

Ông qua đời ngày 27/4/1936, thọ 80 tuổi, tại Surrey, Anh. Sau khi ông qua đời, có rất nhiều bài báo khoa học từ các trò viết để vinh danh những đóng góp của ông cho khoa học (chứ không chỉ thống kê học). Những bài này sưu tầm thành vài tập sách, đọc rất thú vị. Trong lịch sử khoa học, hiếm thấy một lí thuyết gia nào như Pearson, người có ảnh hưởng lớn và sâu đậm đến khái niệm, phương pháp luận làm nền tảng cho tất cả những gì chúng ta đang làm ngày nay.

Riêng tôi thì càng học về Ki bình phương và mô hình hồi qui tuyến tính, tôi thấy phục ông về suy nghĩ đằng sau các phương pháp đó cũng như tầm nhìn về khoa học. Đọc những bài ông viết về văn học càng thấy ông có một kiến thức uyên bác và quan sát tinh tế. Do đó, tôi xem ông là một trong những "hero", hay cũng có thể nói là "thần tượng" cũng được.

===

(1) http://www2.fiu.edu/~blissl/Pearson1.pdf

No comments: