Saturday, June 3, 2017

Francis Galton và "regression toward the mean"

Francis Galton là một nhà khoa học loại "polymath" đúng nghĩa. Ông là người đặt nền tảng cho di truyền học, phân tích tâm lí học, nhân chủng học, thống kê học, phương pháp luận khoa học. Ông không phải là một cái tên quen thuộc trong thế giới thống kê học, nhưng ông được xem là một trong những "thinker" của thống kê học. Ông là một biểu tượng cho chủ nghĩa ưu sinh, nhưng cũng là người khai sinh ra nhiều phương pháp mà chúng ta sử dụng ngày nay. Viết về ông thì cả ngàn trang sách cũng không bao giờ đủ, nhưng trong cái note này tôi sẽ cung cấp một vài thông tin chính về sự nghiệp khoa học và những đóng góp mang tính "di sản" của ông. Những đóng góp đó cũng là bài học để chúng ta noi theo.



Dòng dõi Darwin

Francis Galton (tên khai sinh là Frank Galton) sinh ngày 16/2/1822, trong một gia đình giàu có ở Luân Đôn. Gia đình ông gồm có 9 người con (nhưng 7 người sống sót), và ông là người con út. Thân phụ ông là Samuel Tertius Galton, và Mẹ ông là Violetta Darwin, là ái nữ của Bác sĩ Erasmus Darwin. Nói cách khác, Francis Galton là cháu ngoại của Erasmus Darwin. Cần nói thêm rằng, Charles Darwin là cháu nội của Erasmus Darwin (Charles là con của Bác sĩ Robert Darwin, là con trai của Erasmus Darwin). Do đó, Francis Galton và Charles Darwin là anh em họ, nhưng Charles Darwin lớn hơn Francis Galton 13 tuổi. Như vậy, Francis Galton xuất thân từ một gia đình giàu có và một gia tộc danh giá của Anh.

Ngay từ lúc còn nhỏ, Francis Galton đã tỏ ra là một người thông minh xuất chúng. Mới lên hai tuổi rưỡi, Francis đã biết đọc sách và kí tên; bốn tuổi đã biết làm toán nhân; và tám tuổi đã đọc được tiếng Latin. Một phần lớn giáo dục thời niên thiếu là do người chị bị tật nguyền của Francis đảm trách. Do đó, trong nhiều thư từ, Francis tỏ ra rất mến người chị mà ông xem như là người mẹ thứ hai.


Năm 1838, tức mới 16 tuổi, Francis được thân phụ gửi cho đi học y khoa tại Bệnh viện Đa khoa Birmingham. Đây là một truyền thống bên ngoại, vì như đề cập trên, ông ngoại của Francis là một bác sĩ và người cậu là Robert Darwin cũng là một bác sĩ, nên thân phụ và thân mẫu muốn Francis theo đuổi nghề y. Thời gian ở Bệnh viện Birmingham ông được giao những công việc chủ yếu là quản lí thuốc men, chứ chưa được dịp học y khoa một cách đúng nghĩa. Một năm sau (1839) ông được nhận vào học y khoa ở trường King College, chủ yếu là học giải phẫu.

Năm 1840, Francis được vào học ở ĐH Cambridge. Nhưng lần này ông "đọc" toán, vì thời đó toán là một môn học phổ thông ở năm thứ nhất đại học. Tuy nhiên, Francis không hứng thú gì mới môn học mà ông cho là khô khan, dễ làm ông nhức đầu. Quả thật, trong thời gian ở Cambridge ông hay bị bệnh phong thấp và nhức đầu. Nhưng sau cùng thì ông cũng tốt nghiệp với bằng cử nhân (BA). Ông ở lại Cambridge đến năm 1844 để hoàn tất chương trình MD. Tháng 3/1844 ông phải về nhà chăm sóc cho thân phụ ông lúc đó ngã bệnh.  Nhưng đến tháng 10 cùng năm thì thân phụ ông qua đời.

Francis Galton là một nhà du hành, và sự nghiệp của ông một phần cũng được hình thành từ những chuyến thám hiểm ở những vùng đất xa xôi. Ngay từ năm 1839, lúc ông theo học ở King College, ông đã thực hiện chuyến du hành đầu tiên sang Đức, Budapest, Istanbul, Syria, Athens, và Venice. Chuyến "du lịch" đó đã giúp ông có một tầm nhìn rộng hơn về thế giới quan. Năm 1845, ông lại thực hiện một chuyến hải hành sang Ai Cập, Sudan, Khartoum, Lebanon, và Syria. Ông ghi chép cẩn thận những quan sát trong chuyến hải hành đó, và khi về lại Luân Đôn, ông được kết nạp thành viên của Royal Geographical Society (RGS). Sau khi trở thành hội viên của RGS, năm 1850, ông lại thực hiện một chuyến đi Phi châu, và chính chuyến đi này đã giúp ông có nhiều ý tưởng về nghiên cứu khoa học, nhất là hành vi của động vật. 

Một "polymath"

Năm 1884, ông thành lập labo nghiên cứu về nhân chủng học. Sự ra đời của labo này được xem là một khởi đầu của nghiên cứu ứng dụng tâm lí học. Vì gia đình giàu có, nên ông không cần tài trợ, mà dùng tài sản của gia đình để duy trì vận hành của labo cho đến năm 1891. Qua labo nhân chủng học, ông thu thập dữ liệu của 783 anh em và 35 cặp song sinh. Ông chính là người đầu tiên dùng mối quan hệ trong gia đình để nghiên cứu về di truyền. Cần nói thêm rằng labo nhân chủng học của Galton không phải là labo đầu tiên; Alphonse Bertillon (1853-1914) mới là người lập labo như thế để phục vụ cho điều tra tội phạm. Nhưng Galton có lẽ là nhà khoa học đầu tiên thu thập dấu vân tay và thuyết phục Bertillon dùng dấu vân tay để phục vụ cho mục đích nhận dạng tội phạm.

Sau nhân chủng học, Galton có nhiều đóng góp tiên phong cho di truyền học. Ý tưởng về di truyền học là do ông đọc được cuốn sách "Origin of Species" của người anh họ Charles Darwin (xuất bản vào năm 1859). Cuốn sách này đã làm thay đổi cuộc đời và sự nghiệp của Francis Galton. Ông thấy ngay cái ý nghĩa của lịch sử nhân loại, và bắt đầu suy nghĩ tương lai của nhân loại dưới lăng kính của học thuyết tiến hóa. Từ một người sùng đạo, cuốn Origin of Species đã biến ông thành một người xa rời tôn giáo, vì ông thấy các ý tưởng tôn giáo không thuyết phục trong việc giải thích sự hình thành của nhân loại.

Công trình nghiên cứu về di truyền học của ông được công bố vào năm 1865 trên [Tạp chí] Macmillan Magazine. Trong công trình này ông sử dụng (và phát kiến) một phương pháp thống kê để ước tính hệ số di truyền của "intellectual and moral qualities". Ông phê phán Giáo hội Công giáo La Mã vì họ cấm không có các linh mục có gia đình, mà các linh mục lại là những người trí thức và học giỏi, do đó sự cấm đoán của Giáo hội là một sai lầm. Năm 1869, ông công bố công trình "Hereditary Genius" (nhưng sau này ông tỏ ra hối tiếc là đáng lí ra ông nên dùng chữ "Talent" thay vì "Genius"). Luận án của cuốn sách này là tính thông minh là do di truyền chứ không phải do môi trường tác động. Do thời đó, ông không có phương tiện để đo IQ, nên ông dùng chiều cao làm một "marker" về trí thông minh. Từ đó, ông có một sở thích nghiên cứu là những đặc tính tri thức có liên quan đến sự nổi tiếng (Those qualifications of intellect and disposition which … lead to reputation).

Ông tỏ ra là một người thích thống kê học. Năm 1872, bằng phương pháp phân tích thống kê ông công bố bài báo "Statistical inquiries into the efficacy of prayer" bàn về hiệu quả của cầu nguyện. Bài báo (1) đã làm cho giới tu sĩ nổi giận vì ông cho rằng cầu nguyện không có hiệu quả kéo dài tuổi thọ hay bất cứ thước đo định lượng nào. Ông tiếp tục dùng phương pháp thống kê để "chứng minh" rằng thông minh là do di truyền bằng những phân tích trên những fellows của Royal Society và những nhà khoa học lừng danh của Anh.

Ông tiếp tục đi sâu vào di truyền học và trở thành người khởi xứng chủ nghĩa ưu sinh (eugenics). Năm 1883, trong công trình "Inquiries into Human Faculty" ông dùng chữ eugenics lần đầu tiên, và ông có giải thích thuật ngữ này xuất phát từ tiếng Hi Lạp, "eugenes", có nghĩa là "good in stock, hereditarily endowed with noble qualities". Quan điểm của Galton có thể tóm tắt qua kết luận và logic sau đây: (i) trí thông minh và khả năng là do di truyền hơn là do môi trường; (ii) do đó để duy trì một dòng giống tốt, cần khuyến khích những hôn nhân giữa những người có trí lực tốt và qua nhiều thế hệ có thể tạo ra một chủng tộc thông minh. Nhưng ông cũng tỏ ra tử tế khi khuyên rằng những người ông gọi là "Social undesirables" (thành phần thấp kém trong xã hội) nên được đối xử tử tế nếu họ chịu khó lao động, nhưng không khuyến khích họ có con! Ngay từ thời đó, đã có người (như George Bernard Shaw) phản đối học thuyết này. Francis Galton cảm thấy những người phản đối không hiểu "thiện ý" của ông!

Tôi phải thêm rằng Galton, nói theo cách nói của người mình, còn là một nhà khoa học tướng mạo. Ông là người đầu tiên dùng phương pháp đo lường và thống kê để chỉ ra rằng những kẻ tội phạm thường có khuôn mặt rất "distinctive," hiểu theo nghĩa lệch so với phân bố chuẩn – normal distribution. Sau này, nhiều nhà tâm lí học cũng xác nhận phát hiện của Galton. Có người (Haselhuhn & Wong, 2011) còn "chứng minh" rằng những đường nét hình học trên mặt có thể cho chúng ta biết cá tính của họ (như có xu hướng lừa đảo hay khai thác người khác). Tất cả đều xuất phát từ ý tưởng của Galton. Người mình cũng có khoa tướng số, nhưng hình như chưa được hệ thống hoá như người Tây, và đây chính là một mảng nghiên cứu tâm lí thống kê học còn bỏ ngỏ ở VN.

"Regression toward the mean"

Dù Galton được ghi nhận về những đóng góp cho di truyền học và học thuyết ưu sinh, ít ai biết rằng ông cũng là người khởi xướng ứng dụng thống kê trong nhân chủng học và tâm lí học. Có người gọi ông là cha đẻ của "behavioral genetics" (di truyền hành vi học), vì ông là người đầu tiên nghiên cứu trên những cặp song sinh. Qua nghiên cứu này, ông tính hệ số tương quan ở nhóm sinh đôi monozygotic (tức 1 hợp tử, hai người có cùng hệ gen) và nhóm dizygotic (hai hợp tử, tức như hai anh/chị em), và qua so sánh hai hệ số tương quan, ông có thể ước tính mức độ ảnh hưởng của yếu tố di truyền. Ông cũng là người đầu tiên chỉ ra rằng những khác biệt về chiều cao là do di truyền. Ông quan sát một hiện tượng quan trọng rằng những cha mẹ có chiều cao cao thường có con có chiều cao thấp hơn họ, và ngược lại những cha mẹ có chiều cao thấp thường có con có chiều cao cao hơn họ. Nói cách khác chiều cao của con có xu hướng nghiêng về số trung bình của cha mẹ, và ông gọi hiện tượng này là "Regression toward the mean" (RTM).

Hiện tượng RTM sau này được ghi nhận ở rất nhiều tình huống khác trong lâm sàng, và có ý nghĩa đến việc thiết kế thí nghiệm và phân tích dữ liệu. Trong nghiên cứu lâm sàng, chúng ta thường theo dõi một nhóm đối tượng, và đo lường một chỉ số lâm sàng nào đó (ví dụ như độ đau đớn) trước và sau khi điều trị, kí hiệu là x0 và x1. Như vậy hiệu số d = x1 - x0 chính là mức độ ảnh hưởng. Nếu chúng ta vẽ biểu đồ tán xạ (scatterplot) giữa d (y-axis) và x0 (x-axis), chúng ta thường sẽ thấy một mối liên hệ âm tính: những người có giá trị x0 cao (tức rất đau) thường có độ giảm đau (tức d) cao; những người có giá trị x0 thấp thì có thể d lại là số dương. Nếu nhìn vào biểu đồ này, chúng ta có thể kết luận là thuốc rất có hiệu quả ở người bị bệnh nặng, nhưng ở người bệnh nhẹ thì thuốc không có hiệu quả.


Nhưng đó có thể là một kết luận sai lầm! Hiện tượng d có liên quan âm tính với x0 được gọi là hiệu ứng RTM. Hiệu ứng RTM xảy ra là do sai số đo lường (measurement error). Có thể chứng minh dễ dàng rằng nếu sai số đo lường càng cao thì hiệu ứng RTM cũng cao. Do đó, mức độ ảnh hưởng d mà chúng ta quan sát được có thể là do RTM, nhưng cũng có thể là do can thiệp. Để biết ảnh hưởng quan sát được là do can thiệp hay do RTM, chúng ta cần phải có nhóm chứng. Điều này có nghĩa là những nghiên cứu so sánh trước và sau can thiệp cần phải có nhóm chứng, bởi vì thiếu nhóm chứng thì rất khó diễn giải kết quả.

Hiện tượng RTM rất phổ biến trong nghiên cứu y học, xã hội học, giáo dục, tâm lí học. Thế nhưng điều lí thú (hay ngạc nhiên) là rất nhiều nhà khoa học không biết đến, nên họ thường diễn giải sai. Mới đây, tôi có dịp cố vấn cho một em nghiên cứu sinh bên Nhật về một nghiên cứu can thiệp giảm cân, và cũng thấy hiện tượng RTM, nên phải sử dụng một mô hình phân tích mà người thầy của em ấy không biết. Ông ấy cũng chưa nghe đến RTM bao giờ. Thế nhưng có lẽ do tự ái hay sao đó, nên ông ấy vẫn muốn làm theo cách làm ... sai.

Năm 1908, Galton viết cuốn tiểu sử mình và xuất bản. Một năm sau (1909) ông nhận được danh dự "hiệp sĩ" từ Vua Edward. Ngày 17/1/1911, ông qua đời ở Anh ở tuổi 88. Ông không có con. Trong di chúc, ông đề nghị lấy tài sản của ông để lập ra một quĩ để tài trợ cho vị trí giáo sư về ưu sinh của [Đại học] University College of London (UCL). Chức danh này chính thức là "Galton Professor of Eugenetics", nhưng vào giữa thập niên 1960 thì đổi thành "Galton Professor of Genetics". Người đầu tiên được bổ nhiệm chức vụ này là Giáo sư Karl Pearson, và ông giữ vị trí này từ 1911 đến 1933. Người kế tiếp là Ronald Fisher (1933-1943), Lionel Penrose (?-1965), Harry Harris (1965-1976), Bette Robson (1976-1994), và Nick Wood (2009 đến nay).


Những bài viết về Francis Galton:
Allen, G. (2002). The measure of a Victorian polymath: Pulling together the strands of Francis Galton's legacy to modern biology. Nature, 145(3), 19-20.
Bynum, W. F. (2002). The childless father of eugenics. Science, 296, 472.
Clayes, G. (2001). Introducing Francis Galton, 'Kantsaywhere' and 'The Donoghues of Dunno Weir.' Utopian Studies, 12(2), 188-190.
Forest, D. (1995). Francis Galton (1822-1911). In R. Fuller (Ed.), Seven pioneers of psychology: Behavior and mind (pp.1-19). Routledge: London and New York.
Irvine, P. (1986). Sir Francis Galton (1822-1911). Journal of Special Education, 20(1).
Jensen, A. (2002). Galton's legacy to research on intelligence. Journal of Biosocial Science, 34, 145-172.
Seligman, D. (2002). Good breeding. National Review, 54(1), 53-54.
Simonton, D. K. (2003). Francis Galton's Hereditary Genius: Its place in the history and psychology of Science. In R. J. Sternberg (Ed.), The anatomy of impact: What makes the great works of psychology great (pp. 3-18). American Psychological Association: Washington, D.C.
https://academic.oup.com/ije/article/34/1/215/638499/Regression-to-the-mean-what-it-is-and-how-to-deal




No comments: