Giá trị thông tin (information value)

(1) Triết học

Hôm nay, tôi muốn làm rõ một điều mà nhà triết học, nhà văn, nhà thi sĩ và nhà soạn kịch Voltaire (1694 – 1778) nói: “Nghi ngờ không phải là một trạng thái dễ chịu, nhưng tin chắc thì thật là ngu xuẩn”. Tôi viết bài này, với một hy vọng duy nhất, làm bạn đọc sẽ dễ chịu hơn khi nghi ngờ một điều gì đó.

Lòng tin và nghi hoặc nên có sự cân bằng. Khi bạn nghi ngờ, hãy chừa chỗ cho sự tin tưởng và ngược lại. Cuộc sống rất nhiều điều khó lường, có thể khiến bạn khó tin, khiến bạn hụt hẫng, thậm chí khiến bạn ngạc nhiên đến mức không nghĩ là nó có thật. Nhưng trên hết, hãy luôn tin tưởng vào chính bạn nhiều hơn. Còn niềm tin dành cho ai khác, điều gì khác, tốt nhất vẫn cần một chút sáng suốt, nghi hoặc.

(2) Câu chuyện

Trong truyện cổ phật giáo Ấn Độ có kể một câu chuyện thương tâm như thế này. Có một người thương buôn nọ rất giàu có, nhưng vợ chết sớm và để lại cho ông một đứa con trai. Vì bận rộn việc mua bán ở phương xa, nên ông đành phải nhờ những người làm trong nhà chăm sóc con mình.

Một hôm, bọn cướp ập tới đốt phá làng, làm nhiều người mất mạng trong trận hỏa hoạn ấy, trong đó có đứa con trai của ông. Sau khi hỏa táng, ông lại lấy chút xương tro của đứa con bỏ vào trong túi gấm, đi đâu cũng mang theo bên người, đêm nào cũng lấy ra kể lể than khóc.

Bỗng đêm kia, bên ngoài có tiếng đứa bé xưng là con của ông. Nhưng ông nghĩ đó là ma, hay bọn con nít trong làng đến chọc phá, nên kiên quyết không mở cửa. Thật ra đứa con ông chỉ bị bọn cướp bắt về rừng, còn đứa bé bị cháy đen mà ông đã thương khóc là một đứa bé khác trong làng. Nhưng mãi mãi ông cũng không bao giờ biết được sự thật, khi sự nghi ngờ trong ông đã đóng bít cửa trái tim và đẩy đứa con của mình ra đi trong tuyệt vọng.

Cuộc sống luôn có những câu chuyện tương tự như thế. Có khi chân lý đã đến gõ cửa rồi mà ta cũng không chịu mở cửa. Bởi ta vẫn tin chắc những nhận định của mình là hoàn toàn đúng. Đó là thái độ cố chấp, bám chặt vào những kiến thức và kinh nghiệm tích lũy cũ kỹ để nhìn vào thực tại mới mẻ.

Trong chừng mực nào đó, dĩ nhiên, kiến thức và kinh nghiệm tích lũy là thứ tài sản quý báu của con người. Nhưng nếu ta không biết sử dụng nó một cách đúng đắn và hợp lý, thì nó sẽ trở thành những bức tường vĩ đại định kiến và thành kiến để ngăn cách ta với sự thật.

Trong khi mọi sự mọi vật vốn không ngừng vận động và biến đổi. Dù nhìn tướng trạng bên ngoài ta thấy không có gì khác so với trước kia, nhưng thật sự là chúng đã không còn y nguyên như tất cả những gì ta hiểu về chúng.

Cho nên, bám chặt vào hiểu biết của mình mà không dám mở lòng ra để khám phá và học hỏi thêm, tức là ta đã tự đào thải mình ra khỏi sự vận hành tự nhiên của cuộc sống. Tuy ta đang có mặt với thực tại, nhưng ta đã đánh mất thực tại.

(3) Mục tiêu

Trong bài này, chúng tôi trình bày cho các bạn một phương pháp tính toán giá trị thông tin (information value, IV) chứa ở trong một biến số nào đó hay một tính chất nào đó, trong việc giải thích một biến số mà mình quan tâm.

(4) Tình huống nghiên cứu

Giả sử bạn làm trong phòng tín dụng của một ngân hàng, dĩ nhiên còn nhiều ứng dụng tương tự khác, bạn có thể hỏi lại tôi khi này khi khác. Bạn cho người ta vay dưới dạng tín chấp. Bạn luôn đối mặt với tình huống là bạn nghi ngờ rằng người vay không trả lại tiền vay đúng hạn hay nợ xấu. Còn không cho vay luôn, thì ngân hàng của bạn sẽ chịu thiệt thòi vì mất đi một khả năng sinh lời, vì bạn là đơn vị kinh doanh tiền tệ.

(5) Bạn phải làm gì trong lúc này?

Nếu ngân hàng của bạn có nhiều năm hoạt động, thì bạn có được dữ liệu lớn về khách hàng của bạn. Từ dữ liệu này, bạn có thể tính toán và khoanh vùng được nhân tố, đặc điểm hay tính chất mà ảnh hưởng đến hành vi không trả lại tiền vay hay nợ xấu.

Trong bài viết ở đây, tôi chỉ đề cập đến hai đặc điểm nhân khẩu học là tuổi và giới.

Giả sử trong 100 khách hàng có 50 người dưới 40 tuổi và 50 người trên 40 tuổi, tỷ lệ nợ xấu lần lượt là 5 người và 10 người.

Và cũng trong 100 khách hàng này có 50 nam và 50 nữ, tỷ lệ nợ xấu lần lượt là 7 người và 8 người.

Tương tự như bài hỗn loạn và trật tự, công thức để tính toán giá trị thông tin bây giờ là:

IV = sum[(% trả đúng hạn – % trả không đúng hạn) * ln(%trả đúng hạn/%trả không đúng hạn)]

Bài toán trở thành tính IV cho tuổi (2 loại dưới 40 và trên 40 tuổi) và cho giới (nam và nữ).
IV(tuổi) = [((45/85) – (5/15))*ln((45/85)/(5/15))] + [((40/85) – (10/15))*ln((40/85)/(10/85))] = 0,166

IV(giới) = [((43/85) – (7/15))*ln((43/85)/(7/15))] + [((42/85) – (8/15))*ln((42/85)/(8/15))] = 0,011

(6) Chuẩn để so sánh

IV < 0,1: Dự báo ở thế yếu (weak predictive power)
0,1< IV < 0,3: Dự báo ở thế trung bình (medium predictive power)
0,3 < IV < 0,5: Dự báo ở thế mạnh (strong predictive power)
IV > 0,5: Dự báo ở thế nghi ngờ (Suspicious predictive power)

Kết luận: Khi đưa vào hai biến nhân khẩu học tuổi với phân ngưỡng trên dưới 40 và giới, thì tuổi đã đóng góp giá trị thông tin (ở vị thế trung bình) trong việc giải thích hành vi trả lại tiền vay đúng hay quá hạn.

Các bạn thân mến, các bạn có thể đưa các biến số khác vào để giải thích hành vi này, chẳng hạn như lịch sử vay cá nhân, giá trị khoản vay, tần suất vay, có vay nhiều ngân hàng cùng một lúc hay không, thu nhập và hàng loạt các biến khác.