(1) Đặt vấn đề
Ngày trước, khi vợ đi làm về thì thường hay càu nhàu: “Nhà cửa bề bộn quá! Anh không có sắp xếp lại gì hết trơn”.
Những ngày sau đó, tôi đi làm về sớm và dọn dẹp lại. Vợ tôi bớt càu nhàu hơn: “Hôm nay, thì đỡ hơn hôm qua, nhưng vẫn còn lộn xộn”.
Tôi bắt đầu tự suy nghĩ: “Hôm nay khác hôm qua cái gì mà đỡ lộn xộn hơn?”. Tôi dạy định lượng hơn 30 năm, lẽ nào mình không lượng hóa lời vợ nói. Như vậy, trong trong đầu tôi hình dung ra 2 cực, một ngôi nhà mà mọi đồ vật để lộn xộn một cách hỗn loạn và một ngôi nhà trật tự ngăn nắp, gọn gàng.
Tôi đã thiết lập thuật toán để đo lường mức độ từ sự hỗn loạn các đồ vật trong nhà, cho đến trật tự ngăn nắp gọn gàng. Tôi phải làm cho ra nhẽ là đồ đạc trong nhà là thực sự gọn gàng với thông số entropy nhất định.
(2) Phạm vi áp dụng (triết lý của tôi là tôi sẽ chẳng học gì nhiều, khi có một thằng giống tôi y chang)
– Có thể tính mức độ đa tôn giáo của một địa phương.
– Khi thi vào đại học, thì chỉ căn cứ vào điểm Anh ngữ, rồi sắp xếp lớp từ điểm cao nhất đến điểm thấp nhất. Với cách sắp xếp như thế này, thì vô hình trung là lớp mà Anh văn cao điểm, là sinh viên thành phố, nơi có nhiều trung tâm Anh ngữ. Những lớp mà Anh văn thấp điểm là sinh viên các tỉnh. Như vậy, phân loại dựa vào Anh văn (n=1). Lẽ ra nên dựa thêm vào các tiêu chí khác như kinh tế học, toán học, vùng miền, và tiêu chí khác với một Entropy nhất định để các em sinh viên có thể học hỏi lẫn nhau.
(3) Để đo lường sự hỗn loạn (entropy), người ta sử dụng hàm hỗn loạn để đo lường:
Entropy = – sum (i=1,n) pi*ln(pi)
Trong đó n là số thuộc tính (ở ví dụ này n=3), Pi là tần suất xuất hiện thuộc tính i trong mẫu quan sát.
Ví dụ trong trường hợp sắp xếp đồ vật như bên dưới:
Trong 3 cách sắp xếp đồ vật trên ngăn tủ dưới đây (n=3), (1) trông có vẻ là bừa bộn nhất và (2) có vẻ ngăn nấp hơn và (3) là ngăn nấp nhất (xem 3 hình bên trái, từ trên xuống).
Như vậy, hãy cùng thử áp dụng công thức đo lường sự hỗn loạn ở trên vào 3 cách sắp xếp để xem làm sao lượng hóa sự ngăn nắp.
Một cách tổng quát, có 3 loại vật dụng trong ngăn tủ bao gồm:
(i) Sách (S) (12 cuốn)
(ii) Đồ trang trí và đồ chơi (T) (5 món loa kèn, radio, xí ngầu, cá sấu, đồng hồ) và
(iii) vật dụng cá nhân (C)(2 món nước rửa tay, bông tăm).
Tổng cộng là 19 món.
Trong trường hợp này n=3 (S, T và C).
Giả sử chia ngăn tủ thành 3 ngăn nhỏ, trong cách sắp xếp thứ 1, ngăn đầu tiên có 8 cuốn sách (S) và 2 đồ trang trí (xí ngầu và radio) (T); ngăn 2 có 4 cuốn sách, 1 vật dụng cá nhân (bông tăm) và 1 đồ trang trí (đồng hồ); ngăn 3 chỉ có 2 đồ trang trí (loa kèn, cá sấu) và vật dụng cá nhân (nước rửa tay).
[Ứng với hình bên phải, cách sắp xếp lộn xộn nhất, trên cùng]Mức độ hỗn loạn trong cách sắp xếp đầu tiên, ngăn đầu tiên (từ phải sang trái)
E(1.1) = – (p(S) * ln p(S) + p(T) * ln p (T)) = -(8/10 * ln (8/10) + 2/10 * ln (2/10)) = 0.54
Tương tự trong ngăn nhỏ thứ 2 và thứ 3:
E(1.2) = -(4/6 * ln(4/6) + 1/6 * ln(1/6) + 1/6 * ln(1/6)) = 0.867
E(1.3) = -(2/3 * ln(2/3) + 1/3 * ln(1/3)) = 0.637
Mức độ hỗn loạn trong cách sắp xếp thứ 1 là E(1) = 0.54 * 10/19 + 0.867 * 6/19 + 0.637 * 3/19 = 0.659
Cho cách sắp xếp thứ 2: ngăn nắp hơn do chỉ có sách trong 2 ngăn đầu tiên (lần lượt từ phải sang trái, là chứa 8 cuốn sách và chứa 4 cuốn sách) và ngăn thứ 3 vẫn còn bừa bãi do chứa cả đồ cá nhân (bông tăm, rửa tay) lẫn đồ trang trí (cá sấu, xí ngầu, loa kèn, đồng hồ và radio).
E(2.1) = – (8/8)* ln (8/8) =0
E(2.2) = – (4/4)* ln (4/4) =0
E(2.3)= – (2/7 * ln (2/7) + 5/7 * ln (5/7)) = 0.598
E(2) = 8/19 * 0 + 4/19 * 0 + 7/19* 0.598 = 0.22
Đối với cách sắp xếp thứ 3: 2 ngăn đầu hoặc chỉ chứa sách (12 cuốn sách), hoặc chỉ chứa đồ trang trí (4 món trang trí), ngăn còn lại chứa cả đồ trang trí (đồng hồ) và vật dụng cá nhân (bông tăm và rửa tay]
E(3.1) = – (12/12)* ln (12/12) =0
E(3.2) = – (4/4)* ln (4/4) =0
E(3.3)= – (1/3 * ln (1/3) + 2/3 * ln (2/3)) = 0.637
E(3) = 12/19 * 0 + 4/19 * 0 + 3/19 * 0.637 = 0.10
Như vậy, xét theo tính hỗn loạn thì cách sắp xếp thứ E(1)>>E(2)>>E(3). Như vậy, trật tự nhất là cách sắp xếp thứ (3).