Phương pháp quy nạp ngược là gì? Ví dụ về phương pháp quy nạp ngược

Phương pháp quy nạp ngược là gì? Phương pháp quy nạp ngược trong tiếng Anh là Backward Induction. Ví dụ về phương pháp qui nạp ngược?

Phương pháp quy nạp ngược là quá trình lập luận ngược thời gian. Các phân tích tại các mốc thời gian được đánh giá các tối ưu tương ứng. Tức là các đánh giá hoặc quyết định của mỗi người cho rằng tối ưu nhất cần thực hiện trong các thời điểm hay giai đoạn tương ứng. Phương pháp này cũng được áp dụng trong lý thuyết trò chơi. Từ đó tìm ra các chiến lược tối ưu cho các thời điểm khác nhau được xác định. Nó cũng có những ý nghĩa nhất định trong giải quyết tình huống kinh tế. Một trong các trò chơi có sử dụng quy nạp ngược với tên gọi phân tích ngược dòng là cờ vua.

1. Phương pháp quy nạp ngược là gì?

Phương pháp quy nạp ngược trong tiếng Anh là Backward Induction.

Khái niệm.

Quy nạp ngược là quá trình lập luận ngược thời gian từ cuối ngược về. Tức là mang đến các cách thức hay lựa chọn tối ưu cho một chuỗi các hành động. Với điểm đặc biệt là nhận định vấn đề từ khi kết thúc một vấn đề hoặc tình huống đến dội ngược lại các mốc thời gian trước. Nó tiến hành những xem xét tại thời điểm cuối cùng quyết định được đưa ra. Đánh giá tình huống diễn biến để thực hiện các biện pháp được xem là tối ưu nhất cho giai đoạn tiếp theo. Đương nhiên các quyết định này lại là nguyên nhân cần giai quyết ở các bước sau đó.

Quá trình này cứ diễn ra theo các giai đoạn và cách thức thực hiện tối ưu nhất tương ứng. Quá trình này tiếp tục ngược lại cho đến khi người ta xác định được hành động tốt nhất cho mọi tình huống có thể xảy ra (tức là đối với mọi tập hợp thông tin có thể có ) tại mọi thời điểm. Nó thực sự phù hợp trong tiến hành các trò chơi trí tuệ thực hiện nhiều giai đoạn giống nhau. Hoặc với các nhà đầu tư ứng dụng trong hoạt động kinh tế của mình. Trong một trò chơi chính diễn ra các giai đoạn được tiến hành tuần tự. Với lý thuyết trò chơi, quy nạp ngược là một phương pháp được sử dụng để tính toán điểm cân bằng hoàn hảo.

Phương pháp quy nạp ngược trong lí thuyết trò chơi là một quá trình lặp đi lặp lại của lí luận ngược thời gian. Trong trò chơi có nhiều bước thực hiện giống nhau, tuy nhiên chiến thuật hay lựa khác đi tìm kiếm phần thắng. Tính từ khi kết thúc một vấn đề hoặc tình huống để giải quyết các khuôn mẫu phổ thông hữu hạn và những trò chơi tuần tự để đưa ra một chuỗi các hành động tối ưu.

Ứng dụng trong nhiều hoạt động.

Trong các lĩnh vực liên quan của lập kế hoạch và lập lịch tự động hay chứng minh định lý tự động, phương pháp này được gọi là tìm kiếm ngược. Khi các mục tiêu và kết quả mong muốn được xác định trước. Sau đó con người mới tiến hành các bước lùi giai đoạn. Ở các giai đoạn hay công việc trước đó cần thực hiện gì. Cứ như vậy, người ta xác định được các bước hay hoạt động đầu tiên cần thực hiện theo kế hoạch. Các quy nạp được phản ánh ngược nhằm xác định các bước tối ưu cần thực hiện ở từng thời điểm tương ứng.

Thông thường, phương pháp quy nạp ngược có thể được áp dụng trong lựa chọn của quyết định mỗi người. Với một giai đoạn lớn có thể chia ra làm các giai đoạn nhỏ. Cá nhân có thể tính toán các lợi ích hợp lý cho thời điểm nhận lợi ích cuối cùng và lùi lại. Các tính toán cứ được lặp lại đến khi họ thấy mốc thời gian và lợi ích nhận được là phù hợp nhu cầu. Hoặc phương pháp có thể tính toán, ứng dụng trong các hoạt động, công việc thực hiện khác nhau.

Nguồn gốc của phương pháp quy nạp ngược.

Phương pháp quy nạp ngược từng được sử dụng để giải quyết các trò chơi kể từ khi John von Neumann và Oskar Morgenstern thiết lập lí thuyết trò chơi như một chủ đề học thuật. Ứng dụng khi họ xuất bản cuốn sách "Lí thuyết về trò chơi và hành vi kinh tế" năm 1944.

Trong một trò chơi được tiến hành theo mỗi giai đoạn có tính chất tương tự. Với sự tham gia của hai hay nhiều người chơi có tính toán chiến thuật. Ở mỗi giai đoạn của trò chơi, các bước cuối cùng đưa ra phản ánh chiến lược tối ưu được thực hiện. Sau đó, hành động tối ưu của người chơi tiếp theo được xác định. Nó không được tính toán trước mà phải phụ thuộc vào kết quả cuối cùng được người chơi trước đó thực hiện. Và vẫn tuần tự thực hiện hành động của người chơi cuối cùng như đã đưa ra.

Quá trình này tiếp tục về phía sau cho các giai đoạn đến khi trò chơi kết thúc. Và đến khi hành động tốt nhất cho mọi thời điểm đã được xác định. Phản ánh tối ưu là dựa trên các khả năng và lựa chọn của từng người chơi cụ thể. Thực tế, người ta xác định trạng thái cân bằng của mỗi trò chơi con trong trò chơi gốc. Và vì thế các người chơi khác có thể đoán được hoặc không chiến thuật của những người khác. Nói cách khác, kết quả suy ra từ phương pháp quy nạp ngược thường không dự đoán được lối chơi thực tế của con người.

Diễn biến của trò chơi theo phán đoán tính hợp lý.

Các nghiên cứu thực nghiệm đã chỉ ra rằng hành vi "hợp lí" hiếm khi được thể hiện trong cuộc sống thực. Bởi trong các trò chơi, tính chất phản ánh trong năng lực hay lựa chọn, cũng như chiến thuật không phải chỉ được thực hiện bằng một cách duy nhất. Các người chơi khác nhau có thể tiến hành các trò chơi con khác nhau. Người chơi phi lí thực sự có thể kết thúc việc nhận thưởng phạt cao hơn so với dự đoán của phương pháp quy nạp ngược. Bởi vậy, các trò chơi trong thực tế có thể kéo dài hay kết thúc sớm không theo dự tính.

Điểm khác biệt duy nhất là việc tối ưu hóa chỉ liên quan đến một người ra quyết định. Khi các quyết định của người trước cần thiết phải được phá giải. Nó thể hiện các ý tưởng phải được ngăn cản. Cũng như cố gắng tìm các lợi thế hay nước đi tối ưu cho mình. Mỗi người phải chọn việc cần làm tại mỗi thời điểm. Có nghĩa là, bằng cách dự đoán những gì người chơi cuối cùng sẽ làm trong mỗi tình huống. Có thể xác định những gì người chơi thứ hai đến cuối cùng sẽ làm. Bởi điểm chung là tất cả đều muốn mình chiến thắng trò chơi và không thể bị các chiến thuật chơi khác đánh lừa,... Trong cờ vua nó được gọi là phân tích ngược dòng.

2. Ví dụ về phương pháp quy nạp ngược:

Ví dụ, trong trò chơi được thực hiện giữa A và B. Các lợi ích được đặt ra tương ứng cho các mốc thời điểm khác nhau cùng thay đổi. Càng về cuối giai đoạn kết thúc trò chơi, các giá trị tương ứng họ có thể nhận được lên đến 100 đô la mỗi người. Tuy nhiên, các lợi ích độc lập cũng được đặt ra cho từng người ở mỗi giai đoạn khác nhau. Nếu lựa chọn dừng cuộc chơi, một trong hai sẽ nhận được tiền thưởng tương ứng. Với các giai đoạn được tiến hành về sau, các giá trị tiền thưởng cho người lựa chọn nhận về sẽ tăng lên.

Giả sử ban đầu giá trị cho giai đoạn con đầu tiên là 2 đô la. Tức la mỗi người có thể nhận về 1 đô la nếu lựa chọn dừng cuộc chơi. Người chơi A đi trước và phải quyết định xem anh ta có nên "lấy" hay "bỏ qua" thứ được cất giấu. Nếu anh ta lấy, thì A và B nhận được 1 đô la cho mỗi người. Nhưng nếu A lựa chọn bỏ qua, tức là các giai đoạn tiếp theo của trò chơi vẫn tiến hành với đầy đủ 2 người chơi. Và quyết định lấy hay bỏ qua bây giờ được đưa ra bởi người chơi B.

Nếu B lấy, cô ấy sẽ nhận được giá trị tương ứng với giai đoạn mới tăng lên là 3 đô la (nghĩa là, trước đó là 2 đô la + 1 đô la). Khi đó cuộc chơi kết thúc với B là người nhận thưởng. Đương nhiên A thua cuộc sẽ nhận được 0 đô la. Nhưng nếu B bỏ qua, A sẽ quyết định lấy hay bỏ qua, và cứ thế. Các giai đoạn cứ được tiến hành và cả hai phải cân đối với các mốc giải thưởng lớn hơn. Nếu cả hai người chơi luôn chọn bỏ qua thì mỗi người sẽ nhận được số tiền thưởng là 100 đô la vào cuối trò chơi. Tuy nhiên thông thường, ai cũng muốn chắc chắn chiến thắng với giá tri giải thưởng hấp dẫn trước mắt.

Tính chất trò chơi.

Nếu các quyết định bỏ qua luôn được đưa ra, cả hai có các giá trị phản ánh tương ứng cho mỗi lần bỏ qua. Và giá tri này là giá trị thực tế họ nhận được sau khi trò chơi kết thúc. Tuy nhiên, sự tin tưởng để không tìm kiếm lợi ích riêng của hai bên phải được xác định chắc chắn. Điểm hay của trò chơi là nếu cả A và B cùng hợp tác và tiếp tục bỏ qua cho đến khi kết thúc trò chơi thì họ sẽ nhận được khoản tiền thưởng tối đa 100 đô la mỗi người. Nhưng nếu họ không tin tưởng nhau và mong họ chọn "lấy" ngay tại cơ hội đầu tiên thì trạng thái cân bằng Nash dự đoán người chơi sẽ nhận được món tiền thấp nhất có thể (1 đô la trong trường hợp này).

Tuy nhiên, trong thực tế, tương đối ít người chơi làm như vậy. Kết quả là, họ nhận được lượng tiền cao hơn lượng tiền dự đoán theo phân tích cân bằng.

Không có căn cứ nào để mọi người xung quanh có thể dự đoán khi nào trò chơi kết thúc và giá trị có thể nhận về. Các người chơi xác định các bước lựa chọn mà họ xem là tối ưu khi lượt chơi của người trước đó kết thúc. Các quyết định trong trường hợp này chỉ đơn giản là nhận về hay bỏ qua. Tuy nhiên trong các trường hợp trò chơi khác, các lựa chọn có thể rất đa dạng và cần tư duy nhiều hơn. Như đối với các nước đi trong cờ vua.

    5 / 5 ( 1 bình chọn )