« Home « Kết quả tìm kiếm

Phương pháp bắn ngẫu nhiên định hướng giải một loại bài toán điều khiển ngẫu nhiên tổng hợp và ứng dụng


Tóm tắt Xem thử

- Chương 2 Một loại bài toán điều khiển ngẫu nhiên tổng hợp và chuyển nó về bài toán điều khiển theo chương trình 12 2.1.
- Thiết lập các điều khiển chấp nhận được tham số hoá.
- Các bài toán điều khiển tối ưu (dạng tất định và ngẫu nhiên) đóng một vai trò quan trọng trong khoa học kỹ thuật và đời sống xã hội.
- Trong số các phương pháp này, có phương pháp bắn tất định (shooting method) (xem [13] pag 186-187) tỏ ra rất có hiệu quả đối với trường hợp có ràng buộc hỗn hợp giữa biến trạng thái và biến điều khiển..
- Tuy nhiên, các phương pháp trên chỉ chứng minh được sự hội tụ của dãy điều khiển xấp xỉ về điều khiển tối ưu khi miền chấp nhận được và hàm mục tiêu có tính lồi.
- Vấn đề càng trở nên phức tạp khi bài toán điều khiển được đặt ra dưới dạng điều khiển tổng hợp (Synthetic control)..
- Trong luận văn này, chúng tôi quan tâm đến một loại bài toán điều khiển ngẫu nhiên tổng hợp trong mô hình liên tục với miền chấp nhận được không có tính lồi và hàm mục tiêu không những không có tính lồi mà còn không liên tục (giới nội địa phương).
- Phương pháp bắn ngẫu nhiên Makov [10] cũng đã được sử dụng làm cơ sở toán học cho phần mềm VISAM-3 nhằm lựa chọn với một xác suất dương biến điều khiển trên phân tập (có độ đo dương) của tập hợp các điều khiển chấp nhận được.
- Nhằm cải tiến phương pháp bắn ngẫu nhiên Markov nói trên, trong luận văn này chúng tôi đề nghị một phương pháp mới "Phương pháp bắn ngẫu nhiên định hướng để giải số một loại bài toán điều khiển ngẫu nhiên tổng hợp".
- Thông qua việc tham số hoá hàm điều khiển, trong chương 2 bài toán điều khiển nói trên được chuyển về một loại bài toán điều khiển tối ưu rời rạc theo chương trình.
- m h (a), ta có:.
- Một loại bài toán điều khiển ngẫu nhiên tổng hợp và chuyển nó về bài toán điều khiển theo chương trình.
- Về mặt toán học, việc xác định các QTVHATHL nói trên đưa về giải một loại bài toán điều khiển tối ưu với biến điều khiển là lưu lượng nước điều tiết từ các hồ chứa bao gồm lưu lượng nước dùng và nước xả, biến trạng thái là trạng thái động của mực nước trong các hồ chứa, hàm mục tiêu là độ rủi ro lũ lụt trung bình, các điều kiện ràng buộc (chấp nhận được) là các điều kiện HLKT, tập hợp các biến điều khiển thoả mãn các điều kiện HLKT là tập hợp các điều khiển chấp nhận được, hệ động lực là hệ phương trình liên hệ các trạng thái động của mực nước trong các hồ chứa (gọi là "phương trình trạng thái")..
- tương ứng với việc xác định hàm điều khiển (liên tục) tương ứng:.
- Khi đó việc xác định QTVHATHL đưa về việc xác định biến điều khiển (2.1.6) trong bài toán điều khiển ngẫu nhiên tổng hợp [4] sau:.
- Ký hiệu X là tập hợp các điều khiển chấp nhận được:.
- ω oi (i = 1 ÷ 3) Để giải bài toán điều khiển ngẫu nhiên (2.1.33) bằng mô hình dò tìm ngẫu nhiên, trong luận văn này chúng tôi quan tâm đến việc lựa chọn một cách ngẫu nhiên hàm điều khiển chấp nhận được x = (x 1 , x 2 , x 3.
- nhằm lựa chọn hàm điều khiển chấp nhận được x ∈ X .
- Với ý nghĩa trên, dưới đây chúng tôi sẽ thiết lập tập hợp D trong dạng tham số hoá của hàm điều khiển x ∈ X với lưu ý rằng: các điều khiển chấp nhận được x ∈ X lại liên quan đến trạng thái ω i (t), (i = 1 ÷ 3) của hệ động lực tất định (2.1.21) và liên quan đến tính "tổng hợp".
- của hàm điều khiển..
- hàm điều khiển (2.1.6) của hệ động lực (2.1.21) có dạng một điều khiển tổng hợp (ĐKTH), vì nếu đặt:.
- (∀i trong hàm điều khiển (2.1.6), được biểu hiện qua bổ đề dưới đây:.
- Nếu đã biết các trạng thái điều khiển w i (T 4 ) (i = 1 ÷ 3), thì các thành phần của ĐKTH (2.2.2):.
- Như vậy, điều khiển x ˆ i (t) trong các khoảng [0, T.
- Trên cơ sở này, để xác định điều khiển x(t) trên cả đoạn [0, T] ta chỉ cần xác định nó trên đoạn [T 1 , T 4.
- Với ý nghĩa đó, ta chỉ cần xét điều khiển:.
- (2.1.28) và gọi nó là các biến điều khiển theo chương trình (gọi tắt là điều khiển)..
- (2.1.28) về việc xác định các hàm điều khiển theo chương trình, ta đặt:.
- (xem[4]) Nếu các hàm (đã cho) q i (t) (i = 1 ÷ 3) và các điều khiển (2.2.4) là liên tục:.
- và ứng với mỗi điều khiển (2.2.4) nói trên, hệ phương trình vi phân (2.1.21) có duy nhất một nghiệm liên tục:.
- Phiếm hàm N (o) (x, w) (xác định theo công thức (2.2.5)) chỉ phụ thuộc vào các điều khiển x i (t) (t ∈ [T 1 , T 4.
- của điều khiển tổng hợp (2.1.6) thành khái niệm "chấp nhận được của điều khiển theo chương trình".
- Điều khiển (2.2.4) của hệ động lực (2.2.17) được gọi là chấp nhận được, nếu nó thỏa mãn các điều kiện sau đây:.
- của điều khiển tổng hợp (2.1.6) và tính "chấp nhận được".
- của điều khiển theo chương trình (2.2.4) cho trong kết quả dưới đây..
- (xem[4]) Với các điều kiện của bổ đề (2.2.1.
- (2.2.3), nếu điều khiển theo chương trình (2.2.4) của hệ động lực (2.2.17) là chấp nhận được thì ĐKTH (2.1.6) của hệ động lực (2.1.21) cũng là chấp nhận được và ngược lại..
- Nếu biết các hàm điều khiển chấp nhận được (2.2.4) theo nghĩa trên và biết trạng thái w(T 4.
- của hệ động lực (2.2.17) tương ứng với điều khiển này, thì thông qua các công thức ta có thể bổ sung (vào (2.2.4)) các hàm điều khiển (2.2.2) để thu được hàm điều khiển tổng hợp (2.1.6) đối với hệ động lực (2.1.21) (trong đó tính chấp nhận được xác định bởi các điều kiện (2.1.22.
- Để tham số hoá hàm điều khiển (2.2.4) (liên tục) nói trên, ta thu hẹp lớp hàm liên tục C(T 1 , T 4 ) về lớp hàm tuyến tính từng khúc trên [T 1 , T 4.
- Khi đó mỗi hàm điều khiển (2.2.4) sẽ được xác định bởi một bộ tham số điều khiển:.
- Mỗi ma trận X ∈ R 3×n được gọi là một bộ tham số điều khiển của hệ động lực (2.2.17) ứng với phân hoạch {t k } K k=0 của đoạn [0, T].
- còn hàm điều khiển (2.2.4) với các thành phần xác định theo (2.2.26) được gọi là điều khiển (tham số hoá) tuyến tính từng khúc tương ứng..
- Tính chấp nhận được của bộ tham số điều khiển X nói trên cũng được xác định bởi tính chấp nhận được của hàm điều khiển của hàm điều khiển (2.2.26) tưng ứng, nghĩa là thoả mãn các điều kiện (2.2.19.
- Tập hợp D gồm tất cả các bộ tham số điều khiển chấp nhận được theo nghĩa trên:.
- được gọi là tập hợp các bộ tham số điều khiển chấp nhận được đối với hệ động lực (2.2.17)..
- Nếu biết được tập hợp D, ta có thể dựa trên công thức (2.2.26) để khôi phục tập hợp D ˆ gồm tất cả các hàm điều khiển (tuyến tính từng khúc) chấp nhận được đối với hệ động lực (2.2.17).
- Để thiết lập các điều kiện ε - chấp nhận được của bộ tham số điều khiển X (xem (2.2.27.
- Nếu các điều khiển (2.2.4) là tuyến tính từng khúc với bộ tham số điều khiển (2.2.27) thì các điều kiện chấp nhận được (2.2.19.
- là nghiệm của hệ phương trình (2.2.17) ứng với bộ tham số điều khiển X tại t = T 4.
- Tập hợp D ε gồm tất cả các bộ tham số điều khiển ε - chấp nhận được theo nghĩa trên:.
- (2.2.38) được gọi là tập hợp các bộ tham số điều khiển ε - chấp nhận được đối với hệ động lực (2.2.17)..
- Với ý nghĩa trên, ta sẽ xét trong chương 3 dưới đây việc lựa chọn một cách ngẫu nhiên bộ tham số điều khiển ε - chấp nhận được X ∈ D ε.
- đây là một loại bài toán điều khiển ngẫu nhiên tổng hợp [7],.
- (2.2.42) đồng thời đề ra thuật toán lựa chọn một cách ngẫu nhiên các tham số điều khiển ε-chấp nhận được X ∼ U D ε 0.
- Nhằm khắc phục khó khăn nói trên, ta sẽ sử dụng thuật toán loại trừ Von Neumann với hiệu quả cao hơn để thu được bộ tham số điều khiển X ∈ D ε thoả mãn điều kiện (2.2.41)..
- (T 1 ≤ t ≤ T 4 , i = 1 ÷ 3) Ta có:.
- (3.1.3) Trong trường hợp này điều khiển tổng hợp được xác định như sau:.
- Nếu hệ phương trình (2.2.17) được xấp xỷ bởi hệ (3.1.2), thì công thức (2.2.3) (để xác định điều khiển tổng hợp (2.2.2)) sẽ trở thành:.
- Ngoài ra, các tham số điều khiển (2.2.27) cũng được xác định từ các biến điều khiển mới theo các công thức truy hồi sau:.
- Cuối cùng, để chứng minh (3.1.10*) ta chú ý đến điều kiện (2.1.6) về tính liên tục tại t = T 1 của hàm điều khiển (2.2.2), để từ (2.2.26) và (3.1.4) suy ra:.
- các điều kiện (3.1.13) đều được thoả mãn ∀k = k 3 + 1 ÷ k 4 .
- u i (k = k 1 + 1 ÷ k 3 , i Ta có thể phát biểu lại các điều kiện (2.2.31.
- (3.1.21) Nhằm thiết lập thuật toán bắn ngẫu nhiên để xác định các tham số điều khiển.
- Cùng với hàm Q k i (theo các tham số điều khiển x k i+1 , x k+1 i+1.
- Nếu hệ động lực có dạng (3.1.2) thì ta có thể xác định các tham số điều khiển theo công thức truy hồi:.
- a k i = a k i (x k i ) (k = k 1 + 1 ÷ k 3 ) xác định trong (3.2.3*) theo các tham số điều khiển x k i (trong đó x k i được xác định theo các biến điều khiển mới ξ i k−1 từ công thức truy hồi (3.1.10.
- (3.2.5) Trong đó điều kiện w i (ε.
- Các điều kiện (3.1.17.
- Trong số các điều kiện ε-chấp nhận được (3.1.17.
- w i (T 4 ) (i = 1 ÷ 3) đã cho, để biểu diễn các điều kiện (3.2.7) theo các biến điều khiển ξ i k (k = k 3 ÷ k 4 − 1) ta đặt:.
- trong đó các biến điều khiển ξ i k (k = k 1 ÷ k 3 − 1) thoả mãn điều kiện (3.2.5), thì ứng với mỗi trạng thái (w 1 (T 4.
- k 4 − 1 (∀i = 1 ÷ 3) thoả mãn điều kiện u i <.
- Các điều kiện (3.2.7.
- Các điều kiện (3.2.8.
- (3.2.3), ta có thể phát biểu các điều kiện ε-chấp nhận được (3.1.17.
- Từ bổ đề (3.2.1) ta nhận thấy rằng: Đối với mỗi i = 3 ÷ 1, các biến điều khiển (ξ i k 1.
- của nó hiểu theo nghĩa các biến điều khiển ξ i k (k = k 1 ÷ k 3 − 1, i = 1 ÷ 3) tương ứng thoả mãn điều kiện (3.2.20):.
- Khi đó, từ bổ đề (3.2.2) ta nhận thấy rằng: Đối với mỗi i = 3 ÷ 1, các biến điều khiển (ξ i k 3.
- của khúc quỹ đạo (3.2.27) hiểu theo nghĩa các biến điều khiển ξ i k (k = k 3 ÷ k 4 − 1, i = 1 ÷ 3) tương ứng thoả mãn điều kiện (3.2.22):.
- được lựa chọn từ trạng thái cuối của các khúc quỹ đạo (3.2.25) ứng với các biến điều khiển là VTNN (ξ i k 1.
- Với mỗi i = 3 ÷ 1, khúc quỹ đạo (3.2.27) được thiết lập từ các biến điều khiển là các thành phần của VTNN (ξ i k 3.
- Phương pháp (nêu trong định nghĩa (3.2.2)) để thu được bộ các biến điều khiển ξ = ξ i k.
- của quỹ đạo nói trên được hiểu theo nghĩa: các biến điều khiển ξ i k (k = k 1 ÷ k 4 − 1, i = 1 ÷ 3) tương ứng thoả mãn các điều kiện (3.2.20.
- Nếu bộ các biến điều khiển ξ = ξ i k.
- (3.2.29) (xem [5] tr.157-158), thì bộ các biến điều khiển này sẽ thoả mãn dạng tương đương (3.2.20.
- (3.2.24) của các điều kiện ε-chấp nhận được..
- Khi đó phương pháp lựa chọn các biến điều khiển này sẽ gọi là phương pháp loại trừ Von Neuman từ các đơn hình.
- Còn miền S(ε) gọi là miền ε- chấp nhận được của bộ các biến điều khiển ξ..
- Sau khi đã xác định được các biến điều khiển ξ i k (k = k 1 ÷ k 4 − 1 , i = 1 ÷ 3) theo phương pháp nói trên, ta có thể dùng công thức truy hồi (3.1.10.
- (3.1.10*) để xác định các tham số điều khiển x k i (k = k 1 + 1 ÷ k 4 , i = 1 ÷ 3) và thu được (xem (2.2.27)) bộ tham số điều khiển X tương ứng..
- Để chỉ ra bộ tham số điều khiển này có tính chất (2.2.41), ta có thể chứng minh kết quả sau đây:.
- Nếu hệ động lực (2.2.17) được xấp xỉ bởi (3.1.2) thì tham số điều khiển x k i (k = k 1 ÷k 4 được xác định theo công thức truy hồi (3.1.10) và (3.1.10.
- Khi đó, nếu các tham số điều khiển mới ξ i k (k = k 1 ÷ k 4 − 1) được xác định như trong các bổ đề trên, thì các bộ tham số điều khiển X thu được từ công thức truy hồi (3.1.10) và (3.1.10*) là chấp nhận được và thoả mãn điều kiện:.
- S(ε) là miền ε - chấp nhập được của bộ các biến điều khiển ξ..
- S(ε) nên từ (3) ta có:.
- 11- Tính các điều khiển tổng hợp x ˆ k i = ˆ x i (t k ) (k = 0 ÷ (k 1 − 1)) và điều khiển ban đầu ˆ.
- 1- Dựa vào các kết quả w i (T 4 ) (i = 3 ÷ 1) nói trên, tính - Các điều khiển tổng hợp x k i.
- Các điều khiển tổng hợp x k i.
- Gulenko, T.I Sarenko "Phương pháp sai phân hưux hạn trong các bài toán điều khiển tối ưu"