Luận văn thạc sĩ: Nghiệm Viscosity đối với Bài toán Điều khiển Tối ưu

Chuyên ngành

Toán Học

Người đăng

Ẩn danh

Thể loại

Luận Văn

2023

81
0
0

Phí lưu trữ

30 Point

Tóm tắt

I. Tổng quan luận văn thạc sĩ nghiệm viscosity điều khiển tối ưu

Luận văn thạc sĩ toán học với chủ đề nghiệm viscosity đối với bài toán điều khiển tối ưu là một công trình nghiên cứu chuyên sâu, kết nối hai lĩnh vực quan trọng của toán học hiện đại: lý thuyết điều khiển và phương trình đạo hàm riêng. Trọng tâm của nghiên cứu là sử dụng khái niệm nghiệm viscosity để phân tích hàm giá trong các bài toán điều khiển tối ưu. Phương pháp này đặc biệt hiệu quả khi các nghiệm cổ điển không tồn tại do tính không trơn của hàm giá. Công trình này không chỉ làm rõ mối quan hệ mật thiết giữa điều khiển tối ưu và phương trình Hamilton-Jacobi mà còn phân tích các tính chất quan trọng của nghiệm như tính duy nhất, tính nửa lõm và mối liên hệ với nguyên lý cực đại Pontryagin. Việc áp dụng lý thuyết này vào các bài toán cụ thể như bài toán Mayerbài toán Bolza đã chứng tỏ tính hiệu quả và mở ra nhiều hướng nghiên cứu tiềm năng trong các lĩnh vực ứng dụng như kinh tế, tài chính và kỹ thuật.

1.1. Lịch sử và tầm quan trọng của lý thuyết điều khiển tối ưu

Lịch sử của lý thuyết điều khiển tối ưu bắt nguồn từ rất sớm nhưng chỉ thực sự phát triển mạnh mẽ vào thế kỷ 20. Các phương pháp biến phân cổ điển do Euler và Lagrange đề xuất vào thế kỷ 18 đã đặt nền móng. Tuy nhiên, sự phát triển vượt bậc diễn ra vào những năm 1950 với hai công trình đột phá: nguyên lý cực đại Pontryagin (1956) và phương pháp quy hoạch động của Bellman (1957). Những công cụ toán học này đã cung cấp các phương pháp hiệu quả để giải quyết nhiều bài toán phức tạp trong kỹ thuật, đặc biệt là trong bối cảnh Thế chiến thứ hai yêu cầu các hệ thống điều khiển tự động tinh vi. Ngày nay, bài toán điều khiển tối ưu không chỉ giới hạn trong kỹ thuật mà còn có ứng dụng rộng rãi trong quản lý kinh tế, tài chính, và sinh học, đòi hỏi các phương pháp giải quyết ngày càng chính xác và hiệu quả.

1.2. Mối liên hệ giữa hàm giá và phương trình Hamilton Jacobi

Trong lý thuyết điều khiển tối ưu, hàm giá (value function) đóng vai trò trung tâm. Nó biểu thị chi phí tối thiểu để đưa hệ thống từ một trạng thái ban đầu đến trạng thái mong muốn. Phương pháp quy hoạch động của Bellman đã chỉ ra rằng hàm giá này thỏa mãn một phương trình đạo hàm riêng phi tuyến tính cấp một, được gọi là phương trình Hamilton-Jacobi-Bellman (HJB). Đây là một dạng tổng quát của phương trình Hamilton-Jacobi cổ điển. Tuy nhiên, một thách thức lớn là hàm giá thường không khả vi tại mọi điểm, do đó không thể là nghiệm cổ điển của phương trình HJB. Điều này thúc đẩy sự ra đời của một khái niệm nghiệm yếu hơn nhưng vẫn đảm bảo tính duy nhất và ổn định.

1.3. Vai trò cốt lõi của nghiệm viscosity trong bài toán tối ưu

Khái niệm nghiệm viscosity, được Crandall và Lions giới thiệu vào đầu những năm 1980, đã trở thành công cụ tiêu chuẩn để xử lý các phương trình Hamilton-Jacobi. Một hàm được gọi là nghiệm viscosity nếu nó thỏa mãn phương trình theo một nghĩa yếu, dựa trên các khái niệm vi phân trên (superdifferential)vi phân dưới (subdifferential). Ưu điểm lớn của lý thuyết này là nó đảm bảo sự tồn tại và duy nhất của nghiệm cho một lớp rộng các bài toán mà không yêu cầu tính trơn của hàm. Trong bối cảnh của bài toán điều khiển tối ưu, việc chứng minh hàm giá là nghiệm viscosity duy nhất của phương trình HJB tương ứng cho phép phân tích các tính chất của nó một cách chặt chẽ và áp dụng các công cụ từ lý thuyết phương trình đạo hàm riêng.

II. Thách thức khi giải bài toán tối ưu bằng các nghiệm cổ điển

Việc tìm kiếm giải pháp cho các bài toán điều khiển tối ưu thường gặp phải một trở ngại cơ bản: sự thiếu trơn của hàm giá. Các phương pháp cổ điển, vốn yêu cầu hàm phải khả vi liên tục, thường không thể áp dụng trực tiếp. Ví dụ, quỹ đạo tối ưu có thể không duy nhất tại một số điểm, dẫn đến việc hàm giá có các điểm "góc" hoặc không khả vi. Điều này làm cho khái niệm nghiệm cổ điển của phương trình Hamilton-Jacobi trở nên quá hạn chế. Luận văn đã chỉ ra rằng việc tìm kiếm một lớp nghiệm rộng hơn, có thể xử lý được tính không chính quy này, là một yêu cầu cấp thiết. Đây chính là lúc khái niệm nghiệm viscosity phát huy vai trò, cung cấp một khuôn khổ lý thuyết vững chắc để đảm bảo sự tồn tại và duy nhất của nghiệm ngay cả khi các điều kiện về tính trơn không được thỏa mãn. Cách tiếp cận này giúp vượt qua những hạn chế của phương pháp truyền thống.

2.1. Hạn chế của phương pháp biến phân và nghiệm cổ điển

Phương pháp biến phân cổ điển và các kết quả như phương trình Euler-Lagrange đòi hỏi các hàm liên quan phải có độ trơn nhất định (thường là khả vi liên tục). Tuy nhiên, trong nhiều bài toán điều khiển tối ưu thực tế, hàm giá chỉ là hàm liên tục Lipschitz và không khả vi ở khắp mọi nơi. Điều này có nghĩa là gradient của hàm giá không được xác định tại một số điểm, khiến cho việc thay trực tiếp vào phương trình Hamilton-Jacobi trở nên vô nghĩa. Sự tồn tại của các "cung kì dị" (singular arcs) hoặc sự chuyển đổi đột ngột trong chiến lược điều khiển tối ưu là những nguyên nhân phổ biến gây ra tính không trơn này. Do đó, lý thuyết dựa trên nghiệm cổ điển không đủ tổng quát để bao quát hết các trường hợp quan trọng.

2.2. Sự cần thiết của một định nghĩa nghiệm yếu nghiệm viscosity

Để giải quyết vấn đề thiếu trơn, khái niệm nghiệm viscosity ra đời. Thay vì yêu cầu phương trình phải đúng tại mọi điểm, định nghĩa này sử dụng các hàm thử (test functions) trơn tiếp xúc với đồ thị của hàm từ phía trên và phía dưới. Cụ thể, một hàm u là nghiệm dưới viscosity nếu tại mọi điểm cực đại địa phương của u - φ (với φ là hàm thử trơn), bất đẳng thức H(x, u(x), Dφ(x)) ≤ 0 được thỏa mãn. Tương tự cho nghiệm trên viscosity. Định nghĩa này không trực tiếp sử dụng đạo hàm của u, do đó nó hoàn toàn phù hợp với các hàm không trơn như hàm liên tục Lipschitz. Cách tiếp cận này đã được chứng minh là "đúng đắn" vì nó cho phép chứng minh các định lý so sánh, dẫn đến tính duy nhất của nghiệm trong nhiều lớp bài toán rộng lớn.

III. Phương pháp tiếp cận bài toán Mayer bằng nghiệm viscosity duy nhất

Luận văn tập trung phân tích sâu vào bài toán Mayer, một dạng bài toán kinh điển trong lý thuyết điều khiển tối ưu. Mục tiêu của bài toán là cực tiểu hóa một hàm chi phí cuối g(y(T)) phụ thuộc vào trạng thái của hệ thống tại thời điểm cuối T. Cách tiếp cận chính của công trình là chứng minh rằng hàm giá V(t,x) của bài toán Mayer chính là nghiệm viscosity duy nhất của phương trình Hamilton-Jacobi tương ứng: -∂tV + H(x, ∇xV) = 0. Việc thiết lập kết quả này đòi hỏi phải phân tích các tính chất của hàm giá, bao gồm tính liên tục Lipschitz và đặc biệt là tính nửa lõm (semiconcavity). Những tính chất này không chỉ quan trọng về mặt lý thuyết mà còn là nền tảng để kết nối với các điều kiện tối ưu khác, chẳng hạn như nguyên lý cực đại Pontryagin. Nghiên cứu này cung cấp một cái nhìn toàn diện về cấu trúc của lời giải cho bài toán Mayer.

3.1. Định nghĩa và sự tồn tại của điều khiển tối ưu trong bài toán Mayer

Một bài toán Mayer được xác định bởi một hệ phương trình trạng thái y'(t) = f(y(t), u(t)), một tập điều khiển U (thường là compact), và một hàm chi phí cuối g. Một điều khiển u(·) được gọi là tối ưu nếu quỹ đạo tương ứng y(·) làm cho giá trị g(y(T)) đạt mức nhỏ nhất có thể. Dưới các giả thiết tiêu chuẩn như f liên tục, bị chặn, và Lipschitz theo biến trạng thái, và tập f(x,U) là lồi, Định lý Filippov đảm bảo sự tồn tại của ít nhất một điều khiển tối ưu. Sự tồn tại này là tiền đề cơ bản, cho phép định nghĩa hàm giá V(t,x) là giá trị cực tiểu có thể đạt được, và từ đó bắt đầu phân tích các tính chất của nó.

3.2. Chứng minh hàm giá là nghiệm viscosity duy nhất của bài toán

Đây là kết quả trung tâm của luận văn. Quá trình chứng minh bao gồm hai bước. Đầu tiên, dựa vào nguyên lý quy hoạch động, người ta chỉ ra rằng hàm giá V thỏa mãn các bất đẳng thức của định nghĩa nghiệm viscosity. Bước thứ hai, và cũng là bước khó hơn, là chứng minh tính duy nhất. Điều này thường được thực hiện thông qua một định lý so sánh, khẳng định rằng nếu u là nghiệm dưới viscosity và v là nghiệm trên viscosity, thì u ≤ v. Áp dụng kết quả này cho trường hợp uv đều là nghiệm viscosity, ta có u ≤ vv ≤ u, suy ra u = v. Tính duy nhất này khẳng định rằng hàm giá là đối tượng duy nhất mô tả đầy đủ lời giải của bài toán điều khiển tối ưu trong khuôn khổ HJB.

3.3. Phân tích tính nửa lõm semiconcavity của hàm giá V

Ngoài tính liên tục Lipschitz, luận văn còn chứng minh một tính chất chính quy quan trọng hơn của hàm giátính nửa lõm. Một hàm u được gọi là nửa lõm nếu hàm x ↦ u(x) + C|x|² là lồi với một hằng số C đủ lớn. Tính nửa lõm yếu hơn tính lồi nhưng mạnh hơn tính liên tục Lipschitz. Nó ngụ ý rằng các vi phân trên D*u(x) là các tập compact, lồi, và không rỗng. Tính chất này rất hữu ích vì nó cung cấp thông tin về cấu trúc của các điểm không khả vi và là chìa khóa để liên kết lý thuyết nghiệm viscosity với nguyên lý cực đại Pontryagin, như sẽ được trình bày ở phần sau.

IV. Khám phá nguyên lý cực đại Pontryagin và các điều kiện tối ưu

Một trong những đóng góp giá trị của luận văn là làm sáng tỏ mối liên hệ sâu sắc giữa hai cách tiếp cận chính cho bài toán điều khiển tối ưu: quy hoạch động (thông qua nghiệm viscosity) và phương pháp biến phân (thông qua nguyên lý cực đại Pontryagin). Nguyên lý này cung cấp một điều kiện cần cho một quỹ đạo là tối ưu, dưới dạng một hệ phương trình Hamilton. Luận văn chỉ ra rằng cung đối ngẫu p(t) trong nguyên lý Pontryagin có một diễn giải hình học rất tự nhiên trong lý thuyết nghiệm viscosity: nó chính là một phần tử thuộc vi phân trên của hàm giá dọc theo quỹ đạo tối ưu, tức là p(t) ∈ D*V(t, y(t)). Mối liên hệ này không chỉ hợp nhất hai lý thuyết lớn mà còn cung cấp một công cụ mạnh mẽ để phân tích tính khả vi của hàm giá và tính duy nhất của quỹ đạo tối ưu.

4.1. Phát biểu nguyên lý maximum cho bài toán điều khiển Mayer

Nguyên lý cực đại Pontryagin phát biểu rằng: nếu u*(·) là một điều khiển tối ưu và y*(·) là quỹ đạo tối ưu tương ứng, thì tồn tại một hàm liên tục tuyệt đối p(·) (gọi là cung đối ngẫu) không đồng nhất bằng không, thỏa mãn phương trình liên hợp p'(t) = -∇xf(y*(t), u*(t))ᵀp(t) và điều kiện hoành p(T) ∈ ∂g(y*(T)). Quan trọng nhất, điều kiện cực đại phải được thỏa mãn: p(t)·f(y*(t), u*(t)) = max_{v∈U} p(t)·f(y*(t), v) hầu khắp nơi trên [t, T]. Nguyên lý này về cơ bản biến bài toán tối ưu hóa trên không gian hàm thành bài toán tối ưu hóa tại mỗi thời điểm.

4.2. Mối quan hệ giữa cung đối ngẫu và vi phân trên của hàm giá

Kết quả đáng chú ý trong luận văn là việc thiết lập mối liên kết p(t) ∈ D*V(t, y(t)). Điều này có nghĩa là cung đối ngẫu p(t) chính là (một trong các) gradient suy rộng của hàm giá tại điểm (t, y(t)). Khi hàm giá V khả vi tại (t, y(t)), thì D*V(t, y(t)) chỉ chứa một phần tử duy nhất là ∇V(t, y(t)), và do đó p(t) = ∇V(t, y(t)). Mối quan hệ này cho thấy cung đối ngẫu đo lường độ nhạy của chi phí tối ưu đối với sự thay đổi của trạng thái hệ thống, một ý nghĩa hoàn toàn phù hợp với vai trò của gradient. Điều này cũng cung cấp một phương pháp để "khởi tạo" cung đối ngẫu nếu biết được hàm giá.

4.3. Điều kiện cần và đủ cho tính khả vi của hàm giá tối ưu

Dựa trên mối liên hệ trên, luận văn phân tích điều kiện để hàm giá khả vi. Một kết quả quan trọng được nêu ra là: hàm giá V khả vi tại điểm (t,x) nếu và chỉ nếu tồn tại duy nhất một quỹ đạo tối ưu xuất phát từ (t,x). Khi có nhiều quỹ đạo tối ưu, hàm giá sẽ không khả vi tại điểm đó và tập vi phân trên D*V(t,x) sẽ chứa nhiều hơn một phần tử. Mỗi phần tử trong D*V(t,x) sẽ tương ứng với một cung đối ngẫu của một quỹ đạo tối ưu khác nhau. Do đó, tính không khả vi của hàm giá là một chỉ báo trực tiếp về sự không duy nhất của lời giải cho bài toán điều khiển tối ưu.

V. Hướng giải quyết bài toán Bolza và các ví dụ minh họa thực tế

Bên cạnh bài toán Mayer, luận văn cũng mở rộng phân tích sang bài toán Bolza, một dạng tổng quát hơn bao gồm cả chi phí cuối và chi phí tích lũy theo thời gian, gọi là chỉ phí điều hành L(y(t), u(t)). Một kỹ thuật tiêu chuẩn và hiệu quả được trình bày là biến đổi bài toán Bolza thành một bài toán Mayer tương đương bằng cách thêm một biến trạng thái mới. Biến này tích lũy chỉ phí điều hành theo thời gian. Sau khi chuyển đổi, toàn bộ bộ máy lý thuyết của nghiệm viscositynguyên lý cực đại Pontryagin đã phát triển cho bài toán Mayer có thể được áp dụng một cách trực tiếp. Luận văn cũng xem xét các ví dụ cụ thể, chẳng hạn như hệ điều khiển tuyến tính với hàm chi phí lồi, để minh họa các kết quả lý thuyết và cho thấy cách các tính chất (như tính lồi) của bài toán được bảo toàn và phản ánh trong các tính chất của hàm giá.

5.1. Chuyển đổi bài toán Bolza về dạng bài toán Mayer tương đương

Mục tiêu của bài toán Bolza là cực tiểu hóa phiếm hàm J(u) = g(y(T)) + ∫L(y(s), u(s))ds. Để chuyển nó về dạng Mayer, ta định nghĩa một biến trạng thái mở rộng Y(t) = (y₀(t), y(t)), trong đó y(t) là biến trạng thái ban đầu và y₀(t) là biến mới thỏa mãn y₀'(t) = L(y(t), u(t)) với điều kiện đầu y₀(t₀) = 0. Khi đó, phiếm hàm J(u) có thể được viết lại thành g(y(T)) + y₀(T). Đây chính là một bài toán Mayer trên không gian trạng thái mở rộng R × Rⁿ với hàm chi phí cuối mới là G(Y(T)) = G(y₀(T), y(T)) = y₀(T) + g(y(T)). Kỹ thuật này cho thấy lý thuyết phát triển cho bài toán Mayer có tính tổng quát cao.

5.2. Các giả thiết và tính chất của chỉ phí điều hành running cost

Để đảm bảo các kết quả lý thuyết vẫn áp dụng được sau khi chuyển đổi, hàm chỉ phí điều hành L(x,u) cần thỏa mãn một số điều kiện chính quy tương tự như hàm động lực học f. Thông thường, các giả thiết bao gồm L liên tục, bị chặn trên các tập compact, và là hàm liên tục Lipschitz theo biến trạng thái x. Trong nhiều trường hợp, người ta còn yêu cầu thêm các tính chất về tính lồi của L theo biến điều khiển u. Tính lồi này, kết hợp với tính lồi của tập điều khiển U và hàm f, thường đảm bảo rằng hàm giá của bài toán cũng sẽ có tính lồi, một tính chất rất mạnh và hữu ích trong tối ưu hóa.

5.3. Khảo sát ví dụ hệ điều khiển tuyến tính và hàm chỉ phí cuối lồi

Một ví dụ quan trọng được khảo sát trong luận văn là hệ thống tuyến tính y' = Ay + Bu với tập điều khiển U lồi và compact, hàm chi phí cuối gchỉ phí điều hành L đều lồi. Trong trường hợp này, có thể chứng minh được rằng hàm giá V(t,·) là một hàm lồi với mọi t. Tính lồi của hàm giá là một kết quả rất đẹp, vì nó ngụ ý rằng bài toán tối ưu hóa có cấu trúc tốt. Hơn nữa, trong trường hợp này, hàm giá không chỉ nửa lõm mà còn nửa lồi, và nếu các hàm gL đủ trơn, có thể dẫn đến các phương trình Riccati, một công cụ cơ bản trong lý thuyết điều khiển tuyến tính-bậc hai (LQ).

VI. Kết luận về ý nghĩa và đóng góp của luận văn thạc sĩ toán học

Công trình nghiên cứu "Nghiệm viscosity đối với bài toán điều khiển tối ưu" đã thành công trong việc trình bày một cách hệ thống và chặt chẽ một trong những lý thuyết hiện đại và mạnh mẽ nhất để giải quyết các bài toán điều khiển tối ưu. Bằng cách đặt hàm giá vào trung tâm và phân tích nó như một nghiệm viscosity của phương trình Hamilton-Jacobi, luận văn đã làm sáng tỏ các tính chất chính quy quan trọng như tính liên tục Lipschitz và tính nửa lõm. Đặc biệt, việc liên kết tường minh lý thuyết này với nguyên lý cực đại Pontryagin đã tạo ra một cầu nối vững chắc giữa hai trường phái lớn trong lĩnh vực. Những kết quả này không chỉ có ý nghĩa lý thuyết sâu sắc mà còn cung cấp nền tảng vững chắc cho việc phân tích và giải quyết các bài toán ứng dụng phức tạp trong tương lai.

6.1. Tóm tắt những đóng góp chính của công trình nghiên cứu

Luận văn có những đóng góp chính sau: (1) Hệ thống hóa các kiến thức nền tảng về nghiệm viscosity và các khái niệm liên quan như hàm nửa lõm, vi phân trênvi phân dưới. (2) Áp dụng thành công lý thuyết nghiệm viscosity để chứng minh sự tồn tại, duy nhất và các tính chất chính quy của hàm giá cho bài toán Mayerbài toán Bolza. (3) Thiết lập một cách chặt chẽ mối quan hệ giữa cung đối ngẫu p(t) trong nguyên lý Pontryagin và vi phân trên D*V(t,y(t)) của hàm giá. (4) Phân tích điều kiện khả vi của hàm giá thông qua tính duy nhất của quỹ đạo tối ưu, cung cấp một góc nhìn sâu sắc về cấu trúc của tập hợp lời giải.

6.2. Hướng phát triển tương lai cho lý thuyết nghiệm viscosity

Lý thuyết nghiệm viscosity cho các bài toán điều khiển tối ưu vẫn là một lĩnh vực nghiên cứu rất sôi động. Các hướng phát triển trong tương lai có thể bao gồm: (1) Mở rộng lý thuyết cho các bài toán có ràng buộc trạng thái (state constraints), nơi hàm giá có thể không liên tục. (2) Nghiên cứu các bài toán điều khiển ngẫu nhiên, dẫn đến các phương trình Hamilton-Jacobi-Bellman ngẫu nhiên cấp hai. (3) Phát triển các thuật toán số hiệu quả dựa trên lý thuyết nghiệm viscosity để giải các phương trình HJB trong không gian nhiều chiều, đây vẫn là một thách thức lớn. (4) Ứng dụng vào các mô hình phức tạp hơn trong kinh tế lượng, tài chính toán, và các hệ thống nhiều tác tử (multi-agent systems).

27/07/2025
Luận văn thạc sĩ toán học nghiệm viscosity đối với bài toán điều khiển tối ưu