điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (818.05 KB, 60 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA QUỐC TẾ & ĐÀO TẠO SAU ĐẠI HỌC
  
MÔN HỌC: KỸ THUẬT TỐI ƯU
CHUYÊN ĐỀ:
ĐIỀU KHIỂN LUỒNG THÔNG MINH THEO KHUÔN KHỔ LÝ THUYẾT TRÒ
CHƠI
GVHD: TS. Lê Nhật Thăng
HV:
Lớp: M11CQCK01-B
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 2
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 3
MỤC LỤC
MỤC LỤC 3
MỞ ĐẦU 13
Sự phức tạp trong phạm vi rộng lớn của các mạng viễn thông hiện đại ngày nay cung cấp cho chúng ta
nhiều thách thức cũng như những cơ hội mới. Trong chương này, chủ yếu chúng ta tập chung vào những
thách thức liên quan tới việc tối ưu hóa trong mạng viễn thông 15
Vậy tối ưu hóa mạng viễn thông là gì? 15
Đó là việc tìm ra phương pháp “tốt nhất” trong các phương pháp có thể giải quyết được bài toán. Ví dụ,
có một số phương pháp để thiết kế cấu trúc liên kết của mạng dữ liệu khu vực cho một công ty lớn. Làm
thế nào để tìm ra một phương pháp đặc biệt tốt trong tất cả các phương pháp trên? ví dụ khác là làm thế
nào tìm ra cách tốt nhất để gán các kênh tần số cho người dùng trong mạng di động. Tuy rằng mỗi
phương pháp đều có hạn chế nhưng cuối cùng chúng ta vẫn sẽ tìm ra một phương pháp “tốt nhất” 15
Đặc biệt, có một số các công nghệ phần mềm mới được nhắm vào các giải pháp tối ưu hóa hiện đang
được sử dụng trong các ngành công nghiệp, có tiềm năng và hiệu quả rất lớn giải quyết nhiều vấn đề
trong ngành viễn thông. Các kỹ thuật sử dụng bao gồm các phương pháp tìm kiếm cục bộ như mô phỏng
luyện kim (Aarts and Korst, 1989), tìm kiếm tabu (Glover, 1989; 1989a), các kỹ thuật tìm kiếm
‘population-based’ như thuật toán di truyền (Holland, 1975; Goldberg, 1989), quá trình tiến hóa chiến
lược (Schwefel, 1981; Back, 1996), lập trình tiến hóa (Fogel, 1995), lập trình di truyền (Koza, 1992).
Chúng ta sẽ tìm hiểu lần lượt qua những chủ đề này ở các phần dưới của chương này 15

II. VẤN ĐỀ ĐỘNG VÀ SỰ THÍCH ỨNG 15
Một khía cạnh cơ bản của các bài toán tối ưu hóa trong ngành viễn thông trên thực tế rất năng động.
Điều có thể là giải pháp tốt nhất bây giờ nhưng không thể là giải pháp lý tưởng trong một vài giờ, hoặc
thậm chí một vài phút. Ví dụ: các nhà cung cấp của một dịch vụ cơ sở dữ liệu phân tán cố gắng đảm bảo
chất lượng tốt các dịch vụ cho mỗi khách hàng. Thực hiện chuyển hướng truy cập cơ sở dữ liệu của
khách hàng đến các máy chủ khác nhau tại các thời điểm khác nhau để thích hợp cân bằng tải giữa các
máy chủ. Kỹ thuật tối ưu hóa hiện đại có thể được sử dụng để phân phối tải trọng một cách thích hợp
trên các máy chủ, tuy nhiên giải pháp này trở nên không hợp lệ ngay sau khi có sự thay đổi vừa phải
trong mô hình truy cập cơ sở dữ liệu của khách hàng. 15
Một ví dụ khác là định tuyến gói chung trong một mạng lưới rộng lớn điểm-điểm cơ bản. Theo truyền
thống, các bảng định tuyến tại mỗi nút được sử dụng để tìm hop tiếp theo là tốt nhất cho một gói tin
dựa vào điểm đến cuối cùng của nó. Chúng ta có thể tưởng tượng một kỹ thuật tối ưu hóa áp dụng cho
vấn đề này, như việc nhìn vào các mô hình giao thông tổng thể để xác định các bảng định tuyến thích
hợp cho mỗi nút, vì vậy mà sự tắc nghẽn và sự chậm trễ có thể được giảm thiểu 16
Chạy lặp các các kỹ thuật tối ưu hóa là một trong những cách có thể để tiếp cận vấn đề năng động,
nhưng nó là một cách không thích hợp cho lắm khi giải pháp tốt cần nắm bắt rất nhanh, khi môi trường
thay đổi rất nhanh chóng. Thay vào đó, một phạm vi khác của kỹ thuật tính toán hiện đại thường thích
hợp cho các vấn đề như vậy. Chúng ta gọi kỹ thuật này là kỹ thuật thích ứng. 16
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 4
Một loạt các phương pháp nổi tiếng trong lĩnh vực nghiên cứu tối ưu hoá, như lập trình động, lập trình
số nguyên, dó là các phương pháp truyền thống được sử dụng để giải quyết các loại khác nhau của các
vấn đề tối ưu hóa. Tuy nhiên, một cộng đồng lớn gồm các nhà khoa học máy tính và các nhà nghiên cứu
trí tuệ nhân tạo đã dành rất nhiều nỗ lực đưa ra thành những ý tưởng hiện đại được gọi là
"metaheuristics" hoặc "heuristic ". Sự khác biệt cơ bản của phương pháp hiện đại là dễ dàng được áp
dụng hơn so với các phương pháp cổ điển 16
Đó không thể nói là phương pháp hiện đại tốt hơn phương pháp cổ điển mà phải tùy theo các trường
hợp mà có thể áp dụng cả hai phương pháp: 16
• Một chuyên gia metaheuristics so sánh hai loại kỹ thuật: các phương pháp hiện đại nhanh hơn so với
phương pháp cổ điển 16
• Một chuyên gia nghiên cứu hoạt động phương pháp cổ điển so sánh hai loại kỹ thuật: các phương pháp

cổ điển tốt hơn các phương pháp hiện đại 16
Quan sát này được dựa trên một khía cạnh quan trọng của việc giải quyết vấn đề tối ưu hóa. Bạn càng
biết về một kỹ thuật đặc biệt mà bạn đang áp dụng, có thể sẽ tốt hơn khi bạn điều chỉnh và khai thác
bằng cách khác nó để có được kết quả tốt nhất. 17
Trong phần này chúng ta chỉ cung cấp cơ sở chi tiết của một vài thuật toán tối ưu hiện đại, không đưa ra
thông tin đầy đủ đề giải các bài toán cụ thể. Các kỹ thuật chủ yếu rơi vào hai nhóm: tìm kiếm cục bộ và
tìm kiếm dựa trên quần thể 17
Hãy tưởng tượng bạn đang cố gắng để giải quyết một vấn đề P, và bạn có một tập lớn S các giải pháp
tiềm năng cho vấn đề này. Bạn không thực sự có tập hợp S, vì nó là quá lớn để liệt kê đầy đủ. Tuy nhiên,
bạn có một số cách tạo ra các giải pháp từ nó. Ví dụ, S có thể là một tập hợp các kết nối cấu trúc liên kết
cho một mạng, ứng cử viên của giải pháp là s, s', s", và như vậy, là ứng cử viên cụ thể cấu trúc liên kết mà
bạn đã đưa ra bằng cách nào đó. Ngoài ra, hãy tưởng tượng rằng bạn có hàm chức năng f(s) cho một số
điểm, đưa ra một ứng cử viên giải pháp. Các số điểm, các giải pháp tốt hơn. Ví dụ, nếu chúng ta cố gắng
để tìm thấy các cấu trúc liên kết mạng đáng tin cậy nhất, sau đó f(s) có thể tính toán xác suất của liên kết
thất bại giữa hai nút đặc biệt quan trọng 17
Dưới đây chúng tôisẽ mô tả cơ bản tìm kiếm cục bộ. Trước khi tìm hiểu về chúng thì ta hãy xem xét một
trong những phương pháp tìm kiếm đơn giản cục bộ, được gọi là hillclimbing (leo núi), theo các bước
dưới đây: 17
Bước 1(Bắt đầu): tạo ra một giải pháp, ứng cử viên ban đầu (có lẽ là ngẫu nhiên); gọi giải pháp này là giải
pháp hiện hành c, Đánh giá c 17
Bước 2: Biến đổi c để tạo ra một m đột biến, và đánh giá các m 17
Bước 3: Nếu hàm f(m) là tốt hơn hoặc bằng với hàm f(c), thì ta thay thế c bởi m (tức là c bây giờ là một
bản sao của m) 17
Bước 4:Đến khi đạt được một tiêu chuẩn thì ta kế thúc kết thúc, sau đó quay trở về bước 2 17
Bây giờ chúng ta sẽ đi tìm hiểu qua các thuật toán cục bộ chính: 17
Phương pháp luyện thép giống như phương pháp leo đồi (hillclimbing). Sự khác biệt chỉ là ở việc nó dùng
một cặp thông số, thêm vào bước 1 và ở điểm chính trong bước 3chúng được thay đổi việc sử dụng các
tham số: 18
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 5
Bắt đầu: Tạo và đánh giá một giải pháp ban đầu (có lẽ là ngẫu nhiên); gọi là giải pháp hiện hành c, tham

số nhiệt độ khởi tạo T, độ làm mát r (0 <r <1) 18
Thuật toán bao gồm 4 bước chính như sau: 18
Bước 1: Biến đổi c để tạo ra một m đột biến, đánh giá m 18
Bước 2: Nếu hàm test(f(m), f(c), T) đánh giá đúng sự thật, thì thay thế c bởi m(Ví dụ: c bây giờ là một bản
sao của m) 18
Bước 3: Cập nhật các thông số nhiệt độ (ví dụ như T trở thành rT) 18
Bước 4:Khi đạt được tiêu chí thì dừng sau đó trở về bước 2 18
Câu hỏi đặt ra là liệu điều gì sẽ xảy ra trong quá trình mô phỏng luyện kim khi chúng ta cho phép có sự
biến đổi(ngay cả khi giải pháp đó không tốt hơn các giải pháp hiện hành). Chúng ta sẽkhông thực hiện
điều này bới có ít có khả năng để thực hiện nếu như đột biến như thế xảy ra. Thuật toán có hiệu quả
toàn cục, có cơ hội tốt thoát khỏi cục bộ tối ưu, do đó có thể tìm kiếm các khu vực tốt hơn của các không
gian sau. Điều cơ bản là phải hướng đến các vùng tốt hơn. Điều này được thể hiện ở hàm test trong bước
3 18
Ví dụ một hàm test được thực hiện như sau: e( f (m)-f (c))/T 18
Giả định là chúng ta đang cố gắng để tối đa hóa chi phí (Nếu không chỉ cần chuyển đổi hai hàm f(m) và
f(c)). Nếu như giải pháp biến đổi tốt hơn hoặc bằng giải pháp hiện hành, biểu thức trên sẽ lớn hơn hoặc
bằng 1. Nếu biến đổi không tốt thì kết quả sẽ nhỏ hơn 1, và biến đổi không tốt hơn sẽ gần đến 0. Do đó,
kết quả củabiểu thức này được sử dụng như xác suất. Một số ngẫu nhiên được tạo ra(rand), 0 < rand <
1, test ở bước 3 sẽ kiểm tra biểu thức trên nhỏ hơn hoặc bằng rand (chúng ta chấp nhận biến đổi). T là
tham số "nhiệt độ". Nó bắt đầu tăng cao và giảm dần (xem bước 4) với thời gian. Như ta có thể cho biết
từ biểu thức trên, điều này có nghĩa là xác suất chấp nhận đột biến tồi tệ hơn cũng sẽ giảm theo thời
gian. Chính bởi thế mà mô phỏng luyện kim là phương pháp rất mạnh, mặc dù khá khó khăn để có được
các thông số đúng (xem thêm Dowsland (1995)) 18
Một cách khác để thực hiện việc tối ưu cục bộ được cung cấp bởi công cụ tìm kiếm Tabu (Glover năm
1989; 1989a; Glover và Laguna, 1997). Có rất nhiều khía cạnh tinh tế để tìm kiếm Tabu, ở đây chúng tôi
sẽ chỉ ra một số điểm thiết yếu về kỹ thuật. Một giới thiệu rõ ràng và đầy đủ được cung cấp trong Glover
và Laguna (1995, 1997). Trong chương sau chúng ta sẽ đi chi tiết vào kỹ thuật tìm kiếm này nhiều hơn
cũng như các ứng dụng của nó 19
Tìm kiếm Tabu cũng giống như một số phương pháp tìm kiếm cục bộ khác mà chúng ta không thảo luận
ở đây, chủ yếu chúng xem xét một số lân cận của một giải pháp hiện tại và cuối cùng để chọn hướng di

chuyến đến.Các tính năng phân biệt của tìm kiếm Tabu là làm thế nào lựa chọn được việc thực hiện này.
19
Chú ý tìm kiếm Tabukhông phải là chỉ đơn giản là một vấn đề của việc lựa chọn các lân cận của những
thử nghiệm thích hợp nhất.Tìm kiếm Tabu cũng sẽ đưa bạn vào một tài khoản và tập các đột biến. Ví dụ,
nếu vị trí lân cận tốt nhất của giải pháp hiện tại của bạn là có thể đạt được bằng cách thay đổi đầu kia
của một liên kết đang nổi lên từ nút k, nhưng chúng tôi một động thái đã được thực hiên gần đây như
vậy trong một phiên trước đó, sau đó một người hàng xóm khác nhau có thể là lựa chọn thay thế. Sau
đó, một lần nữa, ngay cả khi di chuyển tốt nhất hiện nay là của một loại đã được sử dụng gần đây, và
thường là không được phép (tức là coi là "điều Tabu '), tìm kiếm Tabu cung cấp một cơ chế dựa trên tiêu
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 6
chuẩn nguyện vọng, mà sẽ cho phép chúng ta lựa chọn mà nếu những lân cận trong câu hỏi là đủ tốt hơn
so với các giải pháp hiện tại (nói tới) 19
Do đó bất kỳ thực hiện tìm kiếm Tabu nào duy trì một số hình thức của bộ nhớ, ghi lại các thuộc tính
nhất định của động thái gần đây.Những thuộc tính này phụ thuộc nhiều vào vấn đề, và điều này là một
phần của nghệ thuật ứng dụng tìm kiếm Tabu. 19
Ví dụ, nếu chúng ta đang cố gắng để tối ưu hóa một cấu trúc liên kết mạng, một loại đột biến của nhà
điều hành sẽ làm thay đổi các hệ thống cáp liên kết với các liên kết giữa các nút 1 và b. Trong thực hiện
tìm kiếm Tabu của chúng ta, chúng ta có lẽ sẽ ghi lại chỉ có một thực tế rằng chúng ta đã di chuyển một
thay đổi hệ thống cáp 'lặp đi lặp lại tôi, hoặc nếu không, chúng ta có thể hoặc bổ sung, chỉ cần ghi lại
thực tế rằng chúng ta đã thực hiện một thay đổi kết hợp với một nút và khác liên kết với nút b. Nếu
chúng ta chỉ ghi lại các loại cũ của thuộc tính, sau đó trong tương lai gần có thể thay đổi hệ thống cáp, di
chuyển sẽ không được phép, độc lập với những gì các nút đã được tham gia.Nếu chúng ta ghi nhận chỉ có
các loại sau của thuộc tính, sau đó gần như thay đổi tiềm năng trong tương lai liên quan đến a / và b có
thể là không được phép, nhưng thay đổi hệ thống cáp, di chuyển, cho mỗi gia nhập sẽ được chấp nhận.
19
Ghi chú ngắn gọn của chúng tôi về loại tìm kiếm mô phòng và Tabu minh họa rằng các khía cạnh quan
trọng của một phương pháp tìm kiếm cục bộ tốt là quyết định mà người hàng xóm để di chuyển đến. Tất
cả các phương pháp tìm kiếm cục bộ sử dụng các ý tưởng cơ bản mà di chuyển cục bộ gần như luôn luôn
là một ý tưởng tốt, tức là nếu bạn có một giải pháp tốt hiện nay, có thể là một một tốt hơn gần đó, và có
thể dẫn đến những cái tốt hơn, và vv. Tuy nhiên, nó cũng rõ ràng mà đôi khi, có lẽ thường, chúng ta phải

chấp nhận thực tế rằng chúng ta chỉ có thể tìm thấy các cải thiện các giải pháp hiện tại bằng cách tạm
thời chúng ta hy vọng di chuyển đến những người tồi tệ hơn. Mô phỏng luyện kim và tìm kiếm Tabu là
hai cách tiếp cận chính để đối phó với vấn đề này. Thật không may, tuy nhiên, nó gần như là không bao
giờ rõ ràng, đưa ra một vấn đề cụ thể, cách tốt nhất để thiết kế và thực hiện phương pháp là gì. Có nhiều
sự lựa chọn để thực hiện, đầu tiên là quyết định làm thế nào để đại diện cho một giải pháp ứng cử viên ở
nơi đầu tiên 20
Ví dụ, một cấu trúc liên kết mạng có thể được biểu diễn như là một danh sách các liên kết, nơi mà mỗi
liên kết là một cặp của các nút (a, b). Giải mã một danh sách vào một cấu trúc liên kết mạng chỉ đơn giản
là số tiền để vẽ một liên kết điểm-điểm cho mỗi cặp nút trong danh sách. Ngoài ra, chúng ta có thể đại
diện cho một cấu trúc liên kết mạng như là một chuỗi nhị phân, có chứa nhiều bit như là các liên kết có
thể. EAC h vị trí trong chuỗi bit sẽ giới thiệu cụ thể một liên kết điểm-điểm tiềm năng, Vì vậy, một giải
pháp candidiate như '10010'chỉ ra rằng có một liên kết điểm-điểm giữa các nút 1 và 2, không có giữacác
nút 1 và 3, 1 và 4, nhưng có một trong giữa nút 1 và 5, và vv… Nói chung, có rất nhiều cách sáng tạo ra
một phương pháp để đại diện cho các giải pháp cho một vấn đề. Sự lựa chọntất nhiêncũng ảnh hưởng
đến thiết kế của các nhà khai thác khu vực. 20
Trong ví dụ trên việc loại bỏ một liên kết từ cấu trúc liên kết liên quan đến hai loại khác nhau của hoạt
động trong hai đại diện. Trong trường hợp danh sách các node đôi, chúng ta cần phải thực sự loại bỏ một
cặp từ danh sách. Trong trường hợp nhị phân, chúng ta thay đổi một 1 đến 0 trong một vị trí đặc biệt
trong chuỗi. Xây dựng các cơ quan đại diện và các nhà khai thác là một phần của nghệ thuật sử dụng
hiệu quả tìm kiếm cục bộ để giải quyết các vấn đề tối ưu hóa cứng. Một phần quan trọng của nghệ thuật
này, tuy nhiên, là sử dụng kiến thức vấn đề cụ thể hoặc chẩn đoán hiện tại nơi có thể 21
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 7
Ví dụ, một vấn đề với một trong hai đại diện chúng tôi đã ghi nhận cho đến nay mạng lưới cấu trúc liên
kết là một ngẫu nhiên tạo ra điển hình cấu trúc liên kết cũng có thể là không có liên quan. Đó là, một giải
pháp ứng cử viên có thể chỉ đơn giản là không có đường dẫn giữa mỗi cặp của các nút. Thông thường,
chúng ta sẽ chỉ quan tâm đến mạng lưới kết nối, vì vậy bất kỳ nỗ lực tìm kiếm thuật toán chi tiêu trong
kết nối với mạng không có liên quan đánh giá có vẻ khá lãng phí. Đây là nơi mà kiến thức cơ bản miền và
chẩn đoán hiện tại sẽ đến trong hữu ích 21
Đầu tiên, bất kỳ nhà thiết kế mạng lưới tốt sẽ biết về các khái niệm lý thuyết đồ thị khác nhau, chẳng hạn
như cây kéo dài, hortest các thuật toán tìm đường, và vv. Nó không phải là khó khăn để đưa ra một thay

đổi danh sách các đại diện nút đôi, đảm bảo rằng tất cả các giải pháp ứng cử viên có chứa một cây bao
trùm cho mạng, và do đó hiện đang kết nối. Một cách để làm điều này là liên quan đến việc giải thích đầu
tiên cặp node gián tiếp. Thay vì (a, b) chỉ ra rằng mạng lưới này có chứa một liên kết giữa a và b, nó thay
vào đó sẽ có nghĩa là nút ATH kết nối sẽ được kết nối với các nút không có liên quan BTH. Bằng cách này,
mỗi cặp nút tiếp theo cho thấy làm thế nào để tham gia vào một nút như được nêu ra không sử dụng
một cây trải rộng đang phát triển. Khi tất cả các nút được kết nối như vậy, còn lại nút cặp có thể được
giải thích trực tiếp 21
Vấn đề còn tốt hơn nữa là chúng ta có thể có địa chỉ có thể sẽ liên quan đến vấn đề chi phí, và chi phí của
các liên kết cụ thể sẽ đóng một vai trò quan trọng trong chức năng hoặc trung tâm. Sau đó cho chúng ta
biết rằng một số thuật toán cũng được biết đến và nhanh chóng thoát ra mà tìm thấy một cây minmal đề
cập tới vấn đề chi phí kéo dài (Kruskal, 1956; Prim, 1957). Vì vậy, để tốt hơn là tùy thuộc vào các chi tiết
khác nhau của vấn đề trong tay ta có, để khởi tạo mỗi giải pháp ứng cử viên với một cây chi phí tối thiểu,
và tất cả những gì chúng ta cần để đại diện cho các liên kết mà chúng ta thêm lên cây này 21
Có một số cách khác trong lĩnh vực kiến thức hoặc chẩn đoán hiện tại có thể được sử dụng để hưởng lợi
một cách tiếp cận tìm kiếm cục bộ cho một vấn đề tối ưu hóa. Một cái gì đó về vấn đề này có thể cho
chúng ta biết, ví dụ như là những loại đột biến có một cơ hội tốt hơn dẫn đến lân cận tốt. Một phương
pháp khám phá hiện có, nhanh chóng phân công các kênh trong một mạng lưới điện thoại di động, có
thể được sử dụng để cung cấp điểm khởi đầu cho một tìm kiếm cục bộ cố gắng tìm giải pháp tốt hơn 22
Đây là một phương cách của thuật toán thay thế, bây giờ trở nên rất phổ biến, được xây dựng trên ý
tưởng tìm kiếm địa phương bằng cách sử dụng quần thể. Có hai phương cách để tăng cường các cơ hội
của việc tìm kiếm giải pháp tốt. Đầu tiên, kể từ khi chúng tôi có một quần thể, chúng ta có thể dành
nhiều thời gian tìm kiếm trong các khu vực khác nhau cùng một lúc. Một thuật toán dựa trên quần thể có
xu hướng chia sẻ các nỗ lực tính toán đến các giải pháp ứng cử khác nhau . Một phần thời gian sẽ được
chi tiêu tìm kiếm trong khu vực của các giải pháp trung bình và điều này sẽ dẫn đến việc tìm kiếm được
đột biến đặc biệt , sau đó cân bằng tải nỗ lực tính toán sẽ được sửa đổi phù hợp. 22
Một cơ hội khác được cung cấp bởi các kỹ thuật dựa trên quần thể là chúng ta có thể thử vận hành tái tổ
hợp. Đây là những cách sản xuất đột biến, nhưng lần này từ hai hay nhiều giải pháp, chứ không phải chỉ
một. Do đó kết quả có thể được gọi là tái tổ hợp, chứ không phải là một đột biến. Tái tổ hợp là một
phương pháp cung cấp một cách lựa chọn tốt trong không gian rộng lớn của khả năng. 22
Ví dụ, nếu hai giải pháp cha mẹ là mỗi một vector của các yếu tố k, một nhà điều hành tái tổ hợp được

gọi là thống nhất chéo sẽ xây dựng một trẻ em từ cha mẹ, cho mỗi phần tử lần lượt, ngẫu nhiên giá trị
của nó từ một trong hai nơi. Đứa trẻ có thể có được 50% khác nhau từ mỗi cha mẹ của nó. 22
Dưới đây là các bước cho một thuật toán dựa trên quần thể chung 22
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 8
Bước 1(Bắt đầu): tạo ra một kế cận ban đầu của các giải pháp ứng cử viên. Đánh giá mỗi người trong số
họ 23
Bước 2: Chọn một số dân là cha mẹ 23
Bước 3: Áp dụng các nhà khai thác tái tổ hợp và đột biến để các bậc cha mẹ để sản xuất một số trẻ em.
23
Bước 4: Kết hợp các trẻ em vào kế cận 23
Bước 5: Cho đến khi đạt được một tiêu chí chấm dứt, trở về bước 2 23
Đặc điểm của các bước cụ thể như sau: 23
Bước 2: thường sử dụng một sự tồn tại của các fittest chiến lược, đây là nơi mà tải chia sẻ, thảo luận ở
trên đi vào chơi. Fitter một giải pháp ứng cử viên, cơ hội nhiều hơn nó có là một người mẹ, và do đó cơ
hội có được rằng các thuật toán sẽ khám phá các vùng lân cận. Có một số lựa chọn kỹ thuật khác nhau,
hầu hết trong số đó có thể được parameterised để làm thay đổi mức độ mà cha mẹ fitter được ưa thích
(áp lực chọn lọc). 23
Bước 3 áp dụng hoặc tái tổ hợp hoặc điều hành đột biến, hoặc cả hai.Có tất cả các loại tiêu chuẩn vận
hành tái tổ hợp và đột biến, nhưng - như chúng tôi gợi ý ở trên - các lợi ích thực sự đến khi nghĩ rằng một
số đã được đưa vào thiết kế các loại cụ thể của các nhà điều hành bằng cách sử dụng kiến thức miền. . 23
Bước 4: chúng ta đang gần như luôn luôn duy trì một quy mô kế cận cố định. Vì vậy, nếu chúng ta có một
kế cận 100, nhưng 20 trẻ em để kết hợp, sau đó 20 những 120 phải được loại bỏ. Một cách tiếp cận
chung là chỉ cần loại bỏ ít nhất 20 phù hợp với các nhóm kết hợp, nhưng có một vài cách tiếp cận khác,
chúng tôi có thể sử dụng một kỹ thuật gọi là "tràn ngập", ví dụ như De Jong (1975), trong đó đa dạng
đóng một vai trò quan trọng trong các quyết định về những gì các giải pháp ứng cử viên để loại bỏ 23
Ví dụ, chúng tôi chắc chắn sẽ thích để loại bỏ giải pháp trong lợi của một t giải pháp phù hợp không, nếu
nó xảy ra là trường hợp đó đã có một bản sao trong kế cận, nhưng t là 'mới'. 23
Bước 5: chúng ta nên chỉ ra một số vấn đề thuật ngữ. Có những thuật toán dựa trên kế cận nhiều, và
trong thực tế, họ thường được gọi là thuật toán tiến hóa (địa bàn) 23
Một thuật ngữ phổ biến khác sử dụng thuật toán di truyền, đó đúng là một gia đình của các phương

pháp như vậy mà luôn luôn sử dụng một nhà điều hành tái tổ hợp (Hà Lan, năm 1965, Goldberg, năm
1989), trong khi các tổ chức khác của các thuật toán gọi là tiến hóa lập trình (Fogel, 1995) và sự tiến
hóachiến lược (Quay lui, năm 1996), xu hướng sử dụng đột biến, nhưng được bỏ eclever về cách họ sử
dụng nó. Trong mọi trường hợp, một giải pháp ứng cử viên có xu hướng được gọi là nhiễm sắc thể và các
yếu tố của nó được gọi là gen 23
Để giải quyết nhu cầu tối ưu hóa vốn có của môi trường viễn thông, việc trực tiếp sử dụng các kỹ thuật
tối ưu hóa địa phương hoặc dân số dựa trên đôi khi có thể là khá phù hợp. Bởi vì nó có thể mất quá lâu
để đưa một giải pháp tốt, và như vậy từ thời gian đến giải pháp, vấn đề đã được thay đổi ! 24
Những gì chúng ta cần thay vì trong bối cảnh này là một cách để đưa ra quyết định rất nhanh, nhưng rất
tốt,. Ví dụ, để quyết định những bước nhảy tiếp theo tốt nhất là cho một gói tin đến một nút đích d,
chúng ta có lẽ có thể chạy một mô phỏng của các mạng cho các mô hình tầng vận chuyểnhiện hành hiện
nay và ước tính thời gian đến khả năng ở các điểm đến cho cho có thể bước nhảy tiếp theo. Kết quả mô
phỏng như vậy sẽ cung cấp cho chúng tôi với một sự lựa chọn đầy đủ thông tin, và sau đó chúng tôi có
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 9
thể gửi các gói dữ liệu một cách thích hợp trên con đường của nó. Bây giờ, nếu chúng tôi có thể ở trên
trong một vài micro giây, chúng ta sẽ có một chiến lược định tuyến gói tin phù hợp và rất có lợi nhuận. 24
Tuy nhiên, kể từ khi nó có thể sẽ mất vài giờ để làm một mô phỏng chính xác bằng cách sử dụng các loại
sức mạnh xử lý và bộ nhớ thường có sẵn các thiết bị chuyển mạch mạng, trong thực tế nó là một ý tưởng
vô lý! Thay vào đó, chúng tôi cần một số cách làm cho quyết định đúng đắn một cách nhanh chóng,
nhưng quyết định bằng cách nào đó sẽ đưa vào tài khoản các trường hợp hiện hành. Lý tưởng nhất,
chúng tôi đang tìm kiếm một 'hộp đen', khi cho ăn với một câu hỏi và một số chỉ tiêu môi trường, cung
cấp một câu trả lời hợp lý và ngay lập tức. Một ví dụ của một hộp đen như là một bảng định tuyến của
các loại thường thấy trong các mạng chuyển mạch gói. Câu hỏi được hỏi bởi một gói tin truyền thông là:
cuối cùng tôi muốn để có được d, vì vậy mà tôi nên đi tiếp theo? Bảng định tuyến, thông qua một tra cứu
đơn giản được lập chỉ mục của d, rất nhanh chóng cung cấp một câu trả lời và gửi nó theo cách của mình.
24
Những rắc rối với điều này, tất nhiên, là nó về cơ bản là không thích nghi. Trừ khi các giao thức quản lý
mạng tiên tiến nhất định trong hoạt động, bảng định tuyến sẽ luôn luôn cung cấp cho các câu trả lời
tương tự, ngay cả khi các liên kết trở đi từ hop tiếp theo đề nghị d được rất nhiều tắc nghẽn tại thời
điểm này. Hộp đen của chúng tôi do đó thường được thay đổi bằng cách nào đó, và thích nghivới điều

kiện hiện hành. Trong thực tế, chương tám và chín cả hai thảo luận về cách làm điều này liên quan đến
các bảng định tuyến trong các mạng chuyển mạch gói 25
Vì vậy, kỹ thuật thích nghi trong bối cảnh viễn thông có xu hướng liên quan đến các hộp đen, hoặc các
mô hình, bằng cách nào đó tìm hiểu và thích nghivới 'offline' nhưng có thể phản ứng rất nhanh chóng và
thích hợp khi được hỏi về quyết định. Trong một số chương có liên quan đến thích ứng, các kỹ thuật sử
dụng chúng tôi đã thảo luận đã có trong mục 1.3, nhưng thay đổi một cách thích hợp trong ánh sáng của
sự cần thiết phải quyết định nhanh chóng. Mặc dù, trong những người khác, một số các kỹ thuật hiện đại
quan trọng được tuyển dụng, mà bây giờ chúng ta sẽ một thời gian ngắn giới thiệu. Đây là những trung
tâm tính toán, logic mờ và lý thuyết trò chơi. Vai trò của trung tâm tính toán trong bối cảnh này là để
phát triển một diễn đàn mô hình, mà học(ví dụ) làm thế nào để làm cho các quyết định đúng đắn trong
các bộ khác nhau của hoàn cảnh. Kết quả đào tạo mạng lưới trung tâm sau đó được sử dụng trực tuyến
như là nhà sản xuất ision tháng mười hai. Vai trò của logic mờ là cung cấp một cách sản xuất các quy tắc
mạnh mẽ đó cung cấp các quyết định. Điều này về cơ bản sản xuất một decisionmaker hộp đen, giống
như một mạng lưới trung tâm, nhưng với hoạt động nội bộ khác nhau. Cuối cùng, lý thuyết trò chơi cung
cấp một cách khác để tìm kiếm kịch bản phức tạp, mạng lưới năng động. Về cơ bản, nếu chúng ta xem
một số khía cạnh của quản lý mạng như là một 'trò chơi, một tập hợp một số phương trình và các mô
hình nổi tiếng đi vào chơi, mà lần lượt cung cấp xấp xỉ tốt với sự năng động của mạng thực sự. Do đó,
một số quyết định quản lý mạng có thể được hỗ trợ bằng cách sử dụng những phương trình này 25
Tính toán Nơ-ron (Rumelhart và MacClelland năm 1989; Haykin năm 1998) cơ bản là một phân loại mô
hình kỹ thuật, nhưng với khả năng ứng dụng rộng rãi bao la hơn cho thấy ngay từ cái nhìn đầu tiên. Sức
mạnh thực sự của phương pháp này nằm trong thực tế là chúng tôi không cần phải biết làm thế nào để
phân biệt một loại mô hình khác. Để xây dựng một hệ thống dựa trên nguyên tắc chuyên gia cổ điển cho
các mô hình phân biệt, ví dụ, chúng tôi rõ ràng sẽ cần để có được các quy tắc, và xây dựng chúng vào hệ
thống. Nếu chúng ta sử dụng tính toán trung tâm, tuy nhiên, một dạng đặc biệt của hộp đen được gọi là
một mạng trung tâm cơ bản sẽ tìm hiểu các quy tắc cơ bản của ví dụ. Một ứng dụng điển hình của kỹ
thuật này là trong đánh giá rủi ro tín dụng 25
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 10
Các quy định mà cơ sở cho một quyết định về việc ai sẽ hay không sẽ là một rủi ro tín dụng tốt, giả sử
rằng chúng ta bỏ qua trường hợp như vậy rõ ràng là những người có tiền có thế chấp cao, nhưng lương
thấp (ieone đồng của các biên tập viên của cuốn sách này),rất phức tạp nếu thực sự họ có thể được thể

hiện ở tất cả. Chúng ta có thể đào tạo một mạng lưới trung tâm để dự đoán những rủi ro xấu, tuy nhiên,
chỉ đơn giản bằng cách cung cấp một bộ các ví dụ được biết đến, chẳng hạn như p người từ r khu vực với
tiền lương và nghề y mặc định trên một khoản vay kích thước m; q người với mức lương t Với
những thứ như p, r, s, …như đầu vào, mạng lưới trung tâm dần dần điều chỉnh trong nội bộ một cách
cuối cùng sản xuất sản lượng chính xác (dấu hiệu cho thấy khả năng mặc định cho mượn) cho mỗi người
trong số các ví dụ được đào tạo. Đáng chú ý, và rất hữu ích, sau đó chúng tôi có thể mong đợi các mạng
trung tâm để cung cấp dự đoán tốt khi cung cấp đầu vào trước đó không thấy 26
Bên trong, một mạng lưới trung tâm là một cấu trúc rất đơn giản, nó chỉ là một bộ sưu tập của các nút
với liên kết liên kết đầu vào và đầu ra, mà không xử lý đơn giản: nó cho biết thêm các con số đến thông
qua các liên kết đầu vào của nó, mỗi trọng bằng một giá trị sức mạnh liên kết với các liên kết đến thông
qua, sau đó quá trình này tổng hợp (thường là chỉ để biến đổi nó với một số giữa 0 và 1), và gửi kết quả
qua các liên kết đầu ra của nó. Mạng lưới trung tâm của cái gọi là "thức ăn về phía trước là một bộ sưu
tập của các nút, tổ chức thành các lớp. Các đầu vào vấn đề đến như là đầu vào cho mỗi lớp đầu tiên của
các nút, các kết quả đầu ra từ lớp này thức ăn vào lớp thứ hai, và như vậy, mặc dù thường chỉ có ba lớp.
26
Rõ ràng, con số đó đi ra vào cuối phụ thuộc vào những gì đến các lớp đầu vào, một cách mật thiết xác
định bởi trọng lượng vào các liên kết. Precisley các trọng lượng bị thay đổi dần dần trong một thời trang
nguyên tắc của quá trình đào tạo. Cổ điển, điều này là một phương pháp gọi là backpropagation
(Rumelhart và MacClelland, 1989), nhưng có nhiều phiên bản hiện đại. Thật vậy, các loại của mạng chúng
tôi đã mô tả ngắn gọn ở đây chỉ là một trong nhiều loại có sẵn (Haykin, 1999) 26
Trong một số trường hợp, chúng ta có thể nghĩ ra các quy tắc ban đầu cho miền vấn đề của chúng ta. Ví
dụ, nếu giao thông là nặng, sử dụng nút a, và nếu giao thông là rất nặng nề, sử dụng nút b. Tuy nhiên,
quy định như vậy không phải là rất hữu ích mà không có một cách tốt để quyết định những gì nặng
"hoặc" rất nặng "thực sự có nghĩa là sử dụng liên kết, ví dụ. Trong một phương pháp tiếp cận hệ thống
cổ điển chuyên gia, chúng tôi sẽ áp dụng ngưỡng xác định trước cho những ngôn ngữ "biến" cái gọi là, và
quyết định, ví dụ, đó là giao thông là nặng "có nghĩa là việc sử dụng các liên kết trong câu hỏi là giữa 70%
và 85%. Điều này có thể có vẻ tốt đẹp, nhưng nó không phải là khó khăn để thấy rằng 69,5% sử dụng có
thể gây ra vấn đề, trong kịch bản như vậy, các quy định có điều kiện là 'giao thông vừa phải (55% đến
70%, có lẽ) sẽ được sử dụng, nhưng nó có thể có thích hợp hơn, và mang lại một kết quả tốt hơn, sử
dụng giao thông nặng 27

Logic mờ sẽ cung cấp một cách để sử dụng các biến ngôn ngữ giao dịch với các vấn đề ngưỡng một cách
rất tự nhiên và mạnh mẽ. Trong thực tế, nó gần như rids chúng ta về một nhu cầu về các ngưỡng, mọi
thứ thay vì giới thiệu được gọi là chức năng thành viên. Chúng tôi không còn có lưu lượng truy cập đó có
thể là nặng hoặc trung bình. Thay vào đó, một giá trị lưu lượng truy cập nhất định để một số mức độ
nặng, và ở một mức độ khác vừa phải. Các mức độ phụ thuộc vào các giá trị số thực tế bằng cách chức
năng thành viên, đó là "chức năng hình tam giác, thường đơn giản. Ví dụ, mức độ tầng vận chuyểnnặng
có thể là 0 từ 0% và 35% sử dụng, sau đó có thể tăng suốt 1 từ 35% và 75%, và sau đó thả trôi chảy là 0
một lần nữa giữa 75% và 90%, 0 từ đó. Chức năng thành viên cho các biến ngôn ngữ rất nặng nề sẽ
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 11
chồng chéo với điều này, vì vậy mà một giá trị lưu lượng truy cập của 82,5% có thể là "nặng" đến mức
0,5, và “rất nặng” với mức độ 0,7 27
Với điều kiện môi trường nhất định, quy tắc khác nhau do đó sẽ áp dụng cho các mức độ khác nhau. Đặc
biệt, logic mờ cung cấp nhiều cách để xác định mức độ mà các quy tắc khác nhau được áp dụng khi các
bộ phận điều kiện của các quy tắc liên quan đến một số biến ngôn ngữ. 27
Sức mạnh chính của logic mờ là chúng ta chỉ cần đảm bảo rằng các chức năng thành viên trực giác hợp lý.
Hệ thống kết quả, về sự phù hợp của quyết định cuối cùng nổi lên, có xu hướng được đánh giá cao mạnh
mẽ với sự thay đổi trong chức năng thành viên, trong giới hạn hợp lý. Chúng tôi có thể có để làm một số
công việc, tuy nhiên, trong việc xây dựng các quy tắc. Đây là nơi học tập 'offline' trong khi chúng ta đang
sử dụng logic mờ trong một môi trường thích nghi. Đôi khi, các thuật toán di truyền có thể được sử dụng
cho nhiệm vụ xây dựng một tập tốt các quy tắc 28
Các bài toán ứng dụng lý thuyết tập mờ đều không đặt ra các ràng buộc trong quá trình xây dựng hàm
thuộc, mà các tác giả xây dựng hàm thuộc một cách hoàn toàn tự do không theo một cấu trúc nào cụ
thể. Với cách tiếp cận như vậy làm mất thông tin ngữ nghĩa vì đã không tận dụng được cấu trúc ngữ
nghĩa trong miền giá trị ngôn ngữ. Chính vì vậy bài toán sẽ dẫn đến không tồn tại một giải pháp nào duy
nhất, mà nó phụ thuộc vào từng bài toán cụ thể, và phụ thuộc chủ quan vào từng tác giả. Do vậy khi xây
dựng hàm thuộc gặp rất nhiều khó khăn vì các tác giả có nhiều phương pháp tự do để lựa chọn bài toán
cụ thể, khi kiểm chứng lại kết quả không đạt họ lại phải xây dựng lại từ đầu. Để khắc phục hạn chế trên,
tác giả đề xuất xây dựng hàm thuộc tham số cho miền giá trị ngôn ngữ 28
Trong các công trình nghiên cứu về luật xấp xỉ, cơ chế suy diễn mờ hầu hết được quan tâm nghiên cứu
phát triển là mở rộng qui tắc modus kinh điển. Để góp phần nghiên cứu vào hướng này tác giả đề xuất

một phương pháp luật xấp xỉ mới sử dụng biểu diễn hàm thuộc tham số gia tử ngôn ngữ. Hiện nay có
nhiều nhà nghiên cứu đang sử dụng Đại số gia tử để khắc phục một vài nhược điểm của logic mờ. Để
hiểu thêm về Đại số gia từ bạn có thể đọc các tài liệu tiếng việt của tác giả Nguyễn Cát Hồ(do phạm vi
tiểu luận này không tập chung nhiều vào phần này nên chúng tôi không trình bày chi tiết về các lý thuyết
logic mờ cũng như giới thiệu tới Đại số gia từ) 28
Cuối cùng, lý thuyết trò chơi cung cấp một cách khác để nhìn vào các loại ertain hoàn thành, năng động,
các vấn đề liên quan đến commuications, đặc biệt là về quản lý mạng và cung cấp dịch vụ. Hãy xem xét
quá trình quyết định phức tạp liên quan đến quyết định về thuế cho các thiết lập cho kết nối cuộc gọi
hoặc cung cấp dịch vụ dữ liệu trong một môi trường mạng năng động, liên quan đến cạnh tranh với
nhiều nhà cung cấp dịch vụ khác. Theo giả định, sự năng động của mạng, bao gồm bộ nhất định, ví dụ,
hoạt động liên tục của người sử dụng chuyển đổi cho các nhà cung cấp dịch vụ khác nhau đôi khi dựa
trên mức thuế mới được quảng cáo, sẽ chịu sự tương đồng đáng kể với các mô hình khác nhau của cuộc
thi đã được phát triển trong lý thuyết sinh học, kinh tế, và các khu vực khác. Đặc biệt, phương trình nhất
định sẽ được áp dụng cho phép dự đoán xem một đề xuất mới thuế quan sẽ dẫn đến một tình hình
không ổn định (ở đâu, ví dụ, nhiều khách hàng hơn sẽ chuyển sang dịch vụ mới của bạn hơn bạn có thể
đối phó với) 28
Đặc biệt là trong các mạng trong tương lai, nhiều quyết định quản lý khá phức tạp có thể cần phải được
thực hiện một cách nhanh chóng và thường xuyên. Ví dụ, để duy trì thị phần, mức thuế mới có thể cần
phải được thiết lập theo giờ, và hoàn toàn tự động, trên cơ sở của hoạt động hiện hành về đăng ký mới,
khách hàng mất hiệu lực, và tin tức của các mức thuế mới được thiết lập bởi các nhà cung cấp dịch vụ
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 12
đối thủ. Phương pháp tiếp cận lý thuyết trò chơi được phát triển bởi một số người đóng góp vào cuốn
sách này sẽ có một vai trò lớn hơn để chơi trong các tình huống như vậy, có thể trở thành công cụ trung
tâm trong một loạt các kỹ thuật tối ưu hóa thích nghinhằm vào một số vấn đề cung cấp dịch vụ 29
Kỹ thuật chẩn đoán và thích nghi được áp dụng cho một loạt các vấn đề liên quan đến viễn thông tối ưu
hóa 29
Qua chương một chúng ta đã tìm hiểu được một số nội dung: 29
+ Các khái niệm tối ưu hóa trong viễn thông 29
+ Các vấn đề động và thích nghi 29
+ Các mô hình kỹ thuật chẩn đoán với 2 cách tìm kiếm chính: Tìm kiếm cục bộ và tìm kiếm dựa trên quần

thể 29
+ Kỹ thuật tính toán thích nghi giúp ta làm quen với 3 phương pháp tính toán:tính toán Nơ-ron, Logic mờ
và lý thuyết trò chơi 29
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 13
MỞ ĐẦU
Trong những năm gần đây, luồng điều khiển và quản lý mạng trong các mạng tốc
độ cao đã thu hút được sự chú ý nhiều bởi các nhà nghiên cứu trong lĩnh vực viễn thông.
Trong các môi trường mạng quy mô lớn với độ phức tạp cao, kiểm soát phân cấp và ra
quyết định được yêu cầu. Nhiều tài liệu nghiên cứu liên quan với phương pháp tiếp cận đa
ngành để mô hình hóa, kiểm soát và quản lý mạng từ một điểm tính toán thông minh xuất
hiện trong các tạp chí viễn thông quan trọng hàng năm. Tuy nhiên, chỉ một vài trong số đó
tập trung vào sự giống nhau giữa phân bổ nguồn lực trong một môi trường mạng và cơ
chế thị trường trong lý thuyết kinh tế. Bằng cách tham gia một cách tiếp cận kinh tế (thị
trường và dựa trên lý thuyết trò chơi) trong việc điều khiển luồng của một mạng lưới
thông tin liên lạc, chúng ta tìm kiếm các giải pháp mà việc tạo ra trí thông minh và quyết
định được phân phối, và do đó khả năng mở rộng, và mục tiêu sử dụng hiệu quả hơn và
công bằng trong chia sẻ kết quả các tài nguyên từ các động lực thị trường gây ra.
Không giống như các phương pháp tiếp cận khác được phân cấp, tập trung chính
của chúng tôi là sử dụng trí thông minh tính toán để mô hình hóa các agents quyết định
phân phối và nghiên cứu hành vi động theo khuôn khổ của lý thuyết trò chơi trong phân
bổ tài nguyên mạng. Bằng cách xem một mạng lưới như là một bộ sưu tập các nguồn tài
nguyên mà người dùng được cạnh tranh, nghiên cứu của chúng tôi nhằm mục đích tìm
kiếm các thuật toán hiệu quả, phân cấp, dẫn đến kiến trúc mạng lưới cung cấp rõ ràng
chất lượng của dịch vụ (QoS) đảm bảo, vấn đề quan trọng trong các mạng đa phương tiện
tốc độ cao.
Có một số dự án nghiên cứu song song của các tổ chức khác nhau đối với vấn đề
phức tạp này. COMET tại Ðại học Columbia ( gọi là
quyết định phân cấp làm quá trình cho trò chơi mạng. Sử dụng phương pháp tiếp cận trò
chơi mạng, họ có ý định để giải quyết những vấn đề quan trọng của giá cả từ mặt đất lên
mạng từ các điểm kỹ thuật của view, chứ không phải là có, cũng như trong các mạng

truyền thông hiện có, một cơ cấu giá nhất thiết phải tùy tiện áp đặt bài trên thực tế. Bằng
cách tham gia một cách tiếp cận thị trường dựa trên hệ thống phân phối, Michigan Marx
Project ( tìm kiếm giải pháp để cho phép phân bổ nguồn
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 14
lực thích ứng của các hệ thống thông tin quy mô lớn. Một bộ sưu tập rất hữu ích của liên
kết và các nguồn lực khác nhau về kinh tế mạng và các vấn đề liên quan được duy trì tại
Berkeley của HR Varian
( Tuy nhiên, có một số
ít tác phẩm được công bố mà cố gắng để giải quyết điều khiển nhận cuộc gọi cũng như
quản lý lưu lượng trong các mạng viễn thông từ một quan điểm lý thuyết của trò chơi xem
bằng cách sử dụng trí thông minh tính toán. Chúng tôi tổ chức công việc của chúng tôi
thành hai chương. Chương đầu tiên là giới thiệu các kỹ thuật chẩn đoán trong viễn thông,
chương thứ hai bao gồm hai phần: Phần đầu tiên giành riêng cho điều khiển nhận kết nối
(CAC) xử lý trong mạng lưới máy ATM. Bằng cách năng động CAC như một vấn đề chia
sẻ tài nguyên, chúng tôi sử dụng một mô hình trò chơi hợp tác với các hình thức sản phẩm
của một sự kết hợp một số sở thích của người dùng để tối ưu hóa khả năng chặn cuộc gọi
trong khi duy trì QoS đàm phán ở giai đoạn thiết lập cuộc gọi. Sau khi thu được những
hình thức sản phẩm của các chức năng ưu tiên người sử dụng, chúng tôi sử dụng một
thuật toán di truyền để tối ưu hóa hàm mục tiêu này để duy trì chia sẻ công bằng trong
giai đoạn truyền tải lưu lượng truy cập. Phần thứ hai của các mô hình làm việc của chúng
tôi không hợp tác hành vi người dùng trong quá trình phân bổ tài nguyên theo một khuôn
khổ bán đấu giá tổng quát. Chúng tôi đề xuất một quy tắc bán đấu giá tối ưu dẫn đến trạng
thái cân bằng trong một trò chơi năng động lặp đi lặp lại. Chúng tôi cũng sử dụng các
mạng thần kinh để mô hình hóa các chiến lược người sử dụng trong đấu thầu, và một thời
gian ngắn thảo luận về sự hình thành của kiến thức phổ biến trong các trò chơi lặp đi lặp
lại và hiệu quả phân bổ. Các đặc điểm phổ biến cho hai phần này là chúng tôi sử dụng các
kỹ thuật tình báo một số tính toán để giải quyết các mô hình phức tạp và các vấn đề tối ưu
hóa trong phân bổ tài nguyên.
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 15
CHƯƠNG 1: GIỚI THIỆU CÁC KỸ THUẬT CHẨN ĐOÁN TRONG VIỄN

THÔNG
I. TỐI ƯU HÓA TRONG VIỄN THÔNG
Sự phức tạp trong phạm vi rộng lớn của các mạng viễn thông hiện đại ngày nay
cung cấp cho chúng ta nhiều thách thức cũng như những cơ hội mới. Trong chương này,
chủ yếu chúng ta tập chung vào những thách thức liên quan tới việc tối ưu hóa trong
mạng viễn thông.
Vậy tối ưu hóa mạng viễn thông là gì?
Đó là việc tìm ra phương pháp “tốt nhất” trong các phương pháp có thể giải quyết
được bài toán. Ví dụ, có một số phương pháp để thiết kế cấu trúc liên kết của mạng dữ
liệu khu vực cho một công ty lớn. Làm thế nào để tìm ra một phương pháp đặc biệt tốt
trong tất cả các phương pháp trên? ví dụ khác là làm thế nào tìm ra cách tốt nhất để gán
các kênh tần số cho người dùng trong mạng di động. Tuy rằng mỗi phương pháp đều có
hạn chế nhưng cuối cùng chúng ta vẫn sẽ tìm ra một phương pháp “tốt nhất”.
Đặc biệt, có một số các công nghệ phần mềm mới được nhắm vào các giải pháp tối
ưu hóa hiện đang được sử dụng trong các ngành công nghiệp, có tiềm năng và hiệu quả
rất lớn giải quyết nhiều vấn đề trong ngành viễn thông. Các kỹ thuật sử dụng bao gồm các
phương pháp tìm kiếm cục bộ như mô phỏng luyện kim (Aarts and Korst, 1989), tìm kiếm
tabu (Glover, 1989; 1989a), các kỹ thuật tìm kiếm ‘population-based’ như thuật toán di
truyền (Holland, 1975; Goldberg, 1989), quá trình tiến hóa chiến lược (Schwefel, 1981;
Back, 1996), lập trình tiến hóa (Fogel, 1995), lập trình di truyền (Koza, 1992). Chúng ta
sẽ tìm hiểu lần lượt qua những chủ đề này ở các phần dưới của chương này.
II. VẤN ĐỀ ĐỘNG VÀ SỰ THÍCH ỨNG
Một khía cạnh cơ bản của các bài toán tối ưu hóa trong ngành viễn thông trên thực
tế rất năng động. Điều có thể là giải pháp tốt nhất bây giờ nhưng không thể là giải pháp lý
tưởng trong một vài giờ, hoặc thậm chí một vài phút. Ví dụ: các nhà cung cấp của một
dịch vụ cơ sở dữ liệu phân tán cố gắng đảm bảo chất lượng tốt các dịch vụ cho mỗi khách
hàng. Thực hiện chuyển hướng truy cập cơ sở dữ liệu của khách hàng đến các máy chủ
khác nhau tại các thời điểm khác nhau để thích hợp cân bằng tải giữa các máy chủ. Kỹ
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 16
thuật tối ưu hóa hiện đại có thể được sử dụng để phân phối tải trọng một cách thích hợp

trên các máy chủ, tuy nhiên giải pháp này trở nên không hợp lệ ngay sau khi có sự thay
đổi vừa phải trong mô hình truy cập cơ sở dữ liệu của khách hàng.
Một ví dụ khác là định tuyến gói chung trong một mạng lưới rộng lớn điểm-điểm
cơ bản. Theo truyền thống, các bảng định tuyến tại mỗi nút được sử dụng để tìm hop tiếp
theo là tốt nhất cho một gói tin dựa vào điểm đến cuối cùng của nó. Chúng ta có thể tưởng
tượng một kỹ thuật tối ưu hóa áp dụng cho vấn đề này, như việc nhìn vào các mô hình
giao thông tổng thể để xác định các bảng định tuyến thích hợp cho mỗi nút, vì vậy mà sự
tắc nghẽn và sự chậm trễ có thể được giảm thiểu.
Chạy lặp các các kỹ thuật tối ưu hóa là một trong những cách có thể để tiếp cận
vấn đề năng động, nhưng nó là một cách không thích hợp cho lắm khi giải pháp tốt cần
nắm bắt rất nhanh, khi môi trường thay đổi rất nhanh chóng. Thay vào đó, một phạm vi
khác của kỹ thuật tính toán hiện đại thường thích hợp cho các vấn đề như vậy. Chúng ta
gọi kỹ thuật này là kỹ thuật thích ứng.
III. MÔ HÌNH CÁC KỸ THUẬT CHẨN ĐOÁN(HEURISTIC)
Một loạt các phương pháp nổi tiếng trong lĩnh vực nghiên cứu tối ưu hoá, như lập
trình động, lập trình số nguyên, dó là các phương pháp truyền thống được sử dụng để giải
quyết các loại khác nhau của các vấn đề tối ưu hóa. Tuy nhiên, một cộng đồng lớn gồm
các nhà khoa học máy tính và các nhà nghiên cứu trí tuệ nhân tạo đã dành rất nhiều nỗ lực
đưa ra thành những ý tưởng hiện đại được gọi là "metaheuristics" hoặc "heuristic ". Sự
khác biệt cơ bản của phương pháp hiện đại là dễ dàng được áp dụng hơn so với các
phương pháp cổ điển.
Đó không thể nói là phương pháp hiện đại tốt hơn phương pháp cổ điển mà phải
tùy theo các trường hợp mà có thể áp dụng cả hai phương pháp:
• Một chuyên gia metaheuristics so sánh hai loại kỹ thuật: các phương pháp hiện
đại nhanh hơn so với phương pháp cổ điển.
• Một chuyên gia nghiên cứu hoạt động phương pháp cổ điển so sánh hai loại kỹ
thuật: các phương pháp cổ điển tốt hơn các phương pháp hiện đại.
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 17
Quan sát này được dựa trên một khía cạnh quan trọng của việc giải quyết vấn đề
tối ưu hóa. Bạn càng biết về một kỹ thuật đặc biệt mà bạn đang áp dụng, có thể sẽ tốt hơn

khi bạn điều chỉnh và khai thác bằng cách khác nó để có được kết quả tốt nhất.
Trong phần này chúng ta chỉ cung cấp cơ sở chi tiết của một vài thuật toán tối ưu
hiện đại, không đưa ra thông tin đầy đủ đề giải các bài toán cụ thể. Các kỹ thuật chủ yếu
rơi vào hai nhóm: tìm kiếm cục bộ và tìm kiếm dựa trên quần thể.
1. Tìm kiếm cục bộ
Hãy tưởng tượng bạn đang cố gắng để giải quyết một vấn đề P, và bạn có một tập
lớn S các giải pháp tiềm năng cho vấn đề này. Bạn không thực sự có tập hợp S, vì nó là
quá lớn để liệt kê đầy đủ. Tuy nhiên, bạn có một số cách tạo ra các giải pháp từ nó. Ví dụ,
S có thể là một tập hợp các kết nối cấu trúc liên kết cho một mạng, ứng cử viên của giải
pháp là s, s', s", và như vậy, là ứng cử viên cụ thể cấu trúc liên kết mà bạn đã đưa ra bằng
cách nào đó. Ngoài ra, hãy tưởng tượng rằng bạn có hàm chức năng f(s) cho một số điểm,
đưa ra một ứng cử viên giải pháp. Các số điểm, các giải pháp tốt hơn. Ví dụ, nếu chúng ta
cố gắng để tìm thấy các cấu trúc liên kết mạng đáng tin cậy nhất, sau đó f(s) có thể tính
toán xác suất của liên kết thất bại giữa hai nút đặc biệt quan trọng.
Dưới đây chúng tôisẽ mô tả cơ bản tìm kiếm cục bộ. Trước khi tìm hiểu về chúng
thì ta hãy xem xét một trong những phương pháp tìm kiếm đơn giản cục bộ, được gọi là
hillclimbing (leo núi), theo các bước dưới đây:
Bước 1(Bắt đầu): tạo ra một giải pháp, ứng cử viên ban đầu (có lẽ là ngẫu nhiên);
gọi giải pháp này là giải pháp hiện hành c, Đánh giá c.
Bước 2: Biến đổi c để tạo ra một m đột biến, và đánh giá các m.
Bước 3: Nếu hàm f(m) là tốt hơn hoặc bằng với hàm f(c), thì ta thay thế c bởi m
(tức là c bây giờ là một bản sao của m).
Bước 4:Đến khi đạt được một tiêu chuẩn thì ta kế thúc kết thúc, sau đó quay trở về
bước 2.
Bây giờ chúng ta sẽ đi tìm hiểu qua các thuật toán cục bộ chính:
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 18
1.1 Phương pháp luyện thép(Simulated Annealing)
Phương pháp luyện thép giống như phương pháp leo đồi (hillclimbing). Sự khác
biệt chỉ là ở việc nó dùng một cặp thông số, thêm vào bước 1 và ở điểm chính trong bước
3chúng được thay đổi việc sử dụng các tham số:

Bắt đầu: Tạo và đánh giá một giải pháp ban đầu (có lẽ là ngẫu nhiên); gọi là giải
pháp hiện hành c, tham số nhiệt độ khởi tạo T, độ làm mát r (0 <r <1).
Thuật toán bao gồm 4 bước chính như sau:
Bước 1: Biến đổi c để tạo ra một m đột biến, đánh giá m.
Bước 2: Nếu hàm test(f(m), f(c), T) đánh giá đúng sự thật, thì thay thế c bởi m(Ví
dụ: c bây giờ là một bản sao của m).
Bước 3: Cập nhật các thông số nhiệt độ (ví dụ như T trở thành rT)
Bước 4:Khi đạt được tiêu chí thì dừng sau đó trở về bước 2.
Câu hỏi đặt ra là liệu điều gì sẽ xảy ra trong quá trình mô phỏng luyện kim khi
chúng ta cho phép có sự biến đổi(ngay cả khi giải pháp đó không tốt hơn các giải pháp
hiện hành). Chúng ta sẽkhông thực hiện điều này bới có ít có khả năng để thực hiện nếu
như đột biến như thế xảy ra. Thuật toán có hiệu quả toàn cục, có cơ hội tốt thoát khỏi cục
bộ tối ưu, do đó có thể tìm kiếm các khu vực tốt hơn của các không gian sau. Điều cơ bản
là phải hướng đến các vùng tốt hơn. Điều này được thể hiện ở hàm test trong bước 3.
Ví dụ một hàm test được thực hiện như sau: e
( f (m)-f (c))/T
Giả định là chúng ta đang cố gắng để tối đa hóa chi phí (Nếu không chỉ cần chuyển
đổi hai hàm f(m) và f(c)). Nếu như giải pháp biến đổi tốt hơn hoặc bằng giải pháp hiện
hành, biểu thức trên sẽ lớn hơn hoặc bằng 1. Nếu biến đổi không tốt thì kết quả sẽ nhỏ
hơn 1, và biến đổi không tốt hơn sẽ gần đến 0. Do đó, kết quả củabiểu thức này được sử
dụng như xác suất. Một số ngẫu nhiên được tạo ra(rand), 0 < rand < 1, test ở bước 3 sẽ
kiểm tra biểu thức trên nhỏ hơn hoặc bằng rand (chúng ta chấp nhận biến đổi). T là tham
số "nhiệt độ". Nó bắt đầu tăng cao và giảm dần (xem bước 4) với thời gian. Như ta có thể
cho biết từ biểu thức trên, điều này có nghĩa là xác suất chấp nhận đột biến tồi tệ hơn
cũng sẽ giảm theo thời gian. Chính bởi thế mà mô phỏng luyện kim là phương pháp rất
mạnh, mặc dù khá khó khăn để có được các thông số đúng (xem thêm Dowsland (1995)).
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 19
1.2 Tìm kiếm Tabu
Một cách khác để thực hiện việc tối ưu cục bộ được cung cấp bởi công cụ tìm kiếm
Tabu (Glover năm 1989; 1989a; Glover và Laguna, 1997). Có rất nhiều khía cạnh tinh tế

để tìm kiếm Tabu, ở đây chúng tôi sẽ chỉ ra một số điểm thiết yếu về kỹ thuật. Một giới
thiệu rõ ràng và đầy đủ được cung cấp trong Glover và Laguna (1995, 1997). Trong
chương sau chúng ta sẽ đi chi tiết vào kỹ thuật tìm kiếm này nhiều hơn cũng như các ứng
dụng của nó.
Tìm kiếm Tabu cũng giống như một số phương pháp tìm kiếm cục bộ khác mà
chúng ta không thảo luận ở đây, chủ yếu chúng xem xét một số lân cận của một giải pháp
hiện tại và cuối cùng để chọn hướng di chuyến đến.Các tính năng phân biệt của tìm kiếm
Tabu là làm thế nào lựa chọn được việc thực hiện này.
Chú ý tìm kiếm Tabukhông phải là chỉ đơn giản là một vấn đề của việc lựa chọn
các lân cận của những thử nghiệm thích hợp nhất.Tìm kiếm Tabu cũng sẽ đưa bạn vào
một tài khoản và tập các đột biến. Ví dụ, nếu vị trí lân cận tốt nhất của giải pháp hiện tại
của bạn là có thể đạt được bằng cách thay đổi đầu kia của một liên kết đang nổi lên từ nút
k, nhưng chúng tôi một động thái đã được thực hiên gần đây như vậy trong một phiên
trước đó, sau đó một người hàng xóm khác nhau có thể là lựa chọn thay thế. Sau đó, một
lần nữa, ngay cả khi di chuyển tốt nhất hiện nay là của một loại đã được sử dụng gần đây,
và thường là không được phép (tức là coi là "điều Tabu '), tìm kiếm Tabu cung cấp một
cơ chế dựa trên tiêu chuẩn nguyện vọng, mà sẽ cho phép chúng ta lựa chọn mà nếu những
lân cận trong câu hỏi là đủ tốt hơn so với các giải pháp hiện tại (nói tới).
Do đó bất kỳ thực hiện tìm kiếm Tabu nào duy trì một số hình thức của bộ nhớ,
ghi lại các thuộc tính nhất định của động thái gần đây.Những thuộc tính này phụ thuộc
nhiều vào vấn đề, và điều này là một phần của nghệ thuật ứng dụng tìm kiếm Tabu.
Ví dụ, nếu chúng ta đang cố gắng để tối ưu hóa một cấu trúc liên kết mạng, một
loại đột biến của nhà điều hành sẽ làm thay đổi các hệ thống cáp liên kết với các liên kết
giữa các nút 1 và b. Trong thực hiện tìm kiếm Tabu của chúng ta, chúng ta có lẽ sẽ ghi lại
chỉ có một thực tế rằng chúng ta đã di chuyển một thay đổi hệ thống cáp 'lặp đi lặp lại tôi,
hoặc nếu không, chúng ta có thể hoặc bổ sung, chỉ cần ghi lại thực tế rằng chúng ta đã
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 20
thực hiện một thay đổi kết hợp với một nút và khác liên kết với nút b. Nếu chúng ta chỉ
ghi lại các loại cũ của thuộc tính, sau đó trong tương lai gần có thể thay đổi hệ thống cáp,
di chuyển sẽ không được phép, độc lập với những gì các nút đã được tham gia.Nếu chúng

ta ghi nhận chỉ có các loại sau của thuộc tính, sau đó gần như thay đổi tiềm năng trong
tương lai liên quan đến a / và b có thể là không được phép, nhưng thay đổi hệ thống cáp,
di chuyển, cho mỗi gia nhập sẽ được chấp nhận.
1.3 Tìm kiếm cục bộ Artful
Ghi chú ngắn gọn của chúng tôi về loại tìm kiếm mô phòng và Tabu minh họa rằng
các khía cạnh quan trọng của một phương pháp tìm kiếm cục bộ tốt là quyết định mà
người hàng xóm để di chuyển đến. Tất cả các phương pháp tìm kiếm cục bộ sử dụng các
ý tưởng cơ bản mà di chuyển cục bộ gần như luôn luôn là một ý tưởng tốt, tức là nếu bạn
có một giải pháp tốt hiện nay, có thể là một một tốt hơn gần đó, và có thể dẫn đến những
cái tốt hơn, và vv. Tuy nhiên, nó cũng rõ ràng mà đôi khi, có lẽ thường, chúng ta phải
chấp nhận thực tế rằng chúng ta chỉ có thể tìm thấy các cải thiện các giải pháp hiện tại
bằng cách tạm thời chúng ta hy vọng di chuyển đến những người tồi tệ hơn. Mô phỏng
luyện kim và tìm kiếm Tabu là hai cách tiếp cận chính để đối phó với vấn đề này. Thật
không may, tuy nhiên, nó gần như là không bao giờ rõ ràng, đưa ra một vấn đề cụ thể,
cách tốt nhất để thiết kế và thực hiện phương pháp là gì. Có nhiều sự lựa chọn để thực
hiện, đầu tiên là quyết định làm thế nào để đại diện cho một giải pháp ứng cử viên ở nơi
đầu tiên.
Ví dụ, một cấu trúc liên kết mạng có thể được biểu diễn như là một danh sách các
liên kết, nơi mà mỗi liên kết là một cặp của các nút (a, b). Giải mã một danh sách vào một
cấu trúc liên kết mạng chỉ đơn giản là số tiền để vẽ một liên kết điểm-điểm cho mỗi cặp
nút trong danh sách. Ngoài ra, chúng ta có thể đại diện cho một cấu trúc liên kết mạng
như là một chuỗi nhị phân, có chứa nhiều bit như là các liên kết có thể. EAC h vị trí trong
chuỗi bit sẽ giới thiệu cụ thể một liên kết điểm-điểm tiềm năng, Vì vậy, một giải pháp
candidiate như '10010'chỉ ra rằng có một liên kết điểm-điểm giữa các nút 1 và 2, không có
giữacác nút 1 và 3, 1 và 4, nhưng có một trong giữa nút 1 và 5, và vv… Nói chung, có rất
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 21
nhiều cách sáng tạo ra một phương pháp để đại diện cho các giải pháp cho một vấn đề. Sự
lựa chọntất nhiêncũng ảnh hưởng đến thiết kế của các nhà khai thác khu vực.
Trong ví dụ trên việc loại bỏ một liên kết từ cấu trúc liên kết liên quan đến hai loại
khác nhau của hoạt động trong hai đại diện. Trong trường hợp danh sách các node đôi,

chúng ta cần phải thực sự loại bỏ một cặp từ danh sách. Trong trường hợp nhị phân,
chúng ta thay đổi một 1 đến 0 trong một vị trí đặc biệt trong chuỗi. Xây dựng các cơ quan
đại diện và các nhà khai thác là một phần của nghệ thuật sử dụng hiệu quả tìm kiếm cục
bộ để giải quyết các vấn đề tối ưu hóa cứng. Một phần quan trọng của nghệ thuật này, tuy
nhiên, là sử dụng kiến thức vấn đề cụ thể hoặc chẩn đoán hiện tại nơi có thể.
Ví dụ, một vấn đề với một trong hai đại diện chúng tôi đã ghi nhận cho đến nay
mạng lưới cấu trúc liên kết là một ngẫu nhiên tạo ra điển hình cấu trúc liên kết cũng có
thể là không có liên quan. Đó là, một giải pháp ứng cử viên có thể chỉ đơn giản là không
có đường dẫn giữa mỗi cặp của các nút. Thông thường, chúng ta sẽ chỉ quan tâm đến
mạng lưới kết nối, vì vậy bất kỳ nỗ lực tìm kiếm thuật toán chi tiêu trong kết nối với
mạng không có liên quan đánh giá có vẻ khá lãng phí. Đây là nơi mà kiến thức cơ bản
miền và chẩn đoán hiện tại sẽ đến trong hữu ích.
Đầu tiên, bất kỳ nhà thiết kế mạng lưới tốt sẽ biết về các khái niệm lý thuyết đồ thị
khác nhau, chẳng hạn như cây kéo dài, hortest các thuật toán tìm đường, và vv. Nó không
phải là khó khăn để đưa ra một thay đổi danh sách các đại diện nút đôi, đảm bảo rằng tất
cả các giải pháp ứng cử viên có chứa một cây bao trùm cho mạng, và do đó hiện đang kết
nối. Một cách để làm điều này là liên quan đến việc giải thích đầu tiên cặp node gián tiếp.
Thay vì (a, b) chỉ ra rằng mạng lưới này có chứa một liên kết giữa a và b, nó thay vào đó
sẽ có nghĩa là nút ATH kết nối sẽ được kết nối với các nút không có liên quan BTH. Bằng
cách này, mỗi cặp nút tiếp theo cho thấy làm thế nào để tham gia vào một nút như được
nêu ra không sử dụng một cây trải rộng đang phát triển. Khi tất cả các nút được kết nối
như vậy, còn lại nút cặp có thể được giải thích trực tiếp.
Vấn đề còn tốt hơn nữa là chúng ta có thể có địa chỉ có thể sẽ liên quan đến vấn đề
chi phí, và chi phí của các liên kết cụ thể sẽ đóng một vai trò quan trọng trong chức năng
hoặc trung tâm. Sau đó cho chúng ta biết rằng một số thuật toán cũng được biết đến và
nhanh chóng thoát ra mà tìm thấy một cây minmal đề cập tới vấn đề chi phí kéo dài
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 22
(Kruskal, 1956; Prim, 1957). Vì vậy, để tốt hơn là tùy thuộc vào các chi tiết khác nhau
của vấn đề trong tay ta có, để khởi tạo mỗi giải pháp ứng cử viên với một cây chi phí tối
thiểu, và tất cả những gì chúng ta cần để đại diện cho các liên kết mà chúng ta thêm lên

cây này.
Có một số cách khác trong lĩnh vực kiến thức hoặc chẩn đoán hiện tại có thể được
sử dụng để hưởng lợi một cách tiếp cận tìm kiếm cục bộ cho một vấn đề tối ưu hóa. Một
cái gì đó về vấn đề này có thể cho chúng ta biết, ví dụ như là những loại đột biến có một
cơ hội tốt hơn dẫn đến lân cận tốt. Một phương pháp khám phá hiện có, nhanh chóng
phân công các kênh trong một mạng lưới điện thoại di động, có thể được sử dụng để cung
cấp điểm khởi đầu cho một tìm kiếm cục bộ cố gắng tìm giải pháp tốt hơn.
2. Tìm kiếm dựa trên quần thể
Đây là một phương cách của thuật toán thay thế, bây giờ trở nên rất phổ biến, được
xây dựng trên ý tưởng tìm kiếm địa phương bằng cách sử dụng quần thể. Có hai phương
cách để tăng cường các cơ hội của việc tìm kiếm giải pháp tốt. Đầu tiên, kể từ khi chúng
tôi có một quần thể, chúng ta có thể dành nhiều thời gian tìm kiếm trong các khu vực
khác nhau cùng một lúc. Một thuật toán dựa trên quần thể có xu hướng chia sẻ các nỗ lực
tính toán đến các giải pháp ứng cử khác nhau . Một phần thời gian sẽ được chi tiêu tìm
kiếm trong khu vực của các giải pháp trung bình và điều này sẽ dẫn đến việc tìm kiếm
được đột biến đặc biệt , sau đó cân bằng tải nỗ lực tính toán sẽ được sửa đổi phù hợp.
Một cơ hội khác được cung cấp bởi các kỹ thuật dựa trên quần thể là chúng ta có
thể thử vận hành tái tổ hợp. Đây là những cách sản xuất đột biến, nhưng lần này từ hai
hay nhiều giải pháp, chứ không phải chỉ một. Do đó kết quả có thể được gọi là tái tổ hợp,
chứ không phải là một đột biến. Tái tổ hợp là một phương pháp cung cấp một cách lựa
chọn tốt trong không gian rộng lớn của khả năng.
Ví dụ, nếu hai giải pháp cha mẹ là mỗi một vector của các yếu tố k, một nhà điều
hành tái tổ hợp được gọi là thống nhất chéo sẽ xây dựng một trẻ em từ cha mẹ, cho mỗi
phần tử lần lượt, ngẫu nhiên giá trị của nó từ một trong hai nơi. Đứa trẻ có thể có được
50% khác nhau từ mỗi cha mẹ của nó.
Dưới đây là các bước cho một thuật toán dựa trên quần thể chung.
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 23
Bước 1(Bắt đầu): tạo ra một kế cận ban đầu của các giải pháp ứng cử viên. Đánh
giá mỗi người trong số họ.
Bước 2: Chọn một số dân là cha mẹ.

Bước 3: Áp dụng các nhà khai thác tái tổ hợp và đột biến để các bậc cha mẹ để sản
xuất một số trẻ em.
Bước 4: Kết hợp các trẻ em vào kế cận.
Bước 5: Cho đến khi đạt được một tiêu chí chấm dứt, trở về bước 2
Đặc điểm của các bước cụ thể như sau:
Bước 2: thường sử dụng một sự tồn tại của các fittest chiến lược, đây là nơi mà tải
chia sẻ, thảo luận ở trên đi vào chơi. Fitter một giải pháp ứng cử viên, cơ hội nhiều hơn
nó có là một người mẹ, và do đó cơ hội có được rằng các thuật toán sẽ khám phá các vùng
lân cận. Có một số lựa chọn kỹ thuật khác nhau, hầu hết trong số đó có thể được
parameterised để làm thay đổi mức độ mà cha mẹ fitter được ưa thích (áp lực chọn lọc).
Bước 3 áp dụng hoặc tái tổ hợp hoặc điều hành đột biến, hoặc cả hai.Có tất cả các
loại tiêu chuẩn vận hành tái tổ hợp và đột biến, nhưng - như chúng tôi gợi ý ở trên - các
lợi ích thực sự đến khi nghĩ rằng một số đã được đưa vào thiết kế các loại cụ thể của các
nhà điều hành bằng cách sử dụng kiến thức miền.
Bước 4: chúng ta đang gần như luôn luôn duy trì một quy mô kế cận cố định. Vì
vậy, nếu chúng ta có một kế cận 100, nhưng 20 trẻ em để kết hợp, sau đó 20 những 120
phải được loại bỏ. Một cách tiếp cận chung là chỉ cần loại bỏ ít nhất 20 phù hợp với các
nhóm kết hợp, nhưng có một vài cách tiếp cận khác, chúng tôi có thể sử dụng một kỹ
thuật gọi là "tràn ngập", ví dụ như De Jong (1975), trong đó đa dạng đóng một vai trò
quan trọng trong các quyết định về những gì các giải pháp ứng cử viên để loại bỏ.
Ví dụ, chúng tôi chắc chắn sẽ thích để loại bỏ giải pháp trong lợi của một t giải
pháp phù hợp không, nếu nó xảy ra là trường hợp đó đã có một bản sao trong kế cận,
nhưng t là 'mới'.
Bước 5: chúng ta nên chỉ ra một số vấn đề thuật ngữ. Có những thuật toán dựa trên
kế cận nhiều, và trong thực tế, họ thường được gọi là thuật toán tiến hóa (địa bàn).
Một thuật ngữ phổ biến khác sử dụng thuật toán di truyền, đó đúng là một gia đình
của các phương pháp như vậy mà luôn luôn sử dụng một nhà điều hành tái tổ hợp (Hà
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 24
Lan, năm 1965, Goldberg, năm 1989), trong khi các tổ chức khác của các thuật toán gọi là
tiến hóa lập trình (Fogel, 1995) và sự tiến hóachiến lược (Quay lui, năm 1996), xu hướng

sử dụng đột biến, nhưng được bỏ eclever về cách họ sử dụng nó. Trong mọi trường hợp,
một giải pháp ứng cử viên có xu hướng được gọi là nhiễm sắc thể và các yếu tố của nó
được gọi là gen.
IV. KỸ THUẬT TÍNH TOÁN THÍCH NGHI
Để giải quyết nhu cầu tối ưu hóa vốn có của môi trường viễn thông, việc trực tiếp
sử dụng các kỹ thuật tối ưu hóa địa phương hoặc dân số dựa trên đôi khi có thể là khá phù
hợp. Bởi vì nó có thể mất quá lâu để đưa một giải pháp tốt, và như vậy từ thời gian đến
giải pháp, vấn đề đã được thay đổi !
Những gì chúng ta cần thay vì trong bối cảnh này là một cách để đưa ra quyết định
rất nhanh, nhưng rất tốt,. Ví dụ, để quyết định những bước nhảy tiếp theo tốt nhất là cho
một gói tin đến một nút đích d, chúng ta có lẽ có thể chạy một mô phỏng của các mạng
cho các mô hình tầng vận chuyểnhiện hành hiện nay và ước tính thời gian đến khả năng ở
các điểm đến cho cho có thể bước nhảy tiếp theo. Kết quả mô phỏng như vậy sẽ cung cấp
cho chúng tôi với một sự lựa chọn đầy đủ thông tin, và sau đó chúng tôi có thể gửi các gói
dữ liệu một cách thích hợp trên con đường của nó. Bây giờ, nếu chúng tôi có thể ở trên
trong một vài micro giây, chúng ta sẽ có một chiến lược định tuyến gói tin phù hợp và rất
có lợi nhuận.
Tuy nhiên, kể từ khi nó có thể sẽ mất vài giờ để làm một mô phỏng chính xác bằng
cách sử dụng các loại sức mạnh xử lý và bộ nhớ thường có sẵn các thiết bị chuyển mạch
mạng, trong thực tế nó là một ý tưởng vô lý! Thay vào đó, chúng tôi cần một số cách làm
cho quyết định đúng đắn một cách nhanh chóng, nhưng quyết định bằng cách nào đó sẽ
đưa vào tài khoản các trường hợp hiện hành. Lý tưởng nhất, chúng tôi đang tìm kiếm một
'hộp đen', khi cho ăn với một câu hỏi và một số chỉ tiêu môi trường, cung cấp một câu trả
lời hợp lý và ngay lập tức. Một ví dụ của một hộp đen như là một bảng định tuyến của các
loại thường thấy trong các mạng chuyển mạch gói. Câu hỏi được hỏi bởi một gói tin
truyền thông là: cuối cùng tôi muốn để có được d, vì vậy mà tôi nên đi tiếp theo? Bảng
định tuyến, thông qua một tra cứu đơn giản được lập chỉ mục của d, rất nhanh chóng cung
cấp một câu trả lời và gửi nó theo cách của mình.
Điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi 25
Những rắc rối với điều này, tất nhiên, là nó về cơ bản là không thích nghi. Trừ khi

các giao thức quản lý mạng tiên tiến nhất định trong hoạt động, bảng định tuyến sẽ luôn
luôn cung cấp cho các câu trả lời tương tự, ngay cả khi các liên kết trở đi từ hop tiếp theo
đề nghị d được rất nhiều tắc nghẽn tại thời điểm này. Hộp đen của chúng tôi do đó thường
được thay đổi bằng cách nào đó, và thích nghivới điều kiện hiện hành. Trong thực tế,
chương tám và chín cả hai thảo luận về cách làm điều này liên quan đến các bảng định
tuyến trong các mạng chuyển mạch gói.
Vì vậy, kỹ thuật thích nghi trong bối cảnh viễn thông có xu hướng liên quan đến
các hộp đen, hoặc các mô hình, bằng cách nào đó tìm hiểu và thích nghivới 'offline'
nhưng có thể phản ứng rất nhanh chóng và thích hợp khi được hỏi về quyết định. Trong
một số chương có liên quan đến thích ứng, các kỹ thuật sử dụng chúng tôi đã thảo luận đã
có trong mục 1.3, nhưng thay đổi một cách thích hợp trong ánh sáng của sự cần thiết phải
quyết định nhanh chóng. Mặc dù, trong những người khác, một số các kỹ thuật hiện đại
quan trọng được tuyển dụng, mà bây giờ chúng ta sẽ một thời gian ngắn giới thiệu. Đây là
những trung tâm tính toán, logic mờ và lý thuyết trò chơi. Vai trò của trung tâm tính toán
trong bối cảnh này là để phát triển một diễn đàn mô hình, mà học(ví dụ) làm thế nào để
làm cho các quyết định đúng đắn trong các bộ khác nhau của hoàn cảnh. Kết quả đào tạo
mạng lưới trung tâm sau đó được sử dụng trực tuyến như là nhà sản xuất ision tháng mười
hai. Vai trò của logic mờ là cung cấp một cách sản xuất các quy tắc mạnh mẽ đó cung cấp
các quyết định. Điều này về cơ bản sản xuất một decisionmaker hộp đen, giống như một
mạng lưới trung tâm, nhưng với hoạt động nội bộ khác nhau. Cuối cùng, lý thuyết trò
chơi cung cấp một cách khác để tìm kiếm kịch bản phức tạp, mạng lưới năng động. Về cơ
bản, nếu chúng ta xem một số khía cạnh của quản lý mạng như là một 'trò chơi, một tập
hợp một số phương trình và các mô hình nổi tiếng đi vào chơi, mà lần lượt cung cấp xấp
xỉ tốt với sự năng động của mạng thực sự. Do đó, một số quyết định quản lý mạng có thể
được hỗ trợ bằng cách sử dụng những phương trình này.
1. Thuật toán Nơ-ron
Tính toán Nơ-ron (Rumelhart và MacClelland năm 1989; Haykin năm 1998) cơ
bản là một phân loại mô hình kỹ thuật, nhưng với khả năng ứng dụng rộng rãi bao la hơn
cho thấy ngay từ cái nhìn đầu tiên. Sức mạnh thực sự của phương pháp này nằm trong

điều khiển luồng thông minh theo khuôn khổ lý thuyết trò chơi

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về