Tải bản đầy đủ (.docx) (67 trang)

Điện toán đám mây Tác tử phần mềm hướng tới dịch vụ điện toán thông minh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.25 MB, 67 trang )

1
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

Học Viên:BÙI THỊ MỸ DUYÊN Mã số CH1101079
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01.01
TP Hồ Chí Minh – Năm 2015
Mục lục
Danh mục các ký hiệu, các chữ viết tắt
STT Chữ viết tắt Giải nghĩa
1. AI Artificial Intelligene
2. PEAS Performance Environment Actuators Sensors
3. FIPA Foundation for Intelligent, Physical Agents
4. MAS Multi Agent Systems
5. ITS Intelligent Transportation System
6. TSC Traffic Signal controller
7. PTMS- Parallel Transportation Management Systems
8. MA Management Agent
9. ATS Artificial Transportation System -
Danh mục các bảng
2
Danh mục các hình vẽ, đồ thị
MỞ ĐẦU
Trải qua nhiều thế kỷ, các công cụ ngày càng tăng tinh vi đã được phát triển để
phục vụ nhân loại. Công cụ vật chất như đục, búa, giáo, mũi tên, súng, xe đẩy, xe
hơi, máy bay và tất cả đều có vị trí của mình trong lịch sử của nền văn minh. Nhân
loại cũng đã phát triển các công cụ giao tiếp – nói ngôn ngữ, ngôn ngữ viết, và
ngôn ngữ của toán học. Những công cụ này có không chỉ được dùng cho việc trao
đổi và lưu trữ thông tin, nhưng cũng có cho phép sự biểu hiện của khái niệm mà
chỉ đơn giản là không thể tồn tại bên ngoài ngôn ngữ.


Trong vài thập kỷ qua đã chứng kiến sự xuất hiện của một công cụ mới – máy
tính. Máy tính có thể thực hiện được những việc mà một người bình thường có thể
thực hiện được nhưng nhanh hơn và đáng tin cậy hơn. Điều đó làm con người bỏ
được sự chán ngắt của những công việc trước đây mà họ phải thực hiện bằng tay.
Mặc dù các ứng dụng của máy tính là rất ấn tượng nhưng nó thực sự hoạt động
khá đơn giản, và trong các ứng dụng đó máy tính vẫn chỉ là một máy thực hiện
tính toán phức tạp. Ý tưởng mới là liệu ta có thể xây dựng một máy tính (hoặc một
chương trình máy tính) có khả năng suy nghĩ, có khả năng thay thế con người
hoàn toàn không? Tham vọng đó của chúng ta tạo ra một bước nhảy vọt trong
nghiên cứu sáng tạo và là một thách thức lớn đối với những người làm trong lĩnh
vực công nghệ thông tin.
Nghiên cứu trí tuệ nhân tạo là hướng tới xây dựng một máy như vậy và nâng cao
sự hiểu biết của chúng ta về trí thông minh. Các thành quả sau cùng trong lĩnh vực
này sẽ là xây dựng được một máy tính mà có thể bắt chước hoặc vượt qua khả
năng suy nghĩ của con người, bao gồm cả lý luận, hiểu, trí tưởng tượng, nhận
3
dạng, sáng tạo và cảm xúc. Để đạt được đến điều đó còn là một sự thách thức lớn.
Tuy nhiên một số thành công đã đạt được trong lĩnh vực này là bắt chước lĩnh vực
cụ thể của hoạt động tinh thần của con người. Chẳng hạn, hiện nay máy có thể
chơi cờ vua ở mức cao nhất, có thể giải thích câu nói, và để chẩn đoán trong y
khoa, có thể hiểu và phân tích ngôn ngữ tự nhiên, dịch…
Những thành công khiêm tốn, nghiên cứu về trí tuệ nhân tạo, cùng với các ngành
khoa học máy tính, đã dẫn đến sự phát triển của một số công cụ tính toán hữu ích.
Những công cụ này có một loạt các ứng dụng tiềm năng. Các công cụ đặc biệt
quan tâm có thể tạm chia giữa các hệ thống dựa trên tri thức, trí tuệ tính toán, và
các hệ thống lai (hybrid). Hệ thống dựa trên tri thức bao gồm hệ chuyên gia và hệ
thống quy tắc, hệ thống hướng đối tượng và khung cơ bản, và các tác tử thông
minh.Trí thông minh tính toán bao gồm các mạng nơ ron thần kinh, giải thuật di
truyền và các thuật toán tối ưu hóa khác. Kỹ thuật xử lý không chắc chắn, chẳng
hạn như fuzzy logic, phù hợp với cả hai loại.

Hệ thống dựa trên tri thức, trí tuệ tính toán, và các hệ thống lai của chúng được gọi
chung ở đây là hệ thống thông minh.
Một hệ thống là một phần nhỏ của vũ trụ mà chúng ta đang quan tâm. Nó có thể là
tự nhiên như thời tiết hoặc do con người tạo ra như một chiếc ô tô, nó có thể là
một đối tượng như một cái máy hoặc trừu tượng như một hệ thống bầu lãnh đạo
chính trị. Môi trường xung quanh là tất cả mọi thứ khác mà tương tác với hệ
thống. Hệ thống này đôi khi có thể được chia nhỏ hơn thành các hệ thống con, các
hệ thống con đó cũng tương tác lẫn nhau.
Mặc dù rất khó để định lượng sự thông minh của một hệ thống, nhưng có thể nhận
thấy 2 mức độ thông minh thông qua một số đặc điểm mà nó có:
- Thông minh thấp: là một hệ thống đơn giản, nó phải được “chỉ bảo” mọi thứ
và cần những chỉ dẫn hoàn hảo, cần điều khiển ở mức thấp, các tham số phải
được thiết lập, nó thường là một cái máy (cơ khí)
4
- Thông minh cao: thường là một hệ thống phức tạp, nó tự chủ ở một mức độ
nhất định và cần một ít chỉ dẫn, xác định mục tiêu cho nó, đòi hỏi điều khiển ở
mức cao, thích nghi, thực hiện các quyết định và lựa chọn – đó thường là một
máy tính (máy vi tính).
Giữa 2 mức độ trên có một sự liên tục, hầu hết các thiết bị trong thực tế đều thuộc
loại này. Bởi vì định nghĩa rộng, tất cả những hệ thống điều khiển đều thông minh
ở một mức độ nhất định và khía cạnh này chúng là tương tự. Tuy nhiên, hệ thống
thông minh hơn có thể thao tác trên những tình huống phức tạp hơn và thực hiện
những quyết định phức tạp hơn.
Các lĩnh vực ứng dụng của hệ thống thông minh: Một số lĩnh vực đặc biệt mà hệ
thống thông minh đã được áp dụng như sau: hệ thống công cụ hạ cánh, phi công tự
động, hệ thống tránh va chạm, phanh chống khóa, túi khí thông minh, phương tiện
giao thông thông minh, chẩn đoán y khoa, xử lý ảnh, phân tích dữ liệu thông minh,
phân tích rủi ro tài chính, xử lý ngôn ngữ tự nhiên…
Trong phạm vi bài khóa luận này tôi xin trình bày một số khái niệm có liên quan
trong hệ thống thông minh: tác tử, đa tác tử, tác tử di động và môi trường phát

triển tác tử di động, hướng nghiên cứu mới điện toán đám mây và tác tử phần mềm
hướng tới dịch vụ điện toán thông minh, một ứng dụng nhỏ là thiết kế hệ thống
giao thông thông minh dựa trên công nghệ điện toán đám mây kết hợp tác tử di
động.
Qua đây em xin chân thành cảm ơn Thầy GS TSKH Hoàng Văn Kiếm đã dẫn dắt
cho em tiếp cận được với những kiến thức mới trong lĩnh vực công nghệ tri thức.
Cũng xin cảm ơn các bạn cùng khóa đã động viên, khích lệ, chia sẻ tài liệu để tôi
có thể hoàn thành khóa luận này.
5
Chương 1 – TỔNG QUAN
1.1 Giới thiệu
Điện toán đám mây cung cấp những dịch vụ linh hoạt có hiệu suất cao, lưu trữ dữ
liệu có khả năng mở rộng đến số lượng người dùng lớn và tăng lên mỗi ngày. Điện
toán đám mây khuếch trương trường hoạt động của hệ thống điện toán phân tán
bằng việc cung cấp những dịch vụ Internet tiên tiến, bổ sung và hoàn thiện đầy đủ
các chức năng của điện toán phân tán được cung cấp bởi web, điện toán lưới và
mạng ngang hàng( peer-to-peer networks). Trong thực tế, hệ thống điện toán đám
mây cung cấp cơ sở hạ tầng với quy mô lớn cho máy tính hiệu suất cao tự động
thích ứng với nhu cầu của người dùng và ứng dụng.
Ngày nay, điện toán đám mây được sử dụng chủ yếu cho việc xử lí khối lượng
công việc tính toán chuyên sâu và cung cấp khối lượng lớn cơ sở dữ liệu lưu trữ.
Cả hai mục tiêu trên được liên kết với mục tiêu thứ ba là giảm tiềm năng quản lí
và sử dụng. Cùng lúc đó, hệ thống đa tác tử(hệ thống đa nhân) đại diện cho một
mô hình điện toán phân tán khác dựa vào tương tác đa tác tử có khả năng xử lí
thông minh. Một tính năng quan trọng của những tác tử phần mềm là sự thông
minh được thể hiện dựa vào phương pháp tập hợp trí tuệ nhân tạo cần sự hợp tác
giữa giữa nhiều tác tử mà có thể hoạt động song song hay phân tán với máy tính
để đạt được hiệu suất cao cho giải quyết những phức hợp lớn với thời gian vận
hành ngắn. Mặc cho những khác biệt đó, điện toán đám mây và hệ thống đa tác tử
chia sẻ nhiều vấn đề chung và những chủ đề khảo sát trên cả hai lĩnh vực có nhiều

điểm chung đáng nghiên cứu. Nói một cách cụ thể, điện toán đám mây có thể đưa
ra một cơ sở hạ tầng tính toán có năng suất, đáng tin cây, dễ dự báo và có khả
năng mở rộng cho sự vận hành của hệ thống đa tác tử - thực hiện các tác tử phức
hợp dựa vào các ứng dụng như khi mô hình hóa và mô phỏng các hệ thống phức
tạp được cung cấp. Mặc khác, các tác tử phần mềm có thể được sử dụng như phần
hợp thành cơ bản cho những công cụ thông minh trong điện toán đám mây làm
6
chúng dễ thích ứng, linh hoạt và tự chủ hơn trong nguồn quản lí, cung cấp dịch vụ
và trong vận hành những ứng dụng với quy mô lớn.
Một tác tử là một thực thể tính toán mà hoạt động của nó do một thực thể (hoặc
nhiều thực thể) khác chịu trách nhiệm để làm một nhiệm vụ hay đạt được một mục
đích cho trước. Hệ thống tác tử là các chương trình phần mềm khép kín thể hiện
phạm vi kiến thức và năng lực có thể xử lí ở một mức độ độc lập nhất định để đưa
ra các hoạt động cần thiết nhằm đạt được những mục đích cụ thể. Chúng được
thiết kế để vận hành trong điều kiện môi trường thay đổi không ngừng.
Mặc dù một tác tử riêng lẻ cũng có thể hoạt động để chạy được một nhiệm vụ cho
cho trước, một mô hình tác tử được hình thành như một mô hình điện toán phân
tán- một tập hợp tác tử tác động với nhau bằng cách trao đổi thông tin và hợp tác
để thực hiện những nhiệm vụ tổng hợp các tương tác, trí tuệ, sự thích ứng và sự
thay đổi không ngừng- là vấn đề quan trọng cần được giải quyết. Có nghĩa là thậm
chí chúng ta có thể phân định rạch ròi một tác tử cô lập với các tác tử khác thì mô
hình tác tử cũng có thể được khai thác hoành chỉnh nếu chúng ta xem những tác tử
là những thực thể hoạt động trong một bộ sưu tập tác tử, do vậy bổ sung cho cái
gọi là hệ thống mô hình hệ thống đa tác tử. Thực tế, khó để hình dung một tác tử
sẽ tồn tại và hoạt động ra sao nếu chỉ là một thực thể đơn lẻ không hề tương tác
với các tác tử khác (thực tế hay nhân tạo) trong môi trường. Ngoài ra các tác tử
thông tin hoặc cái tác tử cá nhân đều được cho là hoạt động riêng lẻ trong giải
quyết vấn đề, điều này chắc chắn sẽ được cải thiện trong khả năng xử lí và kết quả
đạt được nếu hợp tác với những tác tử khác trong tiếp nhận thông tin để thi hành
nhiệm vụ hoặc trao đổi tri thức để nâng cao vai trò và sự đóng góp của tác tử.

Sự tương đồng và khác biệt trong các mô hình điện toán phân tán có thể được khai
thác cho mục đích dựa vào chúng để sử dụng tổng hợp một số công nghệ. Ví dụ,
những ứng dụng phân cấp dựa vào hệ thống đa tác tử có thể được phát triển trên
hệ thống lưới hoặc trong mạng peer-to-peer. Đồng thời, các ứng dụng dựa vào
7
mạng lưới cảm biến có thể dùng các kĩ thuật phân tán thông minh thông qua một
kênh của hệ thống đa tác tử có tính năng học tập và tái hoạt động.
Hai cách thức chính để tích hợp việc sử dụng hệ thống các tác tử và đám mây.
Cách đầu tiên là dựa vào nguyên tắc linh hoạt, thông minh, tái hoạt động và tự chủ
của tác tử có thể được sử dụng trên nền tảng của điện toán đám mây, để sản xuất
ra các giải pháp và dịch vụ đám mây tiên tiến cho ra đời chức năng và dịch vụ
thông minh mà ngày nay vẫn chưa xuất hiện trên cơ sở hạ tầng của điện toán đám
mây đương đại. Cách thứ hai là chú trọng vào ý tưởng điện toán đám mây có thể
đưa ra một nền tảng lí tưởng có thể chạy được hệ thống đa tác tử cơ sở, các mô
phỏng và các ứng dụng bởi nó có nguồn tài nguyên với số lượng sản xuất và lưu
trữ lớn có thể được cấu hình thật năng động để chạy được hệ thống đa tác tử dựa
trên phần mềm quy mô lớn ở một phạm vi chưa từng có.
Trong những năm qua, nhiều môi trường lập trình tác tử - hỗ trợ các kiến trúc tác
tử riêng biệt và cung cấp thư viện của tương tác giao thức như Jason, 3APL,
JACK, Claim, SyMPA, JADE, Cougaar, Jadex, và ZEUS đã được phát triển.
Ngoài ra, các phương pháp công nghệ phần mềm như Gaia, Tropos và AUML đã
được thiết kế để phân tích và kiến tạo những hệ thống dựa vào tác tử. Những nỗ
lực để tiêu chuẩn hóa các đặc tính và cơ sở của hệ thống tác tử đã được hoàn thành
như với FIPA và KQML cho trao đổi thông tin liên tác tử. Các môi trường, bộ
công cụ và phương pháp cho phép những công nghệ được bổ sung cho ứng dụng
của hệ thống đa tác tử trên hệ thống tính toán truyền thống. Tuy nhiên, chúng sẽ
càng thú vị hơn nếu chúng còn được trang bị sẵn cơ sở hạ tầng điện toán phân tán
như điện toán lưới, điện toán đám mây hay mạng lưới peer-to-peer để củng cố cho
sự phát triển ứng dụng của hệ thống đa tác tử với quy mô lớn đạt được hiệu suất
và năng mở rộng cao.

Tuy vậy, mặc cho tiềm năng về không gian chung nơi mà công nghệ tác tử và cơ
sở hạ tầng điện toán đám mây được sử dụng hiệu quả để tạo ra những mô hình, kĩ
thuật, hệ thống và ứng dụng tiên tiến thì cho đến ngày nay chỉ có một vài hoạt
8
động nghiên cứu có sử dụng cả hai công nghệ này. Trong các tài liệu, có một số
lượng rất hạn chế văn bản nói về sự tích hợp giữa các tác tử và đám mây.
1.2 Cấu trúc bài khóa luận:
Chương 1 trình bày tổng quát về nội dung bài khóa luận. Chương 2 trình bày các
khái niệm về tác tử và đa tác tử. Trong chương 3 là phần trình bày về tác tử di
động và môi trường phát triển tác tử di động. Chương 4 là khái niệm về điện toán
đám mây, mối liên hệ giữa điện toán đám mây và tác tử phần mềm hướng tới dịch
vụ điện toán thông minh. Đám mây thông minh cho hệ thống giao thông thông
minh.
Chương 2 – TÁC TỬ
2.1. Tác tử và tính chất của tác tử
2.1.1 Tác tử
Khi thế giới thông tin mở rộng, người đang ngày càng trở nên ít có khả
năng hành động theo số lượng thông tin ngày càng bùng nổ mà họ được tiếp cận.
Một cách giải quyết vấn đề này là xây dựng tác tử thông minh hổ trợ, phần mềm
phục vụ cho các nhiệm vụ cụ thể của chúng ta. Ví dụ, nếu bạn muốn tìm kiếm
một trang web khi cung cấp một phần cụ thể của thông tin, bạn có thể sử dụng một
tác tử thông minh để tư vấn một sự lựa chọn công cụ tìm kiếm và lọc các trang
web cho bạn. Bằng cách này bạn được nhìn thấy chỉ có hai hoặc ba trang phù hợp
với chính xác nhu cầu của bạn. Một tác tử thông minh loại này, được nhân cách
hóa bằng cách học hỏi những thói quen và sở thích của bạn => được gọi là một
tác nhân người dùng.
Tương tự như vậy, phần lớn các giao dịch trên thị trường chứng khoán thế
giới được thực hiện bởi các tác tử thông minh. Gặt hái những khoảng lợi ích từ
9
một số loại cổ phần nhờ việc xử lý dựa trên phản ứng nhanh chóng với những biến

động giá nhỏ. Bởi vì thời gian để một thương nhân con người đồng hóa dữ liệu và
đưa ra quyết định, sẽ làm cơ hội sẽ bị mất.
Khi các tác tử thông minh cung cấp một cách để giảm bớt sự phức tạp trong
thế giới thực, chúng cũng thực hiện đầy đủ vai trò tương tự như trong hệ thống
máy tính. Khi hệ thống phần mềm trở nên lớn và phức tạp hơn, nó dần trở nên bất
khả thi để duy trì chúng như hệ thống tập trung được thiết kế và thử nghiệm với
mọi tình huống. Một phương pháp khác là để có những ý tưởng của phần mềm
mô-đun hướng đến khả năng tối ưu của nó, cụ thể là, để biến các module thành các
tác nhân tự chủ có thể đưa ra quyết định thông minh của mình trong một loạt các
tình huống. Các tác tử này cho phép hệ thống phần lớn là tự quản, vì chúng có thể
được cung cấp kiến thức để ứng phó trong tình huống cụ thể, chứ không phải được
lập trình một cách rõ ràng để xử lý mọi tình huống có thể dự đoán.
Lưu ý rằng không phải tất cả các tác tử đều là thông minh, định nghĩa cho một tác
tử: “Một tác tử là một hệ thống máy tính được đóng gói đặt trong một số môi
trường, và có khả năng linh hoạt, hành động tự chủ trong môi trường đó để đáp
ứng các mục tiêu thiết kế của nó”.
Từ định nghĩa này, chúng ta có thể thấy rằng ba đặc điểm chính của một tác tử là
được quyền tự chủ, bền bỉ và khả năng tương tác với môi trường của nó. Tự chủ
đề cập đến khả năng của một tác tử đưa ra quyết định riêng của mình dựa trên kinh
nghiệm và hoàn cảnh riêng của mình, và để kiểm soát trạng thái bên trong của
mình và hành vi. Định nghĩa hàm ý rằng những chức năng của tác tử bền bỉ trong
môi trường của nó, nghĩa là, nó là bền bỉ theo thời gian. Tác tử cũng được đặt vào
một tình thế, tức là, chúng đáp ứng các nhu cầu của môi trường và có khả năng
làm theo điều đó. Tương tác với môi trường vật lý đòi hỏi phải nhận thức thông
qua các bộ cảm biến, và hành động thông qua thiết bị truyền động hoặc cơ quan
tác động. Tương tác với một môi trường phần mềm hoàn toàn là đơn giản hơn, chỉ
cần truy cập và thao tác dữ liệu và các chương trình.
10
Sự thông minh có thể được thêm vào một mức độ nhiều hay ít, nhưng chúng ta
có thể mong đợi một cách hợp lý các tác tử thông minh làm được tất cả những

điều sau đây:
• Phản ứng
• Hướng đích
• Khả năng tương thích (thích ứng)
• Khả năng xã hội
Khả năng xã hội đề cập đến khả năng hợp tác và thỏa thuận với các tác tử
(hoặc con người). Thật đơn giản để mường tượng ra tác tử có phản ứng một cách
thuần túy, ví dụ, một người có vai trò duy nhất là đặt một cảnh báo trên màn hình
máy tính của bạn khi máy in đã hết giấy. Tương tự như vậy, mô-đun mã máy tính
thông thường có thể được coi là hướng mục tiêu trong ý nghĩa hạn chế mà nó đã
được lập trình để thực hiện một nhiệm vụ cụ thể không phụ thuộc môi trường của
nó. Vì nó là tự chủ, tác tử thông minh có thể quyết định những mục tiêu riêng của
mình và chọn các hành động của mình trong việc theo đuổi những mục tiêu. Đồng
thời, nó cũng phải có khả năng thích ứng với những thay đổi bất ngờ trong môi
trường của nó. Vì vậy phải có sự cân bằng giữa phản ứng và hành vi hướng đích
điển hình thông qua giải quyết vấn đề hỗn hợp như lập kế hoạch, tìm kiếm, ra
quyết định, học thông qua kinh nghiệm.
Không có lý do gì để các tác tử nên duy trì trên một máy tính đơn. Nếu một
máy tính được kết nối mạng, một tác tử di động có thể đi đến các máy tính từ xa
để thực hiện nhiệm vụ được chỉ định của nó trước khi trở về với nhiệm vụ hoàn
thành. Một nhiệm vụ điển hình cho một tác tử di động có thể là để xác định kế
hoạch du lịch của một người. Điều này đòi hỏi thông tin về xe lửa và lịch trình
hàng không, cùng tính sẵn sàng của khách sạn. Thay vì chuyển một lượng lớn dữ
liệu qua mạng từ các công ty xe lửa, các hãng hàng không, khách sạn, nó hiệu quả
hơn cho các tác tử chuyển chính nó đến các trang web từ xa, tìm thông tin cần
thiết, và ngược lại. Rõ ràng, có tiềm năng tác tử di động có thể là những ứng dụng
11
độc hại, do đó an ninh mạng là một vấn đề cần xem xét chính cho các trang web
chấp nhận chúng.
2.1.2. Đặc điểm của tác tử

Một tác tử thông thường có những đặc điểm sau:
o Tính phản xạ: Tác tử có khả năng phản xạ kịp thời với các thay đổi trong môi
trường mà tác tử cảm nhận được.
o Tính chủ động (hành động có mục đích): không chỉ phản xạ, tác tử còn phải
biết chủ động tìm kiếm khả năng hành động hướng tới thực hiện mục tiêu
được giao.
o Tính cộng đồng: Tác tử có khả năng tương tác với người dùng hoặc các tác tử
khác để thực hiện nhiệm vụ của riêng mình hoặc để giúp đỡ các đối tác.
o Khả năng tự học: Tự học hoặc học tự động là khả năng của tác tử thu thập
các kiến thức mới từ kinh nghiệm thu lượm được, chẳng hạn qua các lần
thành công và thất bại. Kết quả tự học phải làm cho các tác tử hành động tốt
hơn, hiệu quả hơn.
o Tính thích nghi: Thích nghi là khả năng của tác tử tồn tại và hoạt động hiệu
quả khi môi trường thay đổi. Mặc dù có nhiều nét liên quan với tính phản xạ,
khả năng thích nghi của tác tử khó thực hiện và đòi hỏi nhiều thay đổi trong
quá trình suy diễn của tác tử hơn. Tính thích nghi có thể thực hiện nhờ khả
năng tự học từ kinh nghiệm của tác tử.
o Khả năng di chuyển: Là khả năng của tác tử (phần mềm) di chuyển giữa các
máy tính hoặc các nút khác nhau trong mạng đồng thời giữ nguyên trạng thái
và khả năng hoạt động của mình. Các tác tử có đặc điểm này được gọi là tác
tử di động. Việc thiết kế và cài đặt tác tử di động đặt ra các yêu cầu đặc biệt
về vấn đề an ninh hệ thống.
2.2. Tác tử và môi trường
Một tác tử là bất cứ điều gì có thể nhận thức được môi trường của mình thông qua
cảm biến và tác động lại với môi trường thông qua các bộ kích hoạt.
12
Ý tưởng đơn giản này được minh họa trong hình 1. Một tác tử của con người có
mắt, tai, và các cơ quan khác cho các cảm biến và tay, chân, miệng, và các bộ
phận khác của cơ thể cho các thiết bị. Một tác tử robot có thể có máy ảnh và hồng
ngoại phạm vi tìm kiếm cho cảm biến và động cơ khác nhau thiết bị truyền động.

Một tác tử phần mềm nhận tổ hợp phím, nội dung tập tin, và các gói tin mạng như
đầu vào cảm biến và hành vi đối với môi trường bằng cách hiển thị trên màn hình,
tập tin văn bản, và gửi các gói tin mạng. Giả định chung rằng mỗi tác tử có thể
cảm nhận được hành động của mình (nhưng không phải luôn luôn chính xác).
Theo [1] sử dụng tên gọi percept (chuỗi cảm nhận) để đề cập đến yếu tố đầu vào
giác quan của tác tử tại bất kỳ thời điểm hiện tại. Trình tự percept của một tác tử là
toàn bộ lịch sử về mọi thứ mà tác tử đó đã từng nhận được. Nhìn chung, sự lựa
chọn hành động của một tác tử tại thời điểm tức thời được đưa ra có thể phụ thuộc
vào toàn bộ chuỗi percept được quan sát cho đến hiện tại.
Hình 1: Tác tử tương tác với môi trường thông qua bộ cảm biến và bộ truyền động
2.2.1 Hàm tác tử
Hàm tác tử là hàm ánh xạ từ lịch sử nhận thức đến hành động f:
Theo toán học, hành vi của các tác tử được mô tả như các hàm của tác tử được ánh
xạ bởi trình tự percept đưa ra để hành động.
Chúng ta có thể tưởng tượng lập bảng hàm tác tử mô tả cho bất kỳ tác tử nào, đối
với hầu hết các tác tử đây sẽ là một bảng lớn vô hạn, trong thực tế, trừ khi chúng
ta đặt một ràng buộc về độ dài của chuỗi percept chúng ta muốn xem xét. Cho một
tác tử thử nghiệm, chúng ta có thể trên nguyên tắc, xây dựng bảng này bằng cách
13
cố gắng chỉ ra tất cả các chuỗi percept có thể và ghi lại những hành động mà tác tử
không đáp ứng và tất nhiên, đó là một đặc điểm bên ngoài của tác tử.
2.2.2 Chương trình tác tử
Là chương trình hoạt động (chạy) trên kiến trúc thực tế của hàm f
Bên trong, hàm tác tử của tác tử nhân tạo sẽ được thực hiện bởi một chương trình
tác tử.
Điều quan trọng là phân biệt 2 khái niệm hàm tác tử và chương trình tác tử. Hàm
tác tử là một mô tả toán học trừu tượng, còn các chương trình tác tử là một thực
hiện cụ thể, chạy trên kiến trúc tác tử.
Để minh họa cho vấn đề trên, [1] sử dụng một ví dụ, rất đơn giản thế giới máy hút
bụi thể hiện trong hình 2. Thế giới này rất đơn giản mà chúng ta có thể mô tả tất cả

mọi thứ xảy ra, nó còn là một thế giới hư cấu, vì vậy chúng ta có thể phát minh ra
nhiều biến thể. Thế giới đặc biệt này chỉ có hai địa điểm: hình vuông A và B. Các
tác tử chân không nhận thức nó đang ở hình vuông nào và việc có bụi bẩn trong
hình vuông đó không. Nó có thể chọn để di chuyển trái, di chuyển phải, hút bụi
bẩn, hoặc không làm gì. Một chức năng tác tử rất đơn giản như sau: nếu hình
vuông hiện tại là bẩn, thì hút bẩn, nếu không có bụi bẩn thì chuyển sang hình
vuông khác.
Một phần của hàm tác tử này được thể hiện trong bảng 1.
Hình 2: Thế giới của máy hút bụi chỉ có 2 vị trí
14
Chuỗi các nhận thức Hành động
[A, sạch] Sang phải
[A, bẩn] Hút bụi
[B, sạch] Sang trái
[B, bẩn] Hút bụi
[A, sạch],[A, sạch] Sang phải
[A, sạch],[A, bẩn] Hút bụi
[A, sạch],[A, sạch],[A, sạch] Sang phải
[A, sạch],[A, sạch],[A, bẩn] Hút bụi
Bảng 1 Bảng hàm tác tử đơn giản hút bụi thông minh của thế giới máy hút bụi như trong hình 2
Hàm tác tử tương ứng:
2.3 Tính hợp lý – các tác tử hợp lý
2.3.1 Các tác tử hợp lý
Một tác tử hợp lý là một tác tử thực hiện điều đúng – tất cả các mục trong bảng
chức năng tác tử được điền đầy đủ chính xác. Rõ ràng, làm đúng thì tốt hơn so với
làm điều sai, nhưng làm điều gì là đúng? Một cách tương đối, chúng ta nói rằng
các hành động đúng là những hành động sẽ tạo nên các tác tử thành công nhất. Vì
vậy, chúng ta cần một số cách để đo lường sự thành công. Cùng với các mô tả về
môi trường và các cảm biến và cơ cấu truyền động tác tử, điều này sẽ cung cấp
một đặc tả đầy đủ về nhiệm vụ phải đối mặt của các tác tử. Thông qua đó, chúng

ta có thể xác định chính xác hơn những gì có nghĩa là hợp lý.
15
2.3.2 Độ đo hiệu suất
Độ đo hiệu suất thể hiện các tiêu chuẩn cho sự thành công của hành vi của một tác
tử. Khi một tác tử được đặt vào trong một môi trường, nó sẽ tạo ra một chuỗi các
hành động theo percepts nó nhận được. Chuỗi hành động này làm cho môi trường
phải trải qua một chuỗi các trạng thái Nếu trình tự là mong muốn, thì các tác tử đã
thực hiện tốt. Rõ ràng, một độ đo hiệu suất không phải luôn phù hợp cho tất cả các
tác tử. Chúng ta có thể yêu cầu tác tử cho một ý kiến chủ quan trong khi thực hiện
nhiệm vụ của mình, nhưng một số tác tử sẽ không thể đáp ứng. Vì vậy, một biện
pháp thực hiện mục tiêu, thường là một sự áp đặt bởi các nhà thiết kế đang xây
dựng các tác tử.
Trong thực tế để lựa chọn hành động hợp lý cho tác tử không phải là đơn giản,
theo nguyên tắc chung, tốt hơn hết thiết kế các độ đo hiệu suất theo những gì
chúng ta thực sự muốn trong môi trường, chứ không phải theo cách người ta nghĩ
rằng tác tử phải hành xử. Ta có thể hình dung: trong cùng một thời gian qui định, 2
tác tử thực hiện cùng một nhiệm vụ (một mục tiêu công việc) nhưng với 2 cách
khác nhau – một tác tử thực hiện bình thường suốt thời gian, một tác tử thực hiện
hăng hái nhưng cần có thời gian nghỉ ngơi lâu chúng ta sẽ chọn cách nào? Thật
vậy, đây là một câu hỏi rất khó để trả lời tương tự như trong triết học những câu
hỏi có dạng như: một nền kinh tế mà mọi người có cuộc sống trung bình so với
nền kinh tế có người rất giàu và người rất nghèo thì cái nào tốt hơn?
Tính hợp lý
Cái gọi là hợp lý luôn phụ thuộc vào bốn điều sau:
- Độ đo hiệu suất xác định các tiêu chí của thành công.
- Kiến thức môi trường mà các tác tử có trước.
- Hành động của các tác tử có thể thực hiện.
- Trình tự percept của tác tử.
Điều này dẫn đến một định nghĩa của một tác tử hợp lý:
16

Đối với mỗi trình tự percept có thể, một tác tử hợp lý nên chọn một hành động mà
dự kiến sẽ phát huy tối đa hiệu suất hiệu quả của nó, những gì được cung cấp bởi
các trình tự percept và bất cứ kiến thức nội tại nào mà tác tử có được.
Xem xét các tác tử hút bụi thông minh đơn giản là làm sạch một hình vuông nếu
hình đó bẩn và di chuyển đến hình khác nếu nó không bẩn, đây là chức năng được
trình bày trong hình 3. Đây có phải là một tác tử hợp lý? Điều đó còn phụ thuộc
vào nhiều vấn đề! biện pháp hiệu quả là gì? những gì được biết về môi trường, và
những gì mà các cảm biến và cơ cấu truyền động mà các tác tử có? Ta có những
giả định sau đây:
- Các biện pháp thực hiện: tặng một điểm thưởng cho mỗi hình vuông sạch tại
mỗi bước, trong một "vòng đời" của khoảng 1000 bước thời gian.
- Các "địa lý" của môi trường được biết đến như một dự đoán (hình 1), nhưng
không có sự phân bố bẩn và vị trí ban đầu của các tác tử. Các hành động trái và
phải là di chuyển các tác tử sang trái và phải.
- Chỉ có sẵn các hành động: trái, phải, xúc, và noop (không làm gì cả).
- Tác tử nhận thức đúng vị trí của nó và có vị trí đó có chứa bụi bẩn.
Trong những trường hợp các tác tử là thực sự hợp lý, hiệu suất dự kiến của các tác
tử khác nhau là như nhau. Người ta có thể dễ dàng nhìn thấy rằng các tác tử giống
nhau nhưng sẽ không hợp lý trong hoàn cảnh, tình huống khác nhau. Ví dụ, một
khi tất cả các chất bẩn được làm sạch nó sẽ di chuyển không cần thiết qua lại, nếu
các biện pháp thực hiện bao gồm một hình phạt là trừ một điểm cho mỗi chuyển
động sang trái hoặc phải, thì kết quả của các tác tử sẽ có hiệu suất sẽ kém. Một tác
tử tốt hơn cho trường hợp này sẽ không phải làm gì một khi nó được đảm bảo rằng
tất cả các hình vuông đều sạch. Nếu hình vuông sạch có thể bị bẩn trở lại, các tác
tử thỉnh thoảng nên kiểm tra và lại làm sạch chúng nếu cần thiết.
Chúng ta cần phân biệt tính hợp lý của tác tử và tính thông suốt (omniscience).
Một tác tử thông suốt biết được kết quả thực tế hành động của mình và hành động
hợp lý – nhưng thực tế tác tử thông suốt là không khả thi. Tính hợp lý không có
nghĩa là hoàn hảo. Tính hợp lý là tối đa hóa khả năng thực hiện được mong đợi.
17

Tính hoàn hảo là tối đa hóa khả năng thực hiện trên thực tế. Vấn đề là mong muốn
tác tử đó thực hiện tốt nhất hành động của mình sau những gì xảy ra trong thực tế -
điều này là không thể. Thật vậy ta không thể đáp ứng những đặc điểm kỹ thuật này
khi thiết kế các tác tử.
Trong định nghĩa tính hợp lý của tác tử ta không cần đòi hỏi sự thông suốt bởi vì
sự lựa chọn của tính hợp lý phụ thuộc vào trình tự percept đã được xác định. Ta
cũng phải đảm bảo rằng tác tử không được vô tình thực hiện những quyết định
“kém thông minh” ví dụ như nếu một tác tử không quan sát cả 2 hướng trước khi
băng qua đường đông đúc, khi đó trong trình tự percept của nó không chỉ ra rằng
có một xe tải đang hướng đến với một tốc độ cao. Sự định nghĩa về tính hợp lý có
nói rằng bây giờ là “OK” băng qua đường được không? Hơn thế nữa! đầu tiên sẽ
là không hợp lý nếu băng qua đường trong tình trạng trình tự percept thiếu thông
tin này bởi vì nguy cơ tai nạn nghiêm trọng sẽ xảy ra cho việc qua đường mà
không quan sát là quá lớn. Thứ hai, một tác tử hợp lý nên chọn hành động “quan
sát” trước khi bước xuống đường là một hành động để tối đa hóa hiệu suất mong
đợi. Thực hiện những hành động để điều chỉnh trình tự percept trong tương lai đôi
khi còn được gọi là thu thập thông tin – đây là phần quan trọng của tính hợp lý. Ví
dụ thứ 2 thể hiện hành động thu thập thông tin là một tác tử vacuum – cleaner
trong hình 1, phải thực hiện hành động “thăm dò” trong môi trường ban đầu không
rõ có bẩn hay không, “thăm dò” có bẩn lại sau khi đã dọn sạch không?
Định nghĩa một tác tử hợp lý không những đòi hỏi phải thu thập thông tin mà còn
tìm hiểu càng nhiều càng tốt những gì nó cảm nhận được. Cấu hình ban đầu của
tác tử có thể có tri thức tiên nghiệm về môi trường, nhưng khi nó thu được thêm
những kinh nghiệm thì điều này có thể thay đổi và bổ sung.
Tác tử thành công chia nhiệm vụ tính toán các chức năng tác tử thành ba giai đoạn
khác nhau: khi các tác tử đang được thiết kế, một số các tính toán được thực hiện
bởi nhà thiết kế của nó, khi nó cân nhắc về hành động tiếp theo của nó thì tác tử
18
thực hiện tính toán nhiều hơn, và khi nó học hỏi từ kinh nghiệm, nó thậm chí tính
toán nhiều hơn nữa để quyết định làm thế nào thay đổi hành vi của mình.

Nếu một tác tử chỉ dựa trên tri thức được cung cấp khi thiết kế thì tác tử đó không
có tính tự chủ. Một tác tử hợp lý cần phải có tính tự chủ thì phải học để bổ sung
hoặc điều chỉnh tri thức dự đoán không chính xác. Ví dụ một tác tử vacuum –
cleaner phải học để dự đoán mình đang ở đâu, và khi nào thì có bụi bẩn xuất hiện?
thì sẽ hiệu suất thực hiện sẽ tốt hơn nếu không học. Và dĩ nhiên trong thực tế
không yêu cầu tính tự chủ hoàn toàn ngay ban đầu, khi tác tử có ít hoặc không có
kinh nghiệm thì nó phải thực hiện hành động ngẫu nhiên từ đó rút ra kinh nghiệm
nếu không nó phải có sự trợ giúp của nhà thiết kế nó. Giống như động vật, nhờ
quá trình tiến hóa mà nó có được đầy đủ những phản xạ để sinh tồn. Quá trình tiến
hóa là quá trình sống và học hỏi để thay đổi. Do đó, một tác tử thông minh nhân
tạo phải được cung cấp một tri thức ban đầu cùng với khả năng học hỏi một cách
hợp lý. Khi có đủ kinh nghiệm về môi trường của nó, hành vi của một tác tử hợp
lý có thể trở nên hiệu quả hơn độc lập với những tri thức có trước của nó. Do đó,
kết hợp việc học hỏi, cho phép ta thiết kế một tác tử duy nhất hoạt động hiệu quả
trong nhiều môi trường phức tạp khác nhau.
2.4 Môi trường công việc
Môi trường nhiệm vụ của một tác tử có thể nói bao gồm các thành phần: đo hiệu
suất, môi trường, bộ phận truyền động và bộ cảm biến của tác tử. Cụm từ dùng để
đại diện cho môi trường nhiệm vụ là PEAS(Performance, Environment, Actuators,
Sensors).
Để thiết kế một tác tử, đầu tiên phải xác định một môi trường nhiệm vụ đầy đủ
nhất có thể.
2.4.1. Xác định môi trường công việc
Xét ví dụ về PEAS của một tài xế taxi tự động. Tài xế taxi tự động là một vấn đề
phức tạp và hiện đang nằm ngoài khả năng công nghệ hiện có và tài xế taxi tự
19
động àn toàn là một vấn đề mở. Không có giới hạn cho sự kết hợp các tình huống
mới lạ phát sinh.
Bảng sau đây mô tả môi trường nhiệm vụ (PEAS) của tác tử tài xế tự động
Loại

tác tử
Performance
measure
Environment Actuators Sensors
Tài xế
taxi
An toàn, nhanh,
hợp lý, chuyến
đi thoải mái, tối
đa hóa lợi nhuận
Đường xá,
phương tiện giao
thông khác, người
đi bộ, khách hàng
Thiết bị lái,
chân ga,
phanh, tín
hiệu, kèn,
màn hình
hiển thị…
Máy quay, sóng
siêu âm, đồng hồ
tốc độ, GPS,
đồng hồ đo cây
số, đồng hồ đo
gia tốc, cảm biến
động cơ, bàn
phím…
Bảng 2 Môi trường nhiệm vụ của tài xế taxi tự động
 Xác định hiệu suất: ta mong muốn tài xế tự động sẽ làm được những gì?

Đó là đến đích chính xác, giảm thiểu tiêu thụ nhiên liệu và hao mòn, giảm
thiểu thời gian chuyến đi và / hoặc chi phí, giảm thiểu hành vi vi phạm luật
giao thông và nhiễu loạn các tài xế khác, tối đa hóa an toàn và tiện nghi
hành khách, tối đa hóa lợi nhuận. Rõ ràng, một số trong những mục tiêu đó
xung đột, như vậy giữa các mục tiêu đó cần có một sự cân bằng tương đối.
 Xác định môi trường: môi trường lái xe mà xe taxi sẽ phải đối mặt là gì?
Bất kỳ tài xế taxi nào cũng phải đối phó với nhiều loại đường xá khác nhau,
từ đường nông thôn và ngõ hẻm, đô thị, đường cao tốc nhiều làn xe. Các
tuyến đường có lưu lượng người tham gia giao thông khác nhau, người đi
bộ, động vật đi lạc, công trình đường bộ, xe cảnh sát, vũng nước, và ổ gà.
Xe taxi cũng phải tương tác với các hành khách tiềm năng và thực tế. Ngoài
ra còn có một số lựa chọn tùy chọn…nếu môi trường càng phức tạp thì việc
thiết kế tác tử lái xe taxi tự động càng khó khăn và ngược lại.
 Bộ truyền động: Thiết bị truyền động (có thể nhiều hơn hoặc ít hơn so với
xe của tài xế con người): kiểm soát động cơ thông qua máy đo gia tốc và
kiểm soát lái và phanh. Ngoài ra, nó phải có màn hình hiển thị hoặc tổng
20
hợp giọng nói để nói lại cho hành khách – làm công cụ giao tiếp lịch sự với
hành khách và một số loại xe khác.
 Bộ cảm biến: Để đạt được mục tiêu của mình trong môi trường lái xe, xe
taxi sẽ cần phải biết nó ở đâu, có những gì khác đang trên đường, và làm
thế nào để nó đi nhanh. Do đó bộ cảm biến cơ bản của nó nên gồm: một
hoặc nhiều máy ảnh điều khiển TV, đồng hồ tốc độ, và đồng hồ đo cây số.
Để kiểm soát chiếc xe đúng cách, đặc biệt là trên các đường cong, nó cần
phải có máy đo gia tốc, nó cũng cần phải biết tình trạng cơ học của chiếc
xe, vì vậy nó sẽ cần những danh sách của động cơ thông dụng và cảm biến
hệ thống điện. Nó có thể có thêm các thiết bị mà không có sẵn cho người
lái: một hệ thống vệ tinh định vị toàn cầu (GPS) để cung cấp cho nó thông
tin vị trí chính xác đối với một bản đồ điện tử với, và cảm biến hồng ngoại
hoặc sóng siêu âm để phát hiện khoảng cách với các xe khác và chướng

ngại vật. Cuối cùng, nó sẽ cần một bàn phím hoặc microphone cho hành
khách yêu cầu điểm đến.
2.4.2. Tính chất của môi trường công việc
Phạm vi của các môi trường công việc có thể phát sinh trong AI rõ ràng là rộng
lớn. Tuy nhiên, ta có thể xác định một số khía cạnh mà môi trường công việc có
thể được phân loại. Các khía cạnh xác định, ở một mức độ lớn, thiết kế tác tử phù
hợp và khả năng áp dụng của chúng dựa trên nguyên tắc kỹ thuật để thực hiện
thiết kế tác tử. Sau đây là liệt kê các khía cạnh, sau đó phân tích nhiều môi trường
công việc để minh họa cho ý tưởng này:
 Quan sát đầy đủ hay quan sát một phần. Nếu cảm biến của một tác tử cho
nó tiếp cận với đầy đủ các trạng thái của môi trường tại từng thời điểm, thì
ta nói rằng môi trường công việc có thể quan sát đầy đủ. Một môi trường
công việc được quan sát đầy đủ một cách hiệu quả nếu các cảm biến phát
hiện tất cả các khía cạnh phù hợp với sự lựa chọn của hành động: sự phù
hợp lần lượt phụ thuộc vào hiệu suất thực hiện. Môi trường quan sát đầy đủ
21
thì thuận tiện bởi vì các tác tử không cần phải duy trì bất kỳ trạng thái nội
tại nào để theo dõi thế giới. Một môi trường có thể quan sát một phần là do
các cảm biến bị nhiễu và không chính xác hoặc vì một phần nào của trạng
thái bị thiếu từ các cảm biến dữ liệu, ví dụ, một tác tử chân không chỉ với
một cảm biến bụi bẩn cục bộ có thể không cho biết được bụi bẩn có trong
hình vuông khác, và một taxi tự động không thể nhìn thấy những gì tài xế
khác đang nghĩ.
 Xác định hay ngẫu nhiên. Nếu trạng thái tiếp theo của môi trường là hoàn
toàn xác định bởi trạng thái hiện tại và hành động được thực hiện bởi các
tác tử, thì ta nói rằng môi trường là xác định, ngược lại nó là ngẫu nhiên.
Về nguyên tắc, một tác tử không cần phải quan tâm về tính bất định của
quan sát đầy đủ, môi trường xác định. Nếu môi trường có thể được quan
sát một phần, sau đó nó có thể có xuất hiện ngẫu nhiên. Điều này đặc biệt
đúng nếu các môi trường phức tạp, gây khó khăn trong việc theo dõi tất cả

các khía cạnh không quan sát được. Do đó, tốt hơn hết là nghĩ về một môi
trường như xác định hoặc ngẫu nhiên từ quan điểm của các tác tử.
Ví dụ lái taxi rõ ràng là ngẫu nhiên trong ý nghĩa này, bởi vì ta không bao
giờ có thể dự đoán chính xác những hành vi giao thông, hơn nữa, một là nổ
lốp xe và kẹt máy mà không có cảnh báo. Trong thế giới chân không (trong
ví dụ hình 2) như ta mô tả nó là xác định, nhưng biến thể có thể bao gồm
các yếu tố ngẫu nhiên như ngẫu nhiên xuất hiện bụi bẩn và một cơ chế hút
không đáng tin cậy. Nếu môi trường là xác định trừ các hành động của các
tác tử khác, chúng ta nói rằng môi trường là chiến lược.
 Phân đọan hay tuần tự: trong một môi trường công việc chia đoạn, kinh
nghiệm của tác tử được chia thành đoạn nguyên tử. Mỗi đoạn bao gồm các
công việc là tác tử nhận thức và sau đó thực hiện một hành động duy nhất.
Điều quan trọng là đoạn tiếp theo không phụ thuộc vào các hành động
trong đoạn trước đó. Trong môi trường chia đoạn, lựa chọn hành động
trong mỗi đoạn chỉ phụ thuộc vào chính đoạn đó. Nhiều nhiệm vụ phân
22
loại được chia đoạn. Ví dụ, một tác tử có để phát hiện bộ phận bị lỗi trên
một dây chuyền lắp ráp căn cứ mỗi quyết định trên một phần hiện tại, bất
kể quyết định trước đây, hơn nữa, quyết định hiện tại không ảnh hưởng đến
việc xác định liệu các phần tiếp theo có bị lỗi hay không. Trong môi
trường tuần tự, các quyết định hiện tại có thể ảnh hưởng đến tất cả các
quyết định tương lai. Như chơi cờ vua và lái xe taxi là tuần tự: trong cả hai
trường hợp, hành động ngắn hạn có thể có hậu quả lâu dài. Môi trường
chia nhiều đoạn là đơn giản hơn nhiều so với các môi trường tuần tự bởi vì
các tác tử không cần phải suy nghĩ trước.
 Tĩnh hay động: Nếu môi trường có thể thay đổi trong khi một tác tử đang
cân nhắc tính toán, thì ta nói môi trường đó là động đối với các tác tử,
ngược lại nó là tĩnh. Môi trường tĩnh là dễ dàng để đối phó vì các tác tử
không cần phải tiếp tục tìm kiếm ở thế giới trong khi nó được quyết định
một hành động, cũng không cần lo lắng về thời gian. Môi trường động

đang tiếp tục yêu cầu các tác tử những gì nó muốn làm, nếu nó vẫn chưa
quyết định,ngay cả khi quyết định không làm gì. Nếu môi trường tự nó
không thay đổi với thời gian nhưng hiệu suất mà tác tử phải đạt được là
thay đổi (tác tử cần phải ghi nhiều điểm số trong quá trình thực hiện nhiệm
vụ), thì ta nói rằng môi trường là bán động. Lái taxi rõ ràng là động: những
chiếc xe khác và xe taxi tự nó tiếp tục di chuyển trong khi thuật toán lái xe
đang tính toán phải làm gì tiếp theo. Còn khi chơi cờ vua bấm giờ thì là
nửa động. Trò chơi câu đố ô chữ là tĩnh.
 Rời rạc so với liên tục. Sự phân biệt rời rạc và liên tục có thể được áp
dụng trên tình trạng của môi trường, cách xử lý thời gian, và các percepts
và hành động của các tác tử. Ví dụ, một môi trường rời rạc như một trò
chơi cờ vua có một số hữu hạn của các trạng thái khác nhau. Cờ vua cũng
có một tập hợp rời rạc các percepts và hành động. Lái xe taxi là liên tục.
Dữ liệu vào máy ảnh kỹ thuật số là rời rạc
23
 Đơn tác tử hay đa tác tử: trong môi trường, có một hay nhiều tác tử cùng
hoạt động? Ví dụ: trò chơi ô chữ là đơn tác tử. Tác tử chơi cờ vua là đa tác
tử (đối thủ là một tác tử khác). Lái taxi là đa tác tử…
Tóm lại: môi trường công việc có một số tính chất sau:
- Tính quan sát được: đầy đủ - bộ phận
- Tính xác định được: trạng thái tiếp theo của môi trường có thể hoàn toàn xác
định được dựa trên trạng thái hiện tại và hành động thực hiện bởi tác tử hay
không?
- Tính chia đoạn hay tuần tự: chia nhiệm vụ thành nhiều giai đoạn và mỗi giai
đoạn thực hiện độc lập với nhau hay phải thực hiện tuần tự các giai đoạn?
- Tính động: môi trường là tĩnh tại hay thay đổi trong khi tác tử hoạt động?
- Tính liên tục hay rời rạc: các cảm nhận hoặc hành vi có được phân biệt một
cách rõ ràng không?
- Đơn tác tử hay đa tác tử: trong môi trường, có một hay nhiều tác tử cùng hoạt
động (hợp tác hoặc cạnh tranh) không?

Kiểu của môi trường có ảnh hưởng quyết định đối với việc thiết kế tác tử tác tử và
môi trường trong thực tế thường có các đặc điểm: chỉ có thể quan sát được một
phần, ngẫu nhiên, liên tiếp, thayđổi(động), liên tục, đa tác tử.
2.5 Kiến trúc của tác tử
Tác tử = kiến trúc + chương trình
Chương trình tác tử phải phù hợp với kiến trúc. Kiến trúc làm cho chuỗi cảm nhận
từ bộ cảm biến đến chương trình, thực hiện chương trình, cung cấp lựa chọn hành
động của chương trình đến bộ phận truyền động. Chương trình tác tử có dữ liệu
vào là cảm nhận hiện tại từ bộ cảm biến và dữ liệu ra là hành động được trả về cho
bộ phận truyền động.
Ví dụ mã giả một chương trình tác tử phản xạ đơn giản cho môi trường chân
không có 2 trạng thái trong ví dụ hình 1 như sau:
Function Reflex_Vacuum_Agent([location, status]) returns an action
24
If status = Dirty then return Suck
Else if location =A then return Right
Else if location =B then return Left
2.5.3 Phân loại kiến trúc tác tử
Dựa vào đặc điểm của hàm tác tử, ánh xạ dãy cảm nhận tới hành động tương ứng,
chia tác tử thành 4 loại: Tác tử phản xạ đơn giản, tác tử phản xạ có trạng thái, tác
tử hướng mục đích, tác tử hướng lợi ích
2.5.3.1 Tác tử phản xạ đơn giản
Hình 3: Lược đồ mô hình tác tử phản xạ đơn giản
Tác tử phản xạ đơn giản hành động theo một qui tắc (luật) có điều kiện phù hợp
với trạng thái hiện tại của môi trường
25
function SIMPLE-REFLEX-AGENT(percept)
static: rules (tập các luật có dạng: điềukiện-hành động)
state INTERPRET-INPUT(percept)
rule RULE-MATCH(state,rules)

action RULE-ACTION[rule]
return action

×