Tải bản đầy đủ (.pdf) (30 trang)

Môn học trí tuệ nhân tạo tiểu luận đề tài tìm hiểu về đạo văn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.14 MB, 30 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b>BỘ GIÁO DỤC VÀ ĐÀO TẠO</b>

<b>TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM</b>

<b> MÔN HỌC: TRÍ TUỆ NHÂN TẠO</b>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<i><b>Chúng em xin cam đoan đồ án này do các thành viên trong nhóm thực hiện.Chúng em khơng sao chép, sử dụng bất kỳ tài liệu, mã nguồn… của người khácmà không ghi nguồn. Chúng em xin chịu hoàn toàn trách nhiệm nếu vi phạm</b></i>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

2.2 Machine learning(học máy)...2

2.3 Deep learning(học sâu)...2

2.4 Ethics and Laws...3

2.5 Các hướng tiếp cận AI:...5

2.6 Nền tảng của AI:...5

2.7 Lịch sử AI:...5

Chương 3 : TÌM HIỂU VỀ CÁC THUẬT TỐN...6

3.1 CONCEPTUAL ALGORITHM...6

3.1.1 Thuật tốn Tree-Search...6

3.1.2 Thuật toán Graph -Search...7

3.2 Uninformed Search (Blind Search)...8

3.2.1 Breath-first-search...8

3.2.2 Depth – first- search (DFS)...9

3.2.3 Uniform – cost search...10

3.2.4 Depth-Limited search...11

3.2.5 Iterative deepening search...12

3.3 Informed Search Algorithms...13

3.3.1 Best-First Search...13

3.3.2 A* Search...14

3.4 SEARCHING IN MORE COMPLEX ENVIROMENTS...15

3.4.1 LOCAL SEARCH- SEARCHING FOR GOAL STATE...15

3.4.2 Hill-Climbing Search...16

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

3.4.3 Simulated annealing algorithm...18

3.5 SEARCHING IN NONDETERMINISTIC ENVIRONMENTS...18

3.6 Searching in non-fully-observable Environments...19

3.7 Searching with no observation (agent khơng có bất kỳ thơng tin nào về môi trường). .20 3.8 Searching for partially observable problems...20

3.9 SEARCHING WITH NO TRANSITION MODEL – ONLINE SEARCH...21

3.9.1 Online depth-first search agent...22

3.9.2 Online A* search: LRTA* (Learning Real-Time A*) algorithm...23

3.10 Constraint satisfaction problems (CSP)...23

3.11 Solve CSPs using Constraint Propagation...24

3.12 AC-3 alorgithm...25

TÀI LIỆU THAM KHẢO...26

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<b>Chương 1: Tìm hiểu về đạo văn1.1 Khái niệm</b>

<b>Đạo văn (tiếng Anh: </b>plagiarism) là chiếm hữu một cách sai trái, ăn cắp, công bố ngôn ngữ, suy nghĩ, ý tưởng, hay cách diễn đạt của người khác và xem chúng như

Trộn thông tin từ các nguồn khác nhau;

Viết và sử dụng các từ và cụm từ từ nhiều nguồn và ghép chúng lại với nhau trong câu mới;

Khơng trích dẫn đúng tài liệu nguồn;

Khơng xin phép ai đó khi bạn sử dụng câu từ của họ trong sản phẩm của bạn;

Khơng trích dẫn chính xác nội dung của bạn nếu bạn đã sử dụng nó trong một ngữ cảnh khác.<small>2</small>

<b>1.3 Hậu quả của đạo văn</b>

Bị kết tội đạo văn, dù cố ý hay vơ ý, đều có tác dụng lâu dài và thậm chí có thể ảnh hưởng đến khả năng xuất bản một cơng trình nghiên cứu.của người nghiên cứu. Hậu quả của đạo văn bao gồm bị đánh rớt về điểm số, quản chế học tập, lưu vết trên hồ sơ cá nhân vĩnh viễn. Hậu quả tồi tệ nhất là bị đuổi khỏi Trường hoặc bị sa thải trong công việc.<small>3</small>

<small>1 “ Đ o văn ạ”, Đ o văn ”, htps://lib.tdtu.edu.vn/vi/huong-dan/dao-vanạ3</small>

<small>1</small>

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<b>1.4 Cách phòng tránh đạo văn</b>

Cách tốt nhất để tránh việc đạo văn là hãy trích dẫn nguồn tham khảo một cách chính xác hoặc có thể tự viết ý tưởng của riêng mình, khơng sử dụng nội dung của người khác hay nội dung có sẵn trên Internet.

<b>Chương 2: Tìm hiểu về Trí tuệ nhân tạo2.1 Khái niệm</b>

Trong khoa học máy tính, trí tuệ nhân tạo hay AI (tiếng Anh: artificial intelligence), đơi khi được gọi là trí thơng minh nhân tạo, là trí thơng minh được thể hiện bằng máy móc, trái ngược với trí thơng minh tự nhiên của con người. Thơng thường, thuật ngữ "trí tuệ nhân tạo" thường được sử dụng để mô tả các máy móc (hoặc máy tính) có khả năng bắt chước các chức năng "nhận thức" mà con người thường phải liên kết với tâm trí, như "học tập" và "giải quyết vấn đề".<small>4</small> Cách hoạt động: ban đầu agent (đối tượng) sẽ tác động lên environment (môi trường) thơng qua actions (các hành động), sau đó environment sẽ trả về cho agents là percepts/observations (các quan sát). Với mỗi action với môi trường, agent sẽ thu về percepts/observations thông qua sensors, các percepts tập hợp lại thành 1 chuỗi gọi là percepts sequence.

<b>2.2 Machine learning(học máy)</b>

Machine learning (ML) hay máy học là một nhánh của trí tuệ nhân tạo (AI), nó là một lĩnh vực nghiên cứu cho phép máy tính có khả năng cải thiện chính bản thân chúng dựa trên dữ liệu mẫu (training data) hoặc dựa vào kinh nghiệm (những gì đã được học). Machine learning có thể tự dự đốn hoặc đưa ra quyết định mà khơng cần được lập trình cụ thể.<small>5</small>

Phân loại machine learning:

Supervised learning: học có giám sát Unsupervised learning: học không giám sát

<b>2.3 Deep learning(học sâu)</b>

Deep Learning là tập hợp con của Machine Learning và nó có tác dụng hỗ trợ cho máy tính tự huấn luyện chính nó để có thể thực hiện mọi tác vụ tương tự như con người. Điều này chính là giúp máy tính bắt chước con người cách học hỏi và suy nghĩ.

<small>4 “Trí tu nhân t o”, ệạ htps://vi.wikipedia.org/wiki/Trí_tu _nhân_t oệạ5 “Machine learning là gì?”, htps://topdev.vn/blog/machine-learning-la-gi/</small>

<small>2</small>

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

Các hệ thống của Deep Learning có khả năng cải thiện được những hiệu suất của chúng với quyền truy cập vào dữ liệu sẽ được nhiều hơn.

<b>2.4 Ethics and LawsEthics: </b>

- 3 vấn đề chính trong chuẩn đạo đức: Virtue ethics (đạo đức về đức hạnh), Deontology (đạo lý), consequentialism (hậu quả).

- Idiom: You reap what you sow (Gieo nhân nào gặt quả nấy)

- Một kết luận từ cơng trình nghiên cứu của Dr.Kim (Đại học Havard) về y tế lâm sàng cho rằng:

<i><b>“growing evidence suggests that volunteers reap health and well-being</b></i>

<i><b>benefits from their altruistic activities.”</b></i>

Dữ liệu được lấy từ 12.998 người tham gia Nghiên cứu Sức khỏe và Hưu trí -một mẫu lớn, đa dạng, có triển vọng và đại diện quốc gia cho cộng đồng những người trưởng thành ở Hoa Kỳ.

Trong thời gian theo dõi 4 năm, những người tham gia tình nguyện ≥ 100 giờ / năm (so với 0 giờ / năm) giảm nguy cơ tử vong và các hạn chế về chức năng thể chất, hoạt động thể chất cao hơn và kết quả tâm lý xã hội tốt hơn.<small>6</small>

Golden Rules: qui luật được mọi người trên thế giới xem là quy luật ngắn gọn nhất để mọi người có thể làm theo, noi theo, làm người gương mẫu.

<small>6 Kim, E. S., Whillans, A. V., Lee, M. T., Chen, Y., & VanderWeele, T. J. (2020). Volunteering and subsequent healthand well-being in older adults: an outcome-wide longitudinal approach. American Journal of Preventive Medicine</small>

<small>3</small>

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

Nguồn ảnh: Tom Zeller Jr., undark.org

- Luật lệ trong phân tích dữ liệu: statutory law (Luật quy định), common law (luật lệ thông thường), constitunional law (luật liên bang).

- Các luật chi phối dữ liệu:

Mỹ: privacy laws - luật riêng tư (HIPAA 1996, COPPA 1998, FACTA 2003), Negligence laws – luật về việc thiếu trách nhiệm, bất cẩn.

Liên minh Châu Âu: General Data Protection Regulation (GDPR), bao

Rule: xác định các luật, quy tắc áp dụng cho vấn đề Apply: phân tích vấn đề theo quy tắc

Conclusion: đưa ra kết luận pháp lý cho vấn đề

<b>2.5 Các hướng tiếp cận AI:</b>

Suy nghĩ giống con người (Thinking humanly) Suy nghĩ có lý trí (Thingking relationly) Hành động giống con người (Acting humanly)

Hành động có lý trí (Ating relationly: đưa ra 1 solution gồm một chuỗi các

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

- Neuroscience (khoa học thần kinh) - Psychology (vật lý)

- Linguistics (ngơn ngữ học)

- Computer engineering (kỹ thuật máy tính) - Control theory (thuyết kiểm soát)<small>8</small>

<b>2.7 Lịch sử AI:</b>

- Năm 1956, John McCarthy tổ chức hội nghị Dartmouth lần đầu tiên với sự tham gia của nhiều nhà khoa học trên thế giới. Hội nghị thảo luận về trí tuệ nhân tạo và lĩnh vực nghiên cứu mới ra đời. Mục đích của lĩnh vực này được tạo ra là phát triển các máy móc có thể mơ phỏng mọi khía cạnh của trí thơng minh.<small>9</small>

- Những năm 1980, do sự phát triển của nhiều cơng trình nghiên cứu, ngành AI bứt phá và ứng dụng nhiều trong lĩnh vực cơng nghiệp và tự động hố, tuy nhiên các tiến trình nghiên cứu bị chậm lại vì nhiều nguyên nhân, sự kỳ vọng vào công nghệ đã đem lại nỗi thất vọng quá lớn và sự quan tâm của mọi người đến AI cũng bị sụt giảm dần và AI bị lãng quên.

- Năm 1995, với sự bùng nổ của internet, nhu cầu của con người về intelligent agents (chatbots, search bots, …) ngày càng nhiều.

- Hiện tại, kho dữ liệu số mà con người tạo ra ngày càng lớn, ta có thể tạo ra những AI thơng minh có thể đạt tới human-level AI và sau này có thể tốt hơn.

<b> Chương 3 : TÌM HIỂU VỀ CÁC THUẬT TỐN 3.1 CONCEPTUAL ALGORITHM</b>

<b>3.1.1 Thuật tốn Tree-Search </b>

-Trong khoa học máy tính , cây tìm kiếm là một cấu trúc dữ liệu dạng cây được sử dụng để định vị các khóa cụ thể từ bên trong một tập hợp. Để một cây hoạt động như một cây tìm kiếm, khóa cho mỗi nút phải lớn hơn bất kỳ khóa nào trong cây con ở bên trái và nhỏ hơn bất kỳ khóa nào trong cây con ở bên phải.

Ưu điểm của cây tìm kiếm là thời gian tìm kiếm hiệu quả của chúng do cây được cân bằng hợp lý, nghĩa là các ở hai đầu có độ sâu tương đương. Các cấu trúc dữlá <small>8 To learn more: Section 1.2 of (Russell, 2016)</small>

<small>9 "LỊCH SỬ TRÍ TUỆ NHÂN TẠO (PHẦN 2)," Trí tuệ nhân tạo, 27/10/2019, class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

liệu cây tìm kiếm khác nhau tồn tại, một số cấu trúc trong số đó cũng cho phép chèn và xóa các phần tử một cách hiệu quả, mà các hoạt động sau đó phải duy trì sự cân bằng của cây.

Cây tìm kiếm thường được sử dụng để triển khai một mảng kết hợp . Thuật toán cây tìm kiếm sử dụng khóa từ cặp khóa giá trị để tìm một vị trí và sau đó ứng dụng lưu trữ tồn bộ cặp khóa-giá trị tại vị trí cụ thể đó<small>10</small>

- Giải thuật:

Ví dụ :

<small>Nguồn : “Binary search tree”, Thuật toán Graph -Search</b>

Đồ thị là cấu trúc dữ liệu rất hữu ích trong việc giải quyết nhiều thách thức tốn học quan trọng. Ví dụ cấu trúc liên kết mạng máy tính hoặc phân tích cấu trúc phân tử của các hợp chất hóa học. Chúng cũng được sử dụng trong giao thông thành phố hoặc lập kế hoạch tuyến đường và thậm chí trong ngôn ngữ của con người và ngữ pháp của họ. Tất cả các ứng dụng này đều có một thách thức chung là duyệt qua đồ thị bằng cách sử dụng các cạnh của chúng và đảm bảo rằng tất cả các nút của đồ thị <small>10 Black, Paul and Pieterse, Vreda (2005). "search tree". Dictionary of Algorithms and Data Structures, class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

đều được truy cập. Có hai phương pháp phổ biến được thiết lập để thực hiện việc chuyển tải này được mô tả bên dưới.

Mơ tả thuật tốn :

Tìm kiếm theo chiều rộng ( BFS ) là một thuật tốn để tìm kiếm cấu trúc dữ liệu dạngcây cho một nút thỏa mãn một thuộc tính nhất định. Nó bắt đầu từ gốc cây và khám phá tất cả các nút ở độ sâu hiện tại trước khi chuyển sang các nút ở mức độ sâu tiếp theo. Bộ nhớ bổ sung, thường là một hàng đợi , là cần thiết để theo dõi các nút con đã gặp nhưng chưa được khám phá.

<small>7</small>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

Ví dụ: trong một ván cờ kết thúc , một cơng cụ cờ vua có thể xây dựng cây trị chơitừ vị trí hiện tại bằng cách áp dụng tất cả các nước đi có thể có và sử dụng tìm kiếm theo chiều rộng để tìm ra vị trí thắng cho qn trắng. Cây ẩn (chẳng hạn như cây trò chơi hoặc cây giải quyết vấn đề khác) có thể có kích thước vơ hạn; tìm kiếm theo chiều rộng được đảm bảo sẽ tìm thấy một nút giải pháp nếu một nút tồn tại.

Mơ tả thuật tốn :

<b>3.2.2 Depth – first- search (DFS)</b>

Tìm kiếm theo độ sâu trước tiên ( DFS ) là một thuật tốn để duyệt qua hoặc tìm kiếm cấu trúc dữ liệu dạng cây hoặc đồ thị . Thuật toán bắt đầu ở nút gốc (chọn một số nút tùy ý làm nút gốc trong trường hợp biểu đồ) và khám phá càng xa càng tốt dọc theo mỗi nhánh trước khi bẻ khóa ngược.

<small>8</small>

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<small>Nguồn: (Russell, 2016)</small>

Mơ tả thuật tốn :

Nếu so sánh với BFS thì DFS sẽ xử lý tốt hơn trong các khơng gian phức tạp vì nó sẽ duyệt qua hết tất cả các node để tìm goal state, nhưng bù lại nó lại kém tối ưu hơn vì khi duyệt qua tất cả node, DFS sẽ duyệt qua các đỉnh không cần thiết nên không nên áp dụng trong trường hợp số node là quá lớn.

<small>9</small>

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<b>3.2.3 Uniform – cost search </b>

Là một thuật tốn tìm kiếm khơng được thơng tin sử dụng chi phí tích lũy thấp nhất để tìm đường dẫn từ nguồn đến đích. Các nút được mở rộng, bắt đầu từ gốc, theo chi phí tích lũy tối thiểu. Sau đó, tìm kiếm chi phí thống nhất được triển khai bằng cách sử dụng hàng đợi ưu tiên.

Mơ tả thuật tốn :

<b>3.2.4 Depth-Limited search </b>

Phương pháp tìm kiếm giới hạn theo độ sâu (DLS) gần như tương đương với tìm kiếm theo độ sâu (DFS), nhưng DLS có thể giải quyết vấn đề khơng gian trạng thái vơ hạn vì nó giới hạn độ sâu của cây tìm kiếm với giới hạn L. Các nút ở độ sâu này. giới hạn được coi như thể chúng khơng có người kế nhiệm.

<small>10</small>

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

<small>Nguồn: tả thuật tốn :

<b>3.2.5 Iterative deepening search </b>

Trong khoa học máy tính , tìm kiếm theo chiều sâu lặp đi lặp lại hoặc cụ thể hơn là tìm kiếm theo chiều sâu lặp đi lặp lại (IDS hoặc IDDFS) là một chiến lược tìm kiếm khơng gian / đồ thị trạng thái trong đó phiên bản tìm kiếm theo chiều sâu giới hạn đ sâuộ được chạy lặp đi lặp lại với độ sâu ngày càng tăng giới hạn cho đến khi mục tiêu được tìm thấy. IDDFS tối ưu giống như tìm kiếm theo chiều rộng , nhưng sử dụng ít bộ nhớ hơn nhiều; ở mỗi lần lặp lại, nó truy cập các nút trong cây tìm kiếm theo thứ tự giống như tìm kiếm theo chiều sâu, nhưng thứ tự tích lũy mà các nút được truy cập đầu tiên là theo chiều rộng thực sự.<small>11</small>

<small>11 KORF, Richard E. (1985). "Làm sâu thêm lần lặp lại đầu tiên" (PDF),</small>

<small>11</small>

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

- Mơ tả thuật tốn :

* Bảng so sánh mức độ hoàn thành, thời gian, Lựa chọn tốt nhất của các thuật toán trên :

<small>Nguồn: section 3.4.5 of (Russell, 2016)</small>

<b>3.3 Informed Search Algorithms</b>

Thuật tốn tìm kiếm informed

Dạng chung: giống như UNIFORM-COST-SEARCH nhưng thay thế PATH-COST = f(n)

Mơ tả thuật tốn :

<small>12</small>

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

<b>3.3.1 Best-First Search</b>

- Chọn f(n) = h(n): heuristic function (tức là phỏng đoán) - heuristic function h(n) là phỏng đoán từ nút n cho đến nút goal

Example: straifht-line dist heuristic (bài tốn tìm đường)

- Lấy khoảng cách từ node n đến goal là bao nhiêu => tức là ước lượng quãng đường còn lại phải đi là bao nhiêu.

- Từ đó ta tìm được giải pháp tốt hơn và nhanh hơn - Nhưng Best-first search thì “Not optimal” vì:

f(n) = h(n): thiếu PATH-COST

“bad” heuristic (tức là chúng ta ước lượng sai)

- Để cải tiến nhằm giúp thuật toán trở nên “optimal” ta có thuật tốn A* search.

<b>3.3.2 A* Search </b>

Trong khoa học máy tính, <b>A*</b> (đọc là A sao) là thuật tốn tìm kiếm trong đồ thị. Thuật tốn này tìm một đường đi từ một nút khởi đầu tới một nút đích cho trước (hoặc tới một nút thỏa mãn một điều kiện đích). Thuật tốn này sử dụng một "đánh giá heuristic" để xếp loại từng nút theo ước lượng về tuyến đường tốt nhất đi qua nút đó. Thuật tốn này duyệt các nút theo thứ tự của đánh giá heuristic này. Do đó, thuật tốn A* là một ví dụ củatìm kiếm theo lựa chọn tốt nhất (best-first search).

<small>13</small>

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

Thuật tốn A* được mơ tả lần đầu vào năm 1968 bởi Peter Hart Nils Nilsson, , và Bertram Raphael. Trong bài báo của họ, thuật toán được gọi là thuật toán A; khi sử dụng thuật toán này với một đánh giá heuristic thích hợp sẽ thu được hoạt động tối ưu, do đó mà có tên A*.

Năm 1964, Nils Nilsson phát minh ra một phương pháp tiếp cận dựa trên khám phá để tăng tốc độ của thuật toán Dijkstra. Thuật toán này được gọi là A1. Năm 1967 Bertram Raphael đã cải thiện đáng kể thuật toán này, nhưng khơng thể hiển thị tối ưu. Ơng gọi thuật tốn này là A2. Sau đó, trong năm 1968 Peter E. Hart đã giới thiệu một đối số chứng minh A2 là tối ưu khi sử dụng thuật toán này với một đánh giá heuristic thích hợp sẽ thu được hoạt động tối ưu. Chứng minh của ông về thuật toán cũng bao gồm một phần cho thấy rằng các thuật toán A2 mới là thuật toán tốt nhất có thể được đưa ra các điều kiện. Do đó ông đặt tên cho thuật toán mới là A *(A sao, A-star).<small>12</small>

- f(n) = n.PATH-COST + h(n) n: initial state

- A* SEARCH là thuật toán “complete” và “optimal*” Optimal*: h(n) phải là consisdent heuristic

- 1 heuristic được coi là consistent phải thỏa điều kiện sao đây: - Nếu h(n) càng lớn gần bằng actual cost thì thuật tốn chạy cịn nhanh. - A* có thể được coi như một phiên bản nâng cấp cải thiện cảu uniform-cost-search mà uniform-cost-uniform-cost-search lại lại một biến thể của breadth-first-uniform-cost-search thì nó có một vấn đề là space complexity rất lớn, mặc dù A* cải thiện hơn nhưng trong thực tế có nhiều vấn đề mặc dù nó chạy ngốn hết bộ nhớ nhưng vẫn chưa tìm được solution. Và đề giải quyết cho vấn đề đó thì có 1 số thuật toán cải thiện.

</div>

×