Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.46 MB, 169 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN TP.HCMKHOA CÔNG NGHỆ THÔNG TIN
BỘ MƠN MẠNG MÁY TÍNH
<b>ĐỀ TÀI:</b>
GVHD: Th.S. MAI VĂN CƯỜNG
SVTH : NGUYỄN DUY THĂNG - 9912074NGUYỄN MINH THU - 9912156
KHÓA HỌC: 1999-2003
</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">Sau gần 6 tháng nỗ lực thực hiện, luận văn nghiên cứu “Các kĩ thuật tấn công vàbảo mật ứng dụng Web trên Internet” đã phần nào hoàn thành. Ngoài sự cố gắnghết mình của bản thân, chúng em đã nhận được sự khích lệ rất nhiều từ phía nhàtrường, thầy cơ, gia đình và bạn bè.
Trước hết chúng con xin cám ơn ba mẹ đã luôn động viên và tạo mọi điều kiệntốt để chúng con học tập và hoàn thành luận văn tốt nghiệp này.
Chúng em xin cám ơn thầy cô trường Đại Học Khoa Học Tự Nhiên đã truyền đạtnhững kiến thức quý báu cho chúng em trong suốt quá trình học tập. Đặc biệt,chúng em xin bày tỏ lịng chân thành sâu sắc đến thầy Mai Văn Cường, người đãtận tình hướng dẫn và giúp đỡ chúng em trong quá trình làm luận văn tốt nghiệp.Xin cám ơn tất cả bạn bè đã và đang động viên, giúp đỡ chúng tơi trong q trìnhhọc tập và hồn thành tốt luận văn tốt nghiệp này.
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4"><i><small>Nghiên cứu một số vấn đề về bảo mật ứng dụng Web trên Internet</small></i>
<small>GIỚI THIỆU………</small>
<small>Tổ chức của luận văn………...</small>
<small>PHẦN THỨ NHẤT: CƠ SỞ LÍ THUYẾT……….</small>
<small>Chương 1: Giới thệu Ứng dụng Web………..</small>
<small>I. KHÁI NIỆM ỨNG DỤNG WEB………..………</small>
<small>II. MÔ TẢ HOẠT ĐỘNG CỦA MỘT ỨNG DỤNG WEB………..………...</small>
<small>Chương 2: Các khái niệm, thuật ngữ liên quan ………..</small>
<small>Chương 3: Giới thiệu sơ lược về các kĩ thuật tấn cơng Ứng dụng Web………..</small>
<small>I. KIỂM SỐT TRUY CẬP WEB………</small>
<small>I.1. Thâm nhập hệ thống qua cửa sau………..</small>
<small>II. CHIẾM HỮU PHIÊN LÀM VIỆC………...</small>
<small>II.1. Ấn định phiên làm việc………</small>
<small>II.2. Đánh cắp phiên làm việc……….</small>
<small>III. LỢI DỤNG CÁC THIẾU SÓT TRONG VIỆC KIỂM TRA DỮ LIỆU NHẬP HỢPLỆ……….………...</small>
<small>III.1. Kiểm tra tính đúng đắn của dữ liệu bằng ngơn ngữ phía trình duyệt…………....</small>
<small>III.2. Tràn bộ đệm………..……….</small>
<small>III.3. Mã hóa URL………..</small>
<small>III.4. Kí tự Meta………..</small>
<small>III.5. Vượt qua đường dẫn………..</small>
<small>III.6. Chèn mã lệnh thực thi trên trình duyệt nạn nhân………..</small>
<small>III.7. Thêm câu lệnh hệ thống……….………...7911121316181919212225262727272727</small>
<small>2728282828292929</small>
</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5"><i><small>Nghiên cứu một số vấn đề về bảo mật ứng dụng Web trên Internet</small></i>
<small>III.8. Chèn câu truy vấn SQL……….………</small>
<small>III.9. Ngơn ngữ phía máy chủ………...</small>
<small>III.10. Kí tự rỗng….………...</small>
<small>III.11. Thao tác trên tham số truyền………...</small>
<small>IV. ĐỂ LỘ THÔNG TIN……….</small>
<small>V. TỪ CHỐI DỊCH VỤ……….………..</small>
<small>PHẦN THỨ HAI: CÁC KĨ THUẬT TẤN CÔNG VÀ BẢO MẬT ỨNG DỤNG WEB..</small>
<small>Chương 4: Thao tác trên tham số truyền………</small>
<small>I. THAO TÁC TRÊN URL………..</small>
<small>I.1. Khái niệm……….</small>
<small>I.2. Một số biện pháp khắc phục……….</small>
<small>II. THAO TÁC TRÊN BIẾN ẨN FORM……….</small>
<small>II.1. Khái niệm………</small>
<small>II.2. Một số biện pháp khắc phục………...</small>
<small>III. THAO TÁC TRÊN COOKIE………</small>
<small>III.1. Khái niệm ……….</small>
<small>III.2. Một số biện pháp khắc phục………..</small>
<small>IV. THAO TÁC TRONG HTTP HEADER……….</small>
<small>IV.1. Khái niệm………..</small>
<small>IV.2. Một số biện pháp khắc phục………..</small>
<small>Chương 5: Chèn mã lệnh thực thi trên trình duyệt nạn nhân (Cross Side Scripting)…….</small>
<small>I. KĨ THUẬT TẤN CÔNG CROSS-SITE SCRIPTING (XSS)………...</small>
<small>II. PHƯƠNG PHÁP TẤN CÔNG XSS TRUYỀN THỐNG………...</small>
<small>III. MỘT SỐ WEBSITE TÌM THẤY LỖ HỔNG XSS………...</small>
<small>IV. TẤN CƠNG XSS BẰNG FLASH……….</small>
<small>V. CÁCH PHỊNG CHỐNG………</small>
<small>Chương 6: Chèn câu truy vấn SQL (SQL Injection)……….</small>
<small>I. KHÁI NIỆM SQL INJECTION………...</small>
<small>II. GIỚI THIỆU MƠ HÌNH CƠ SỞ DỮ LIỆU………...3030303031313334353536363638393940414142434446505154565757</small>
</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6"><i><small>Nghiên cứu một số vấn đề về bảo mật ứng dụng Web trên Internet</small></i>
<small>III. CÁC CÁCH TẤN CƠNG……….</small>
<small>III.1. Kĩ thuật tấn cơng SQL Injection………...</small>
<small>III.2. Tấn cơng dưa vào câu lệnh SELECT………</small>
<small>III.3. Tấn công dưa vào câu lệnh HAVING………...</small>
<small>III.4. Tấn công dưa vào câu lệnh kết hợp UNION………</small>
<small>III.5. Tấn công dưa vào lệnh INSERT………...</small>
<small>III.6. Tấn công dưa vào STORED PROCEDURE………</small>
<small>III.7. Nâng cao………...</small>
<small>III.7.1. Chuỗi kí tự khơng có dấu nháy đơn……….</small>
<small>III.7.2. Tấn cơng 2 tầng………</small>
<small>III.7.3. Tránh sự kiểm sốt………...</small>
<small>III.7.4. Dùng Extended Stored Procedure………</small>
<small>III.7.4.1. Dùng Extended Stored Procedure có sẵn trong hệ thống SQL Server…...</small>
<small>III.7.4.2. Dùng Extended Stored Procedure tự tạo……….</small>
<small>III.7.4.3. Nhập tập tin văn bản vào bảng………</small>
<small>IV. CÁCH PHÒNG CHỐNG………</small>
<small>IV.1. Kiểm tra dữ liệu………..</small>
<small>IV.2. Khoá chặt SQL Server (SQL Server Lockdown)………...</small>
<small>Chương 7: Chiếm hữu phiên làm việc (Session Management)………</small>
<small>I. TỔNG QUAN VỀ SESSION ID………..</small>
<small>II. ẤN ĐỊNH PHIÊN LÀM VIỆC………...</small>
<small>II.1. Tấn công Session ID trên tham số URL………</small>
<small>II.2. Tấn công Session ID trong biến ẩn form………...</small>
<small>II.3. Tấn công Session ID trong cookie……….</small>
<small>II.4. Cách phòng chống……….</small>
<small>III. ĐÁNH CẮP PHIÊN LÀM VIỆC………..</small>
<small>III.1. Tấn cơng kiểu dự đốn phiên làm việc (Prediction sessionID)………</small>
<small>III.2. Tấn công kiểu vét cạn phiên làm việc (Brute force ID)………...</small>
<small>III.3. Tấn công kiểu dùng đoạn mã để đánh cấp phiên làm việc………...5858606262697070707174757576777778818384858889899192939394</small>
</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7"><i><small>Nghiên cứu một số vấn đề về bảo mật ứng dụng Web trên Internet</small></i>
<small>II.2. Push và Pop………</small>
<small>II.3. Cách làm việc của hàm………..</small>
<small>II.4. Shell code………...</small>
<small>III. MỘT SỐ CÁCH GÂY TRÀN BỘ ĐỆM QUA ỨNG DỤNG WEB……….</small>
<small>IV. CÁC CÁCH PHÒNG CHỐNG……….</small>
<small>Chương 9: Từ chối dịch vụ (DoS)……….</small>
<small>I. KHÁI NIỆM………..</small>
<small>II. NHỮNG KHẢ NĂNG BỊ TẤN CÔNG BẰNG DOS……….</small>
<small>III. CÁC KĨ THUẬT TẤN CÔNG………..</small>
<small>III.1. Khái niệm về Tcp bắt tay ba chiều………</small>
<small>III.2. Lợi dụng TCP thực hiện phương pháp SYN flood truyền thống………..</small>
<small>III.3. Tấn công vào băng thông………..</small>
<small>III.3.1. Kiểu tấn công thứ 1………..</small>
<small>III.3.2. Kiểu tấn công thứ 2………..</small>
<small>III.4. Kiểu tấn công vào tài nguyên hệ thống……….</small>
<small>IV. BIỆN PHÁP PHÒNG CHỐNG……….</small>
<small>Chương 10: Một số kĩ thuật tấn cơng khác………...</small>
<small>I. MÃ HĨA URL (URL Encoding) ………</small>
<small>I.1. Khái niệm………</small>
<small>I.2. Một số biện pháp phịng chống………...</small>
<small>II. KIỂU TẤN CƠNG VƯỢT ĐƯỜNG DẪN………</small>
<small>II.1. Khái niệm………..94</small>
<small>94979899100101102104106106108109109110110112113113113117117119120120121121121</small>
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8"><i><small>Nghiên cứu một số vấn đề về bảo mật ứng dụng Web trên Internet</small></i>
<small>II.2. Một số biện pháp phịng chống………..</small>
<small>III. TẤN CƠNG DỰA VÀO KÍ TỰ RỖNG………...</small>
<small>III.1. Khái niệm………..</small>
<small>III.2. Một số biện pháp phịng chống……….</small>
<small>IV. NGƠN NGỮ PHÍA TRÌNH CHỦ……….</small>
<small>IV.1. Khái niệm………..</small>
<small>IV.2. Cách tấn cơng………</small>
<small>IV.3. Biện pháp phịng chống………</small>
<small>Chương 11: Tổng kết q trình tấn cơng của Hacker………...</small>
<small>I. THU THẬP THÔNG TIN Ở MỨC HẠ TẦNG CỦA MỤC TIÊU………</small>
<small>II. KHẢO SÁT ỨNG DỤNG WEB………</small>
<small>III. TẤN CÔNG………..</small>
<small>Chương 12: Tổng kết các biện pháp phòng chống………...</small>
<small>I. VỚI NHỮNG NHÀ QUẢN TRỊ MẠNG………</small>
<small>II. VỚI NHỮNG NHÀ THIẾT KẾ ỨNG DỤNG WEB……….</small>
<small>III. VỚI NGƯỜI SỬ DỤNG ỨNG DỤNG WEB………...</small>
<small>PHẦN THỨ BA: CHƯƠNG TRÌNH WEB CHECKER………..</small>
<small>Chương 13: Chương trình Web Checker………..</small>
<small>I. ĐẶC TẢ CHƯƠNG TRÌNH WEB CHECKER………..</small>
<small>I.1. Tổng quan………...</small>
<small>I.2. Yêu cầu………...</small>
<small>I.2.1. Yêu cầu chức năng……….</small>
<small>I.2.1. Yêu cầu phi chức năng………...</small>
<small>II. KIẾN TRÚC CHƯƠNG TRÌNH WEB CHECKER………..</small>
<small>II.1. Kiến trúc chương trình Web Checker………...</small>
<small>II.2. Giao tiếp giữa chương trình với trình chủ Web……….</small>
<small>III. CÀI ĐẶT………...</small>
<small>III.1. Ngôn ngữ cài đặt………..</small>
<small>III.2. Phương pháp cài đặt……….122123123123123123125125127128131132134135137139140141142142142142143143143144145145145</small>
</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9"><i><small>Nghiên cứu một số vấn đề về bảo mật ứng dụng Web trên Internet</small></i>
<small>III.2.1. Sử dụng mơ hình giao diện dạng Dialog……….</small>
<small>III.2.2. Sử dụng ActiveX Control (Microsoft Web Browser)……….</small>
<small>III.2.3. Sử dụng giao diện lập trình Window Socket 2………</small>
<small>III.2.4. Một số lớp và hàm chính được cài đặt trong chương trình……….</small>
<small>III.3. Mơ tả chương trình và cách sử dụng………</small>
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10"><i><small>Nghiên cứu một số vấn đề về bảo mật ứng dụng Web trên Internet</small></i>
Ngày nay, khi Internet được phổ biến rộng rãi, các tổ chức, cá nhân đều có nhu cầugiới thiệu thơng tin của mình trên xa lộ thơng tin cũng như thực hiện các phiên giaodịch trực tuyến. Vấn đề nảy sinh là khi phạm vi ứng dụng của các ứng dụng Web ngàycàng mở rộng thì khả năng xuất hiện lỗi và bị tấn công càng cao, trở thành đối tượngcho nhiều người tấn cơng với các mục đích khác nhau. Đôi khi, cũng chỉ đơn giản là đểthử tài hoặc đùa bỡn với người khác.
Cùng với sự phát triển không ngừng của Internet và các dịch vụ trên Internet, số lượngcác vụ tấn công trên Internet cũng tăng theo cấp số nhân. Trong khi các phương tiệnthông tin đại chúng ngày càng nhắc nhiều đến những khả năng truy nhập thơng tin củaInternet, thì các tài liệu chun mơn bắt đầu đề cập nhiều đến vấn đề bảo đảm và antồn dữ liệu cho các máy tính được kết nối vào mạng Internet.
Theo số liệu của CERT (Computer Emegency Response Team - "Đội cấp cứu máytính"), số lượng các vụ tấn công trên Internet được thông báo cho tổ chức này là ít hơn200 vào năm 1989, khoảng 400 vào năm 1991, 1400 vào năm 1993, và 2241 vào năm1994, và năm 2001 là 5315 vụ.
Những vụ tấn công này nhằm vào tất cả các máy tính có mặt trên Internet, các máy tínhcủa tất cả các cơng ty lớn như AT&T, IBM, các trường đại học, các cơ quan nhà nước,các tổ chức quân sự, nhà băng... Một số vụ tấn cơng có quy mơ khổng lồ (có tới100.000 máy tính bị tấn cơng). Hơn nữa, những con số này chỉ là phần nổi của tảngbăng. Một phần rất lớn các vụ tấn công không được thông báo, vì nhiều lý do, trong đó
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11"><i><small>Nghiên cứu một số vấn đề về bảo mật ứng dụng Web trên Internet</small></i>
có thể kể đến nỗi lo bị mất uy tín, hoặc đơn giản những người quản trị hệ thống khônghay biết những cuộc tấn công đang nhằm vào hệ thống của họ.
Điển hình là cuộc tấn cơng vào phần mềm thương mại của IBM tháng 3/2001, haihacker đã tìm thấy lỗ hổng trên ứng dụng mà bất cứ ai với một trình duyệt Web cũngcó thể lấy tài khoản của người dùng, thậm chí cả người quản trị.
Không chỉ số lượng các cuộc tấn công tăng lên nhanh chóng, mà các phương pháp tấncơng ngày càng tinh vi và có tổ chức. Mặt khác, việc quản trị các hệ thống mạng đòihỏi nhà quản trị hệ thống có kiến thức và kinh nghiệm về hệ thống mạng chắc chắn, do đó sự yếu kém trong quản lý sẽ tạo nhiều điều kiện cho các hacker khai thác.
Cũng theo CERT, những cuộc tấn công thời kỳ 1988-1989 chủ yếu là đoán tên ngườisử dụng-mật khẩu (UserID/password) hoặc sử dụng một số lỗi của các chương trình vàhệ điều hành (security hole) làm vô hiệu hệ thống bảo vệ, tuy nhiên các cuộc tấn côngvào thời gian gần đây còn bao gồm cả các thao tác như giả mạo địa chỉ IP, theo dõithông tin truyền qua mạng, chiếm các phiên làm việc từ xa (telnet hoặc rlogin), càitrojan hay worm để kiểm soát hay điều khiển máy tính…vì thế, nhu cầu bảo vệ thơngtin trên Internet là cần thiết nhằm mục đích bảo vệ dữ liệu, bảo vệ thông tin người dùngvà bảo vệ hệ thống.
Khi nói đến vấn đề bảo mật, hầu hết các chuyên gia bảo mật đều chú trọng đến sự antoàn của hệ thống mạng và hệ điều hành. Để bảo vệ cho hệ thống, phương pháp thườngđược chọn là sử dụng firewall. Tuy nhiên, theo tuyên bố của CSI/FBI : 78% nơi bị hạicó sử dụng firewall và 59% thì bị tấn công thông qua Internet, cụ thể hơn là theo báo
<b>cáo của CSI/FBI Computer Crime và Security Survey thì tổng số thiệt hại do những</b>
<b>ứng dụng Web bị tấn công từ năm 1997 đến năm 2000 là 626 triệu đôla Mỹ.</b>
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12"><i><small>Nghiên cứu một số vấn đề về bảo mật ứng dụng Web trên Internet</small></i>
Với những cơng cụ tự động tìm lỗ hổng tuy giúp rất nhiều cho những nhà lập trìnhWeb nhưng vẫn khơng thể ngăn chặn tồn bộ vì cơng nghệ Web đang phát triển nhanhchóng (chủ yếu chú trọng đến yếu tố thẩm mĩ, yếu tố tốc độ…) nên dẫn đến nhiềukhuyết điểm mới phát sinh. Sự tấn công không nằm trong khuôn khổ vài kĩ thuật đãphát hiện, mà linh động và tăng lên tùy vào những sai sót của nhà quản trị hệ thốngcũng như của những người lập trình ứng dụng.
Luận văn được thực hịên với mục đích tìm hiểu, phân tích các lỗ hổng bảo mật trong
<b>các ứng dụng web (cùng với chương trình minh họa) để qua đó đề xuất các phương án</b>
sửa chữa. Song song đó, luận văn cịn thực hiện một chương trình “Tự động phát hiệnlỗ hổng trên ứng dụng Web” giúp ích cho những nhà lập trình Web ít kinh nghiệmtránh những sai sót trong quá trình tạo các ứng dụng.
Luận văn gồm 13 chương chia thành 3 phần:
<b>Phần thứ nhất: CƠ SỞ LÍ THUYẾT</b>
Phần này gồm có 3 chương:
+ Chương 1 : Giới thiệu về ứng dụng Web
+ Chương 2 : Một số khái niệm, thuật ngữ liên quan.+ Chương 3: Sơ lược các kĩ thuật tấn công ứng dụng Web
<b>Phần thứ hai:CÁC KĨ THUẬT TẤN CƠNG VÀ BIỆN PHÁP PHỊNG CHỐNG</b>
Phần này gồm có 9 chương từ chương 4 đến chương 12 trong đó 7 chương đầu bànluận về các kĩ thuật tấn công, cuối mỗi chương là biện pháp phòng chống cho từng kĩthuật. Chương 11 nói về q trình tấn cơng của hacker và đến chương 12 là nội dungcác biện pháp phòng chống chung nhất.
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13"><i><small>Nghiên cứu một số vấn đề về bảo mật ứng dụng Web trên Internet</small></i>
<b>Phần thứ ba : CHƯƠNG TRÌNH “WEB CHECKER”</b>
Là gồm chương cuối trình bày, giải thích về chương trình
Kết thúc luận văn là phần kết luận, tóm lược lại những vấn đề đã trình bày và một sốhướng phát triển trong tương lai và danh mục các tài liệu tham khảo.
</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14"><i><small>Phần I: Cơ sở lý thuyết</small></i>
<b>PHẦN THỨ NHẤT</b>
<i><small>Chương 1: Giới thiệu Ứng dụng Web</small></i>
I. Khái niệm về ứng dụng Web
II. Mô tả cách hoạt động của một ứng dụng Web
</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16"><i><small>Chương 1: Giới thiệu Ứng dụng Web</small></i>
Luận văn được thực hiện nhằm tìm hiểu về các kĩ thuật tấn công trang Web và đề racách phịng chống. Do đó, trong chương đầu tiên luận văn sẽ giới thiệu sơ lược một sốkhái niệm cơ bản và đây chính là nền tảng để xây dựng nội dung cho những phần sau.
Ứng dụng Web là một ứng dụng chủ/khách sử dụng giao thức HTTP để tương tác vớingười dùng hay hệ thống khác.
Trình khách dành cho người sử dụng thường là một trình duyệt Web như InternetExplorer hay Netscape Navigator. Cũng có thể là một chương trình đóng vai trị đạilý người dùng hoạt động như một trình duyệt tự động. Người dùng gửi và nhận cácthơng tin từ trình chủ thông qua việc tác động vào các trang Web. Các chương trìnhcó thể là các trang trao đổi mua bán, các diễn đàn, gửi nhận e-mail…
Tốc độ phát triển các kỹ thuật xây dựng ứng dụng Web cũng phát triển rất nhanh.Trước đây những ứng dụng Web thường được xây dựng bằng CGI (CommonGateway Interface) được chạy trên các trình chủ Web và có thể kết nối vào các cơ sởdữ liệu đơn giản trên cùng máy chủ. Ngày nay ứng dụng Web thường được viết bằngJava (hay các ngôn ngữ tương tự) và chạy trên máy chủ phân tán, kết nối đến nhiềunguồn dữ liệu.
Một ứng dụng web thường có kiến trúc gồm:
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17"><i><small>Chương 1: Giới thiệu Ứng dụng Web</small></i>
<small>Hình 1.I-1. Kiến trúc một ứng dụng Web</small>
• Lớp trình bày: Lớp này có nhiệm vụ hiển thị dữ liệu cho người dùng, ngồi ra cịncó thể có thêm các ứng dụng tạo bố cục cho trang web.
• Lớp ứng dụng: là nơi xử lý của ứng dụng Web. Nó sẽ xử lý thông tin người dùng
<i>yêu cầu, đưa ra quyết định, gửi kết quả đến “lớp trình bày”. Lớp này thường</i>
được cài đặt bằng các kỹ thuật lập trình như CGI, Java, .NET , PHP hayColdFusion, được triển khai trên các trình chủ như IBM WebSphere, WebLogic,Apache, IIS…
• Lớp dữ liệu: thường là các hệ quản trị dữ liệu (DBMS) chịu trách nhiệm quản lýcác file dữ liệu và quyền sử dụng.
Mơ hình hóa hoạt động của một ứng dụng Web:
</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18"><i><small>Chương 1: Giới thiệu Ứng dụng Web</small></i>
<small>Hình 1.I-2. Mơ hình hoạt động của một ứng dụng Web</small>
Trong đó:
• Trình khách ( hay cịn gọi là trình duyệt): Internet Explorer, Netscap Navigator• Trình chủ: Apache, IIS, ….
• Hệ quản trị cơ sở dữ liệu: SQL Server, MySQL, DB2, Access….
Bên cạnh đó, một giải pháp dùng để bảo vệ một hệ thống mạng thường được sử dụnglà bức tường lửa, nó có vai trị như là lớp rào chắn bên ngồi một hệ thống mạng, vìchức năng chính của firewall là kiểm sốt luồng thơng tin giữa các máy tính. Có thểxem firewall như một bộ lọc thơng tin, nó xác định và cho phép một máy tính này cóđược truy xuất đến một máy tính khác hay khơng, hay một mạng này có được truyxuất đến mạng kia hay không.
Người ta thường dùng firewall vào mục đích:
• Cho phép hoặc cấm những dịch vụ truy xuất ra ngoài.
</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19"><i><small>Chương 1: Giới thiệu Ứng dụng Web</small></i>
• Cho phép hoặc cấm những dịch vụ từ bên ngồi truy nhập vào trong.• Kiểm sốt địa chỉ truy nhập, cấm địa chỉ truy nhập.
Firewall hoạt động dựa trên gói IP do đó kiểm sốt việc truy nhập của máy người sửdụng
Đầu tiên trình duyệt sẽ gửi một yêu cầu (request) đến trình chủ Web thơng qua cáclệnh cơ bản GET, POST… của giao thức HTTP, trình chủ lúc này có thể cho thực thimột chương trình được xây dựng từ nhiều ngơn ngữ như Perl, C/C++… hoặc trìnhchủ yêu cầu bộ diễn dịch thực thi các trang ASP, JSP… theo yêu cầu của trình khách.Tùy theo các tác vụ của chương trình được cài đặt mà nó xử lý, tính tốn, kết nối đếncơ sở dữ liệu, lưu các thơng tin do trình khách gửi đến…và từ đó trả về cho trìnhkhách 1 luồng dữ liệu có định dạng theo giao thức HTTP, nó gồm 2 phần:
• Header mơ tả các thơng tin về gói dữ liệu và các thuộc tính, trạng thái trao đổigiữa trình duyệt và WebServer.
• Body là phần nội dung dữ liệu mà Server gửi về Client, nó có thể là một fileHTML, một hình ảnh, một đoạn phim hay một văn bản bất kì.
Theo mơ hình ở hình 1.I-2, với firewall, luồng thơng tin giữa trình chủ và trình kháchlà luồng thơng tin hợp lệ. Vì thế, nếu hacker tìm thấy vài lỗ hổng trong ứng dụngWeb thì firewall khơng cịn hữu dụng trong việc ngăn chặn hacker này. Do đó, các kĩthuật tấn công vào một hệ thống mạng ngày nay đang dần tập trung vào những sơsuất (hay lỗ hổng) trong quá trình tạo ứng dụng của những nhà phát triển Web hơn làtấn công trực tiếp vào hệ thống mạng, hệ điều hành. Tuy nhiên, hacker cũng có thể
</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20"><i><small>Chương 1: Giới thiệu Ứng dụng Web</small></i>
lợi dụng các lỗ hổng Web để mở rộng sự tấn cơng của mình vào các hệ thống khơngliên quan khác.
</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21"><i><small>Chương 2: Các khái niệm, thuật ngữ liên quan</small></i>
</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22"><i><small>Chương 2: Các khái niệm, thuật ngữ liên quan</small></i>
Vì tính chất phổ biến của thuật ngữ hacker, nên trong phần trình bày, luận văn sẽ sửdụng “hacker” thay cho “kẻ tấn công”.
HTTP header là phần đầu (header) của thông tin mà trình khách và trình chủ gửi chonhau. Những thơng tin trình khách gửi cho trình chủ được gọi là HTTP requests (ucầu) cịn trình chủ gửi cho trình khách là HTTP responses (trả lời). Thông thường,một HTTP header gồm nhiều dòng, mỗi dòng chứa tên tham số và giá trị. Một số
</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23"><i><small>Chương 2: Các khái niệm, thuật ngữ liên quan</small></i>
tham số có thể được dùng trong cả header yêu cầu và header trả lời, còn số khác thìchỉ đuợc dùng riêng trong từng loại. Ví dụ :
• Header yêu cầu:
<small>GET /tintuc/homnay.asp HTTP/1.1Accept: */*</small>
<small>Accept-Language: en-usConnection: Keep-AliveHost: localhost</small>
o Tiếp theo là các tham số. Chẳng hạn như:
Accept-Language: Cho biết ngôn ngữ dùng trong trang web. Host: Cho biết địa chỉ của máy chủ.
Referer: Cho biết địa chỉ của trang web tham chiếu tới.o Header của HTTP request sẽ kết thúc bằng một dịng trống.• Header trả lời:
<small>HTTP/1.1 200 OK</small>
<small>Server: Microsoft-IIS/5.0</small>
<small>Date: Thu, 13 Jul 2000 05:46:53 GMT</small>
</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24"><i><small>Chương 2: Các khái niệm, thuật ngữ liên quan</small></i>
<small>Content-Length: 2291Content-Type: text/html</small>
<small>Set-Cookie: ASPSESSIONIDQQGGGNCG=LKLDFFKCINFLDMFHCBCBMFLJ;path=/</small>
<small>Cache-control: private<HTML></small>
o Dòng đầu là dòng trạng thái, để cho biết phiên bản HTTP được dùng(HTTP/1.1), mã trạng thái (200) và trạng thái (OK).
o Tiếp theo là các tham số.
o Tiếp theo là một dòng trống để báo hiệu kết thúc header, tiếp theo là phầnthân của HTTP response.
Danh sách tham số của HTTP header được trình bày trong phụ lục A
HTTP là giao thức hướng đối tượng tổng quát, phi trạng thái, nghĩa là HTTP khônglưu trữ trạng thái làm việc giữa trình duyệt với trình chủ. Sự thiếu sót này gây khókhăn cho một số ứng dụng Web, bởi vì trình chủ khơng biết được trước đó trìnhduyệt đã có những trạng thái nào. Vì thế, để giải quyết vấn đề này, ứng dụng Webđưa ra một khái niệm phiên làm việc (Session). Còn SessionID là một chuỗi để chứngthực phiên làm việc. Một số trình chủ sẽ cung cấp một SessionID cho người dùngkhi họ xem trang web trên trình chủ.
Để duy trì phiên làm việc thì sessionID thường được lưu vào :
</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25"><i><small>Chương 2: Các khái niệm, thuật ngữ liên quan</small></i>
• Biến trên URL• Biến ẩn form• Cookie
Phiên làm việc chỉ tồn tại trong một khoảng thời gian cho phép, thời gian này đượccấu hình qui định tại trình chủ hoặc bởi ứng dụng thực thi. Trình chủ sẽ tự động giảiphóng phiên làm việc để khơi phục lại tài nguyên của hệ thống.
Ở những lần truy cập sau đến trang Web đó, ứng dụng có thể dùng lại những thôngtin trong cookie (như thông tin liên quan đến việc đăng nhập vào YahooMessenger!...) mà người dùng không phải làm lại thao tác đăng nhập hay phải cungcấp lại các thông tin khác.
Cookie được phân làm 2 loại secure/non-secure và persistent/non-persistent do đó tasẽ có 4 kiểu cookie là:
</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26"><i><small>Chương 2: Các khái niệm, thuật ngữ liên quan</small></i>
• Persistent và Secure• Persistent và Non-Secure• Non-Persistent và Secure• Non-Persistent và Non-Secure
Persistent cookies được lưu trữ dưới dạng tập tin .txt (ví dụ trình duyệt NetscapeNavigator sẽ lưu các cookie thành một tập tin cookie.txt còn Internet Explorer sẽ lưuthành nhiều tập tin *.txt trong đó mỗi tập tin là một cookie) trên máy khách trong mộtkhoản thời gian xác định.
Non-persistent cookie thì được lưu trữ trên bộ nhớ RAM của máy khách và sẽ bị hủykhi đóng trang web hay nhận được lệnh hủy từ trang web.
Secure cookies chỉ có thể được gửi thơng qua HTTPS (SSL).
Non-Secure cookie có thể được gửi bằng cả hai giao thức HTTPS hay HTTP. Thựcchất là đối với secure cookie thì trình chủ sẽ cung cấp chế độ truyền bảo mật.
<b>Các thành phần của một cookie gồm:</b>
<b>• Domain: Tên miền của trang web đã tạo cookie ( trong ví dụ trên là</b>
www.redhat.com)
</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27"><i><small>Chương 2: Các khái niệm, thuật ngữ liên quan</small></i>
<b>• Flag: mang giá trị TRUE/FALSE -Xác định các máy khác với cùng tên miền có</b>
được truy xuất đến cookie hay khơng.
<b>• Path: Phạm vi các địa chỉ có thể truy xuất cookie. Ví dụ:</b>
Nếu path là “/tracuu” thì các địa chỉ trong thư mục /tracuu cũng như tất cả các thưmục con của nó như /tracuu/baomat có thể truy xuất đến cookie này. Cịn nếu giátri là “/” thì cookie sẽ được truy xuất bởi tất cả địa chỉ thuộc miền trang web tạocookie.
<b>• Sercure: mang giá trị TRUE/FALSE - Xác định đây là một secure cookie hay</b>
không nghĩa là kết nối có sử dụng SSL hay khơng.
<b>• Expiration: thời gian hết hạn của cookie, được tính bằng giây kể từ 00:00:00 giờ </b>
GMT ngày 01/01/1970. Nếu giá trị này khơng được thiết lập thì trình duyệt sẽhiểu đây là non-persistent cookie và chỉ lưu trong bộ nhớ RAM và sẽ xố nó khitrình duyệt bị đóng.
<b>• Name: Tên biến (trong trường hợp này là Apache)</b>
<b>• Value: Với cookie được tạo ở trên thì giá trị của Apache là</b>
64.3.40.151.16018996349247480 và ngày hết hạn là 27/07/2006, của tên miền.
Ví dụ chuỗi lệnh trong HTTP header dưới đây sẽ tạo một cookie:
<small>Set-Cookie:Apache="64.3.40.151.16018996349247480"; path="/";domain="www.redhat.com"; path_spec; expires="2006-07-2719:39:15Z"; version=0</small>
Các cookie của Netscape (NS) đặt trong một tập tin Cookies.txt, với đường dẫnlà: C:\Program Files\Netscape\Users\UserName\Cookies.txt
</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28"><i><small>Chương 2: Các khái niệm, thuật ngữ liên quan</small></i>
Các cookies của IE được lưu thành nhiều tập tin, mỗi tập tin là một cookie vàđược đặt trong [C:]\Documents and Setting\[username]\Cookies (Win2000), đốivới win9x, thư mục cookies nằm trong thư mục [C:]\Windows\cookies.
Kích thước tối đa của cookie là 4kb. Số cookie tối đa cho một tên miền là 20 cookie.
<i><b>Cookie bị hủy ngay khi đóng trình duyệt gọi là “session cookie”.</b></i>
Proxy cung cấp cho người sử dụng truy xuất Internet những nghi thức đặt biệt hoặcmột tập những nghi thức thực thi trên dual_homed host hoặc basion host. Nhữngchương trình client của người sử dụng sẽ qua trung gian proxy server thay thế choserver thật sự mà người sử dụng cần giao tiếp.
Proxy server xác định những yêu cầu từ client và quyết định đáp ứng hay không đápứng, nếu yêu cầu được đáp ứng, proxy server sẽ kết nối với server thật thay cho clientvà tiếp tục chuyển tiếp những yêu cầu từ client đến server, cũng như trả lời củaserver đến client. Vì vậy proxy server giống cầu nối trung gian giữa server và client.
</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29"><i><small>Chương 3: Giới thiệu sơ lược về các kĩ thuật tấn công</small></i>
</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30"><i><small>Chương 3: Giới thiệu sơ lược về các kĩ thuật tấn công</small></i>
Sau đây là các khái niệm sơ lược các kĩ thuật tấn công ứng dụng Web đã được phânloại dựa trên mức độ gây tác hại đối với ứng dụng.
Trong quá trình thiết kế ứng dụng, những người phát triển ứng dụng có thể càimột “cửa sau” (back door) để sau này có thể thâm nhập vào hệ thống một cách dễdàng.
Là kĩ thuật tấn công cho phép hacker mạo danh người dùng hợp lệ bằng cách gửimột session ID hợp lệ đến người dùng, sau khi người dùng đăng nhập vào hệthống thành công, hacker sẽ dùng lại session ID đó và nghiễm nhiên trở thànhngười dùng hợp lệ.
<i><small>Chương 3: Giới thiệu sơ lược về các kĩ thuật tấn công</small></i>
Là kĩ thuật tấn công cho phép hacker mạo danh người dùng hợp lệ sau khi nạnnhân đã đăng nhập vào hệ thống bằng cách giải mã session ID của họ được lưutrữ trong cookie hay tham số URL, biến ẩn của form.
Hacker lợi dụng những ô nhập dữ liệu để gửi đi một đoạn mã bất kì khiến cho hệthống phải thực thi đoạn lệnh đó hay bị phá vỡ hồn tồn.
Do ngơn ngữ phía trình duyệt ( JavaScript, VBScript..) đuợc thực thi trên trìnhduyệt nên hacker có thể sửa đổi mã nguồn để có thể vơ hiệu hóa sự kiểm tra.
Một khối lượng dữ liệu được gửi cho ứng dụng vượt quá lượng dữ liệu được cấpphát khiến cho ứng dụng không thực thi được câu lệnh dự định kế tiếp mà thayvào đó phải thực thi một đoạn mã bất kì do hacker đưa vào hệ thống. Nghiêmtrọng hơn nếu ứng dụng được cấu hình để thực thi với quyền root trên hệ thống.
Lợi dụng chuẩn mã hóa những kí tự đặc biệt trên URL mà hacker sẽ mã hố tựđộng những kí tự bất hợp lệ- những kí tự bị kiểm tra bằng ngơn ngữ kịch bản-đểvượt qua vịng kiểm sốt này.
<i><small>Chương 3: Giới thiệu sơ lược về các kĩ thuật tấn cơng</small></i>
Sử dụng những kí tự đặc biệt ( nói rõ hơn trong phần phụ lục) hacker có thể chènthêm vào dữ liệu gửi những kí tự trong chuỗi câu lệnh như <script> trong kĩ thuậtXSS, ‘ -- trong SQL….để thực thi câu lệnh.
Là phương pháp lợi dụng đường dẫn truy xuất một tập tin trên URL để trả kết quảvề cho trình duyệt mà hacker có thể lấy được nội dung tập tin bất kì trên hệ thống.
Đây là kĩ thuật tấn công chủ yếu nhằm vào thông tin trên máy tính của ngườidùng hơn là vào hệ thống máy chủ. Bằng cách thêm một đoạn mã bất kì ( thườngđược lập trình bằng ngơn ngữ kịch bản như JavaScript, VBScript…), hacker cóthể thực hiện việc đánh cắp thơng tin quan trọng như cookie để từ đó trở thànhngười dùng hợp lệ của ứng dụng…dựa trên những thông tin đánh cắp này. Cross-Site scripting cũng là một kiểu tấn công “session hijacking”.
Khả năng thực thi được những câu lệnh hệ thống hay những đoạn mã được thêmvào trong những tham số mà khơng có sự kiểm tra chặt chẽ như tham số củaform, cookies, yêu cầu HTTP Header, và những dữ liệu nguy hiểm trong nhữngtập tin được đưa lên trình chủ.
Thành cơng trong kĩ thuật này giúp hacker có thể thực thi được những câu lệnh hệthống với cùng quyền của trình chủ.
</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33"><i><small>Chương 3: Giới thiệu sơ lược về các kĩ thuật tấn công</small></i>
Trong lập trình với cơ sở dữ liệu, người lập trình đã sai sót trong vấn đề kiểm tragiá trị nhập vào để từ đó hacker lợi dụng thêm vào những câu truy vấn hay nhữnggiá trị không hợp lệ để dễ dàng đăng nhập vào hệ thống.
Là khả năng thêm vào những câu lệnh thuộc hệ thống như nhúng file (includefile), truy xuất cơ sở dữ liệu (jdbc)…khiến cho hacker có cơ hội truy xuất đến file,cơ sở dữ liệu…mà bình thường khơng thể xem được trên Web site.
Lợi dụng chuỗi kí tự thường kết thúc bằng \0 mà hacker thường thêm vào để đánhlừa ứng dụng vì với những ứng dụng sử dụng chương trình cgi như C++ thì C++cho rằng \0 là dấu kết thúc chuỗi.
Ví dụ:
Hacker thêm chuỗi sau:
<b>Ơ nhập: đề tài thứ nhất\0<script> alert(document.cookie)</script></b>
nếu ứng dụng sử dụng chương trình C++ để kiểm tra tính đúng đắn của chuỗi thìchuỗi trên hợp lệ do C++ sẽ nhân biết “\0” là kết thúc chuỗi nên không kiểm trađoạn sau..
Những thông tin trao đổi giữa trình chủ và trình duyệt được lưu trữ trong nhữngbiến như biến trên URL, biến ẩn form, cookie…Bởi vì việc kiểm soát biến chưa
</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34"><i><small>Chương 3: Giới thiệu sơ lược về các kĩ thuật tấn công</small></i>
được quan tâm đúng mức nên hacker có thể lợi dụng sửa đổi giá trị biến để đánhcắp phiên làm việc của người dùng hay thay đổi giá trị một món hàng….
Những tập tin và ứng dụng trên hệ thống chứa những thông tin quan trọng như mãnguồn một trang Web hay tập tin chứa mật khẩu của người dùng trên hệ thống luôn làmục tiêu của hacker. Ngồi ra những lời chú thích trong mã nguốn cũng là nguồnthơng tin hữu ích cho hacker.
Hacker sử dụng trả lời HTTP từ hệ thống để xác định một tập tin hay ứng dụng cótồn tại hay khơng.
Ví dụ 1.IV-1:
• HTTP 200 : tập tin tồn tại
• HTTP 404: tập tin không tồn tại.
Một khối lượng lớn yêu cầu được gửi cho ứng dụng trong một khoảng thời gian nhấtđịnh khiến hệ thống không đáp ứng kịp yêu cầu dẫn đến hệ thống bị phá vỡ.
Vì khn khổ và thời gian của luận văn là có hạn nên luận văn chỉ thực hiện tìm hiểumột số kĩ thuật phổ biến và khả năng phá hoại một hệ thống mạng với mức độ cao. Vàtrong các chương ở phần thứ hai, luận văn sẽ trình bày kĩ hơn từng kĩ thuật sau :
• Thao tác trên tham số truyền
• Chèn mã lệnh thực thi trên trình duyệt• Chèn câu truy vấn SQL
• Chiếm hữu phiên làm việc
</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35"><i><small>Chương 3: Giới thiệu sơ lược về các kĩ thuật tấn cơng</small></i>
• Tràn bộ đệm• Từ chối dịch vụ• Một vài kĩ thuật khác
o Kí tự rỗngo Mã hóa URL
o Lợi dụng truy xuất đường dẫn đến một tập tino Ngơn ngữ phía trình chủ
</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36"><i><small>Phần II: Các kĩ thuật tấn công và bảo mật ứng dụng Web</small></i>
<i><small>Chương 4: Thao tác trên tham số truyền</small></i>
I. Thao tác trên URL
II. Thao tác trong biến ấn formIII. Thao tác trên cookie
IV. Thao tác trong HTTP Header
</div><span class="text_page_counter">Trang 38</span><div class="page_container" data-page="38"><i><small>Chương 4: Thao tác trên tham số truyền</small></i>
Thao tác trên tham số truyền là kĩ thuật thay đổi thông tin quan trọng trên cookie, URLhay biến ẩn của form. Kĩ thuật Cross-Site Scripting, SessionID, SQL Injection, BufferOverflow…cũng cần dùng đến các tham số này để hồn thiện các bước tấn cơng củahacker. Có thể nói các tham số truyền là đầu mối cho mọi hoạt động của hacker trongq trình tấn cơng ứng dụng. Vì thế đây là nội dung chương đầu tiên được đề cập trongphần thứ hai, mục đích cũng là để hỗ trợ tốt hơn phần trình bày các chương kế tiếp.
Khi nhập một form HTML thì kết quả sẽ được gửi đi theo hai cách: GET hayPOST. Nếu dùng GET, thì tất cả các tên biến và giá trị của nó sẽ xuất hiện trongchuỗi URL.
Ví dụ 4.I.1-1: Có một trang web ứng dụng cho phép thành viên đã được thay đổimật khẩu.
+ username là tên người cần thay đổi mật khẩu.+ newpass là mật khẩu mới cho usernameTuy nhiên, bằng cách thay đổi tham số như sau:
</div><span class="text_page_counter">Trang 39</span><div class="page_container" data-page="39"><i><small>Chương 4: Thao tác trên tham số truyền</small></i>
• Ngồi ra, với những thơng tin có giá trị, cần mã hố thơng tin này trước khicho hiển thị trên trình duyệt để tránh hacker có thể sửa đổi tùy ý.
Thơng tin có thể được chuyển đổi thông qua một biến ẩn của form, gọi là HiddenForm Field. Biến ẩn form không hiển thị trên màn hình trình duyệt nhưng ngườidùng có thể tìm thấy nội dung của nó trong “ view source ”, vì thế đây là mộtđiểm yếu để hacker lợi dụng bằng cách lưu nội dung trang web xuống trình duyệt,thay đổi nội dung trang và gửi đến trình chủ.
</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40"><i><small>Chương 4: Thao tác trên tham số truyền</small></i>
Ví dụ 4.II.1-1: Form gốc có nội dung như sau:
<small><form action=" method="POST">...</small>
<b><small><input type="hidden" name="giaca" value="99.99"></small></b>
Nếu khơng có sự thay đổi nào thì u cầu đến trình chủ có nội dung :
<small>POST /cuahang.pl HTTP/1.0...</small>
Nhưng nếu hacker gán một giá trị khác cho trường “giaca” :
<small><form action=" method="POST">...</small>
<b><small><input type="hidden" name="giaca" value="0.99"></small></b>
thì yêu cầu sẽ thay đổi:
<small>POST /cuahang.pl HTTP/1.0...</small>
Ngoài việc thay đổi nội dung biến ẩn của form, hacker còn biến đổi nội dung cácthành phần trong form, như chiều dài của một ô nhập dữ liệu để thực hiện việc tấncông “BUFFER OVERFLOW”, …
</div>