Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
LỜI MỞ ĐẦU
Trong thời đại ngày này nay internet đã rất trở nên quen thuộc và là một công cụ hữu
ích để một đất nước giới thiệu hình ảnh hay đơn giản chỉ là một trang web cá nhân của
một ai đó giới thiệu về mình. Tất cả đã kéo theo sự phát triển không ngừng của các ứng
dụng web. Và dần dần khái niệm ứng dụng web đã trở nên phổ biến .Khi mà trên
internet ,ứng dụng web đã trở lên phổ biến ,ứng dụng một cách rộng rãi thì các cuộc tấn
công ứng dụng web cũng phát triển hết sức phức tạp. Điều này đã đặt ra vấn đề cấp thiết
cần làm như thế nào để bào đảm an toàn thông tin cho ứng dụng web, thông tin của
người sử dụng. Các khái niệm chuyên môn về ứng dụng web và tấn công ứng dụng web
cũng dần trở nên phổ biến hơn trong các tài liệu chuyên ngành . Các công cụ hỗ trợ
người lập trình web, người quản trị mạng cũng xuất hiện giúp tìm kiếm lỗ hổng của ứng
dụng web nhưng nó không theo kịp sự phát triển nhanh đến mức chóng mặt theo xu
hướng nhanh hơn đẹp hơn của các ứng dụng web, và tất nhiên nó không thể ngăn chặn
hoàn toàn các cuộc tấn công ứng dụng web, khi mà các cuộc tấn công ngày càng đa dạng
khai thác triệt để những lỗi của ứng dụng web, của người quản trị, hay người lập trình
ứng dụng web.
Thống kê cho thấy 75% cuộc tấn công internet là tấn công ứng dụng web,nó gây ra
những thiệt hại vô cùng to lớn, vì vậy việc tìm hiểu về tấn công ứng dụng web là rất cần
thiết nhằm có cách phòng chống tấn công và bảo mật ứng dụng web hiệu quả trở thành
một yêu cầu cấp thiết..
Do đây là một xu thế tất yếu của thời, nên việc tìm hiểu và nghiên cứu về ứng dụng
web sẽ giúp ích rất nhiều cho các nhà lập trình web mới, hay các quản trị viên mới còn
ít kinh nghiệm trong việc quản trị hệ thống mạng của mình, phòng tránh , hay khắc phục
SV :Nguyễn Văn Đại
1
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
những lỗi của ứng dụng web. Đồ án này được thực hiện nhằm mục đích giới thiệu rõ
hơn về ứng dụng web nhằm tránh những nhầm lẫn và đồng thời tìm hiểu về những tấn
công ứng dụng web phổ dụng nhằm có cách phòng chống ,bảo mật cho ứng dụng web
hợp lý
SV :Nguyễn Văn Đại
2
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
Lời cảm ơn
Em xin cảm ơn khoa công nghệ thông tin trường cao đẳng Công
Thương đã tạo điều kiện thuận lợi để em hoàn thành đồ án này
Cảm ơn Thầy Huỳnh Nguyễn Thành Luân và các thầy trong
khoa công nghệ thông tin đã tận tình hướng dẫn cung cấp tài liệu và
giúp đỡ em làm đồ án này.
SV :Nguyễn Văn Đại
3
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
Mục Lục
Đồ án của tôi những phần sau
Giới thiệu về Đồ án
Chương 1: Giới thiệu tổng quan về ứng dụng web
Chương 2:Giới thiệu về những thuật ngữ và khái niệm liên quan
Chương 3: Giới thiệu Sơ lược về một số cách tấn công ứng dụng web
cơ bản
Chương chương 4: Giới thiệu về cách sử dụng một số công cụ phổ dụng
Kết luận và hướng phát triển của đồ án
SV :Nguyễn Văn Đại
4
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ỨNG
DỤNG WEB
1.1 khái niệm về ứng dụng web(website widget hay web
application)
Mang tính kỹ thuật nhiều hơn có thể giải thích các ứng dụng Web truy vấn máy
chủ chứa nội dung (chủ yếu trên cơ sở dữ liệu lưu trữ nội dung) và tạo tài liệu Web động
để phục vụ yêu cầu của máy khách (chính là người dùng website). Tài liệu được tạo
trong kiểu định dạng tiêu chuẩn hỗ trợ trên tất cả mọi trình duyệt (như HTML,
XHTML). JavaScript là một dạng script client-side cho phép yếu tố động có ở trên từng
trang (như thay đổi ảnh mỗi lần người dùng di chuột tới). Trình duyệt Web chính là chìa
khóa. Nó dịch và chạy tất cả script, lệnh… khi hiển thị trang web và nội dung được yêu
cầu
Dưới góc độ chức năng, ứng dụng Web là các chương trình máy tính cho phép
người dùng website đăng nhập, truy vấn vào ra dữ liệu qua mạng Internet trên trình
duyệt Web yêu thích của họ. Dữ liệu sẽ được gửi tới người dùng trong trình duyệt theo
kiểu thông tin động (trong một định dạng cụ thể, như với HTML thì dùng CSS) từ ứng
dụng Web qua một Web Server.
Để hiểu hết được ý nghĩa của khái niệm này chúng ta cùng đi sâu vào tìm hiểu
tiếp mô hình cấu trúc chức năng và nhiệm vụ của ứng dụng web.
SV :Nguyễn Văn Đại
5
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
1.2 Cấu trúc,chức năng,giao diện&nguyên tắc hoạt động cơ
bản của ứng dụng web
1.2.1 Cấu trúc cơ bản của một ứng dụng web
Mô hình của một ứng dụng web đơn giản chính là mô hình MVC (Model - View -
Controller).
Tầng Model: chứa các code connect tới database,truy vấn và thêm xóa sửa dữ liệu.
Tầng View: chứa các code tạo giao diện tương tác với người dùng, dữ liệu được vẽ ra
nhu thế nào
Tầng Controller: chứa các code điều khiển dòng dữ liệu (flow control), gắn kết tầng
Mode và tầng View lại với nhau.
Ứng dụng được chia thành các layer như thế sẽ tăng tính reuse và dễ dàng mở rộng.
Chẳng hạn nếu chúng ta muốn ứng dụng có thể truy xuất trên di dộng, chúng ta chỉ cần
tạo một tầng view mới riêng cho di động, tầng model và controller không thay dổi. Hay
nếu chúng ta muốn thay đổi database, việc đó cũng dễ dàng hơn, chỉ cần ta tạo tầng
model mới, phần view và controller không bị ảnh hưởng.
Mô hình thể hiện quan hệ của ba lớp trong ứng dụng web:
Hình 1. mô hình 3 tầng của một ứng dụng web
SV :Nguyễn Văn Đại
6
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
Còn đây là mô hình của một dịch vụ ứng dụng web:
Hình 2. Mô hình dịch vụ ứng dụng web đơn giản
Tầng Presentation: được dùng để giao tiếp với người dùng, nhiệm vụ chính là hiển thị dữ
liệu và nhận dữ liệu từ người dùng.
- Tầng Business Logic: nhiệm vụ chính là cung cấp các chức năng của phần mềm.
- Tầng Data: lưu trữ dữ liệu, cho phép lớp Business Logic có thể tìm kiếm, trích xuất,
cập nhật… dữ liệu.
1.2.2 Giao diện của một ứng dụng web
Giao diện web đặt ra rất ít giới hạn khả năng người dùng. Thông qua Java,
JavaScript, DHTML, Flash và những công nghệ khác, những phương pháp chỉ ứng dụng
mới có như vẽ trên màn hình, chơi nhạc, và dùng được bàn phím và chuột tất cả đều có
thể thực hiện được Những kỹ thuật thông thường như kéo thả cũng được hỗ trợ bởi
những công nghệ trên.
Những nhà phát triển web thường dùng ngôn ngữ kịch bản phía người dùng để
thêm hiệu quả các tính năng, đặc biệt là tạo ra một cảm giác giao tiếp trực quan mà
không cần phải tải trang lại (điều mà nhiều người dùng cảm thấy ngắt quãng). Vừa rồi,
những công nghệ đã được phát triển để phối hợp ngôn ngữ kịch bản phía người dùng với
SV :Nguyễn Văn Đại
7
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
công nghệ phía máy chủ như PHP. Ajax, một kỹ thuật phát triển web sử dụng kết hợp
nhiều công nghệ khác nhau, là một ví dụ về công nghệ hiện đang tạo ra ngày càng nhiều
trải nghiệm tương tác hơn.
1.2.3 Chức năng cơ bản của các ứng dụng web
Ứng dụng web phổ biến nhờ vào sự có mặt vào bất cứ nơi đâu của một chương
trình. Khả năng cập nhật và bảo trì ứng dụng Web mà không phải phân phối và cài đặt
phần mềm trên hàng ngàn máy tính là lý do chính cho sự phổ biến của nó. Ứng dụng
web được dùng để hiện thực Webmail, bán hàng trực tuyến, đấu giá trực tuyến, wiki,
diễn đàn thảo luận, Weblog, MMORPG, Hệ quản trị quan hệ khách hàng và nhiều chức
năng khác..
Web cũng là kênh bán hàng thông minh cho hàng nghìn tổ chức, doanh nghiệp,
lớn có, nhỏ có. Với hơn một tỷ người dùng Internet ngày nay (nguồn: Computer Industry
Almanac 2006), thương mại điện tử Mỹ sử dụng khoảng 102 tỷ đô la trong năm 2006
cho giao dịch (nguồn: comScore Networks 2007).
Tất cả dữ liệu như vậy cần phải được đóng gói, lưu trữ, xử lý và truyền vận theo
một cách nào đó, có thể sử dụng ngay hoặc vào một ngày nào đó sau này. Các ứng dụng
Web, trong lĩnh vực đăng ký, đệ trình, truy vấn, đăng nhập, bán hàng và hệ thống quản
lý nội dung chính là các website widget cho phép thực hiện tất cả công việc mong muốn.
Web chính là là yếu tố cơ bản giúp doanh nghiệp tăng cường hình ảnh trực tuyến
của mình trên thế giới mạng, tạo ra và duy trì nhiều mối quan hệ đem lại lợi nhuận lâu
dài với khách hàng tiềm năng và khách hàng hiện tại.
Không nghi ngờ gì là các ứng dụng Web đã trở thành thứ hiện hữu ở khắp mọi nơi trên
thế giới. Nhưng do tính kỹ thuật cao và yếu tố tổng hợp phức tạp tự nhiên nên chúng
không được nhiều người biết đến chính xác, thậm chí bị hiểu nhầm trầm trọng trong
cuộc sống bận rộn hằng ngày.
Website ngày nay khác xa so với kiểu đồ họa và văn bản tĩnh của thế kỷ mười
chín hay thời kỳ trước đó. Các trang Web hiện đại cho phép người dùng lấy xuống nội
SV :Nguyễn Văn Đại
8
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
dung động cá nhân hóa theo thiết lập và tham chiếu riêng. Hơn nữa chúng cũng có thể
chạy các script trên máy khách, có thể “thay đổi” trình duyệt Internet thành giao diện
cho các ứng dụng như thư điện tử, phần mềm ánh xạ tương tác (Yahoo Mail, Google
Maps).
Quan trọng nhất là website hiện đại cho phép đóng gói, xử lý, lưu trữ và truyền
tải dữ liệu khách hàng nhạy cảm (như thông tin cá nhân, mã số thẻ tín dụng, thông tin
bảo mật xã hội …) có thể dùng ngay hoặc dùng định kỳ về sau. Và, điều này được thực
hiện qua các ứng dụng Web. Đó có thể là thành phần webmail (thư điện tử), trang đăng
nhập, chương trình hỗ trợ và mẫu yêu cầu sản phẩm hay hoạt động mua bán, hệ thống
quản lý nội dung, phát triển website hiện đại, cung cấp cho các doanh nghiệp phương
tiện cần thiết để liên lạc với khách hàng tương lai và khách hàng hiện tại.
1.2.4 Nguyên tắc hoạt động cơ bản của một ứng dụng web
Trong dạng tính toán chủ-khách trước đây, mỗi ứng dụng có chương trình khách
riêng của nó sẽ phục vụ như giao diện người dùng và phải được cài đặt riêng rẽ trên mỗi
máy tính cá nhân của người dùng. Sự nâng cấp phần máy chủ của ứng dụng sẽ cần nâng
cấp tất cả máy khách đã được cài trên mỗi máy trạm người dùng, thêm vào đó là chi phí
hỗ trợ và giảm năng suất.
Ứng dụng web linh hoạt tạo ra một loạt các tài liệu Web ở định dạng chuẩn được
hỗ trợ bởi những trình duyệt phổ biến như HTML/XHTML. Ngôn ngữ kịch bản phía
người dùng ở dạng ngôn ngữ chuẩn như JavaScript thường được thêm vào để có thêm
những yếu tố động trong giao diện người dùng. Nói chung, mỗi trang Web đơn lẻ được
gửi tới người dùng như một tài liệu ổn định, nhưng thứ tự các trang có thể cung cấp cảm
giác trực quan, khi những gì người dùng nhập vào sẽ được trả về thông qua thành phần
mẫu Web được nhúng vào trong đánh dấu trang. Trong quá trình giao dịch đó, trình
duyệt Web sẽ thông dịch và hiển thị trang, và hoạt động như một người dùng chung cho
bất kỳ ứng dụng Web nào
Theo mô hinh MVC (Model - View - Controller).
SV :Nguyễn Văn Đại
9
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
Hình 3. Mô tả hoạt động của một ứng dụng web
Các bước hoạt động của một ứng dụng web đơn giản
Bước 1 : Browser tạo một HTTP Request gửi tới ứng dụng web
bước 2: Controller chính của Struts là class ActionServlet sẽ bắt request này, phân tích
URL của nó, và dựa vào file struts-config.xml để gửi request này tới Action class tương
ứng
Bước 3: Action class là một class của Struts Framework. Ứng dụng của chúng tathường
extends từ class này và viết code để sử lý những business tương ứng. Chẳng hạn ta sẽ có
một LoginAction để xử lý việc user login, logout.
Bước 4: Action class có thể truy xuất, cập nhật database nếu cần thiết.
Bước 5: Khi Action class thực hiện việc xử lý business xong, nó sẽ gửi yêu cầu
forward/redirect, cùng với dữ liệu (nếu có) về controller.
SV :Nguyễn Văn Đại
10
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
Bước 6: Controller chuyển control đến trang JSP tương ứng ở tầng view. Nếu trang JSP
này có sử dụng dữ liệu, controller sẽ cung cấp cho nó (đây chính là dữ liệu mà action đã
tạo ra và đua cho controller
Bước 7: Sau khi trang JSP đã chuẩn bị xong, Controller tạo một HTTP Response gửi về
cho browser, để browser hiển thị ra màn hình.
1.2.5 Vấn đề bảo mật ứng dụng web
Khi mà ứng dụng web phát triển rất nhanh về mọi mặt, khả năng ứng dụng một
cách rộng rãi thì vấn đề bảo mật cho ứng dụng web cũng được chú trọng hơn. Mặc dù
không thể phủ nhận những cải tiến nâng cao đáng kể hiện nay, nhưng vấn đề về bảo mật
trong ứng dụng Web vẫn không ngừng tăng lên. Nguyên nhân có thể xuất phát từ các
đoạn mã không phù hợp. Nhiều điểm yếu nghiêm trọng hay các lỗ hổng cho phép hacker
xâm nhập thẳng và truy cập vào cơ sở dữ liệu tách lấy dữ liệu nhạy cảm. Nhiều cơ sở dữ
liệu chứa thông tin giá trị (như chi tiết cá nhân, thông tin tài chính) khiến chúng trở
thành đích nhắm thường xuyên của hầu hết hacker. Mặc dù hoạt động tấn công phá hoại
website doanh nghiệp vẫn diễn ra thường xuyên, nhưng bây giờ tin tặc thích tăng cường
khả năng truy cập dữ liệu nhạy cảm nằm trên trình chủ chứa database hơn vì lợi nhuận
khổng lồ từ các vụ mua bán dữ liệu đem lại.
SV :Nguyễn Văn Đại
11
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
Hình 3 Mô hình hoạt động của một ứng dụng web
Trong khung hoạt động mô tả ở trên, bạn có thể thấy thật dễ dàng cho một hacker
truy cập nhanh chóng thông tin nằm trên cơ sở dữ liệu chỉ với một chút sáng tạo. Nếu
may mắn hơn chúng có thể gặp lỗ hổng xuất phát từ sự cẩu thả hay lỗi người dùng trên
các ứng dụng Web.
Như đã nói, website phụ thuộc vào cơ sở dữ liệu để phân phối thông tin được yêu
cầu cho người dùng. Nếu ứng dụng Web không an toàn (như có lỗ hổng, gặp phải một
kiểu kỹ thuật hacking nào đó), toàn bộ cơ sở dữ liệu chứa thông tin nhạy cảm sẽ gặp
nguy hiểm nghiệm trọng.
Một số hacker có thể chèn mã độc hại vào ứng dụng Web có lỗ hổng để lừa đảo
người dùng và dẫn họ tới website phishing. Kỹ thuật này được gọi là Cross-site
Scripting, có thể được dùng ngay cả khi bản thân Web Server và nơi chứa cơ sở dữ liệu
không có lỗ hổng nào.
Một cuộc nghiên cứu gần đây chỉ ra rằng 75% các cuộc tấn công mạng được thực
hiện ở mức ứng dụng Web.Website và các ứng dụng Web liên quan luôn phải sẵn sàng
SV :Nguyễn Văn Đại
12
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
24/7 để cung cấp dịch vụ theo yêu cầu khách hàng, yêu cầu từ phía nhân viên, nhà cung
cấp và nhiều người liên quan khác.
ZF Tường lửa, SSL không thể bảo vệ ứng dụng Web trước mọi hoạt động
hacking, đơn giản vì truy cập vào website phải để ở chế độ public để bất kỳ ai cũng có
thể ghé thăm website được. Tất cả hệ thống cơ sở dữ liệu hiện đại (như Microsoft SQL
Server, Oracle, MySQL) đều có thể truy cập qua một số cổng cụ thể (như cổng 80, 443).
Nếu muốn, một người nào đó có thể kết nối trực tiếp tới cơ sở dữ liệu một cách hiệu quả
khi vượt qua cơ chế bảo mật của hệ điều hành. Các cổng này để mở nhằm cho phép liên
lạc với hoạt động giao thông mạng hợp pháp, và do đó cũng hình thành nên lỗ hổng lớn
nguy hiểm.
Các ứng dụng Web thường truy cập dữ liệu cuối như cơ sở dữ liệu khách hàng,
điều khiển dữ liệu có giá trị và do đó rất khó để có thể tuyệt đối an toàn. Lúc này truy
cập dữ liệu thường không kèm script cho phép đóng gói và truyền tải dữ liệu. Nếu một
hacker nhận ra điểm yếu trong một script, anh ta có thể dễ dàng mở lại lưu lượng sang
khu vực khác và chia lẻ bất hợp pháp chi tiết cá nhân người dùng, dù đôi khi không hề
chủ tâm làm điều đó
Hầu hết ứng dụng Web đều là tự tạo, do đó ít có được các kiểm tra trình độ hơn
so với phần mềm cùng loại. Do đó các ứng dụng tùy biến thường dễ bị tấn công hơn.
Có thể nói ứng dụng Web là một cổng vào (gateway) của cơ sở dữ liệu, nhất là các ứng
dụng tùy biến. Chúng không được phát triển với mức bảo mật tốt nhất vì không phải qua
các kiểm tra bảo mật thông thường. Nói chung, bạn cần trả lời câu hỏi: “Phần nào trên
website chúng ta nghĩ là an toàn nhưng lại mở cửa cho các cuộc tấn công?” và “Dữ liệu
nào chúng ta đem vào một ứng dụng khiến nó thực hiện một số điều không nên
làm?”.Đó là công việc của phần mềm rà soát lỗ hổng Web.
Hiện nay , hacker có rất nhiều cách tấn công một ứng dụng web từ các kĩ thuật cơ
bản cho đến những kĩ thuật đòi hỏi kĩ thuật và công nghệ cao cao. Các công cụ(tool) hỗ
trợ ra đời ngày càng nhiều , hỗ trợ rất nhiều cho người quản trị mạng , tìm ra những lỗ
hổng để có bản vá lỗi kịp thời nhưng đồng thời nó cũng là một con dao hai lưỡi. Hacker
SV :Nguyễn Văn Đại
13
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
có thể dùng những tool này để phát hiện những lỗ hổng của một ứng dụng web và từ đó
sẽ có cách tấn công tương ứng vào lỗ hổng này gây ra rất nhiều tổn thất
Vì vậy việc nghiên cứu về các kĩ thuật tấn công và những tool cơ bản hiện nay là một
nhu cầu tất yếu trong việc nghiên cứu bảo mật ứng dụng web.
SV :Nguyễn Văn Đại
14
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
CHƯƠNG 2: GIỚI THIỆU VỀ CÁC THUẬT NGỮ
VÀ KHÁI NIỆM LIÊN QUAN
2.1 Các khái niệm và thuật ngữ thường dùng
2.1.1 Các khái niệm chung về ứng dụng web
Web browser (trình duyệt web) là các ứng dụng phần mềm cho phép người dùng
truy vấn dữ liệu và tương tác với nội dung nằm trên trang Web bên trong website.
Trang Web là tĩnh; người dùng gửi yêu cầu một tài nguyên nào đó, và server sẽ
trả về tài nguyên đó. Các trang Web không có gì hơn là một văn bản được định dạng và
phân tán. Đối với các trình duyệt, thì các trang Web tĩnh không phải là các vấn đề khó
khăn, và trang Web lúc đầu chỉ để thông tin về các sự kiện, địa chỉ, hay lịch làm việc qua
Internet mà thôi, chưa có sự tương tác qua các trang Web.
Web "ĐỘNG" là thuật ngữ được dùng để chỉ những website được hỗ trợ bởi một
phần mềm cơ sở web, nói đúng hơn là một chương trình chạy được với giao thức http.
Thực chất, website động có nghĩa là một website tĩnh được "ghép" với một phần mềm
web (các modules ứng dụng cho Web). Với chương trình phần mềm này, người chủ
website thực sự có quyền điều hành nó, chỉnh sửa và cập nhật thông tin trên website của
mình mà không cần phải nhờ đến những người chuyên nghiệp.
Tên miền (Domain name) là định danh của website trên Internet. Tên miền
thường gắn kèm với tên công ty và thương hiệu của doanh nghiệp. Tên miền là duy nhất
và được cấp phát cho chủ thể nào đăng ký trước.
+Tên miên có hai loại
- Tên miền quốc tế dạng: www.tencongty.com (.net, .biz .org, .info...)
SV :Nguyễn Văn Đại
15
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
- Tên miền quốc gia dạng: www.tencongty.com.vn (hoặc .net.vn, .biz.vn .org.vn,
.gov.vn...)
- Web hosting là nơi không gian trên máy chủ có cài dịch vụ Internet như ftp,www,
nơi đó bạn có thể chứa nội dung trang web hay dữ liệu trên không gian đó. Lý do bạn
phải thuê Web Hosting để chứa nội dung trang web, dịch vụ mail, ftp, vì những máy
tính đó luôn có một địa chỉ cố định khi kết nối vào Internet (đó là địa chỉ IP) , còn như
nếu bạn truy cập vào internet như thông thường hiện nay thông qua các IPS (Internet
Service Provider - Nhà cung cấp dịch vụ Internet) thì địa chỉ IP trên máy bạn luôn bị
thay đổi, do đó dữ liệu trên máy của bạn không thể truy cập được từ những máy khác
trên Internet.
2.1.2 Thuật ngữ ,khái niệm về các công cụ liên quan đến ứng
dụng web
CGI: Giải pháp đầu tiên để làm các trang Web động là Common Gateway
Interface (CGI). CGI cho phép tạo các chương trình chạy khi người dùng gửi các yêu
cầu. Giả sử khi cần hiển thị các các mục để bán trên Web site – với một CGI script ta
có thể truy nhập cơ sở dữ liệu sản phẩm và hiển thị kết quả. Sử dụng các form HTML
đơn giản và các CGI script, có thể tạo các “cửa hàng” ảo cho phép bán sản phẩm cho
khách hàng qua một trình duyệt. CGI script có thể được viết bằng một số ngôn ngữ từ
Perl cho đến Visual Basic.
Tuy nhiên, CGI không phải là cách an toàn cho các trang Web động. Với CGI,
người khác có thể chạy chương trình trên hệ thống. Vì thế có thể chạy các chương
trình không mong muốn gây tổn hại hệ thống. Nhưng dù vậy, cho đến hôm nay thì
CGI vẫn còn được sử dụng.
Applet:Tháng 5/1995, John Gage của hãng Sun và Andressen (nay thuộc
Netscape Communications Corporation) đã công bố một ngôn ngữ lập trình mới có tên
Java. Netscape Navigator đã hỗ trợ ngôn ngữ mới này, và một con đường mới cho các
trang Web động được mở ra, kỷ nguyên của applet bắt đầu.
SV :Nguyễn Văn Đại
16
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
Applet cho phép các nhà phát triển viết các ứng dụng nhỏ nhúng vào trang Web.
Khi người dùng sử dụng một trình duyệt hỗ trợ Java, họ có thể chạy các applet trong
trình duyệt trên nền máy ảo Java Virtual Machine (JVM). Dù rằng applet làm được nhiều
điều song nó cũng có một số nhược điểm: thường bị chặn bởi việc đọc và ghi các file hệ
thống, không thể tải các thư viện, hoặc đôi khi không thể thực thi trên phía client. Bù lại
những hạn chế trên, applet được chạy trên một mô hình bảo mật kiểu sandbox bảo vệ
người dùng khỏi các đoạn mã nguy hiểm. Có những lúc applet được sử dụng rất nhiều,
nhưng nó cũng có những vấn đề nảy sinh: đó là sự phụ thuộc vào máy ảo Java JVM, các
applet chỉ thực thi khi có môi trường thích hợp được cài đặt phía client, hơn nữa tốc độ
của các applet là tương đối chậm vì thế applet không phải là giải pháp tối ưu cho Web
động.
JavaScript:Cùng thời gian này, Netscape đã tạo ra một ngôn ngữ kịch bản gọi là
JavaScript. JavaScript được thiết kế để việc phát triển dễ dàng hơn cho các nhà thiết kế
Web và các lập trình viên không thành thạo Java. (Microsoft cũng có một ngôn ngữ kịch
bản gọi là VBScript). JavaScript ngay lập tức trở thành một phương pháp hiệu quả để tạo
ra các trang Web động.
Việc người ta coi các trang như là một đối tượng đã làm nảy sinh một khái niệm
mới gọi là Document Object Model (DOM). Lúc đầu thì JavaScript và DOM có một sự
kết hợp chặt chẽ nhưng sau đó chúng được phân tách. DOM hoàn toàn là cách biểu diễn
hướng đối tượng của trang Web và nó có thể được sửa đổi với các ngôn ngữ kịch bản
bất kỳ như JavaScript hay VBScript.
Tổ chức World Wide Web Consortium (W3C) đã chuẩn hóa DOM, trong khi
European Computer Manufacturers Association (ECMA) phê duyệt JavaScript dưới
dạng đặc tả ECMAScript.
JSP/Servlet, ASP và PHP:Cùng với Java, Sun đồng thời đưa ra một công nghệ
mới gọi là servlet. Các đoạn mã Java sẽ không chạy phía client như với applet; chúng sẽ
được chạy trên một ứng dụng phía server. Servlet cũng đồng thời phục vụ các CGI
SV :Nguyễn Văn Đại
17
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
script. Servlet là một bước tiến lớn, nó đưa ra một thư viện hàm API trên Java và một
thư viện hoàn chỉnh để thao tác trên giao thức HTTP.
JavaServer Page (JSP) là một công nghệ lập trình Web của Sun, cùng với nó là
một công nghệ khác của Microsoft - Active Server Pages (ASP), JSP là công nghệ đòi
hỏi một trình chủ hiểu được Java. Microsoft đã nghiên cứu các nhược điểm của servlet
và tạo ra ASP dễ dàng hơn để thiết kế các trang web động. Microsoft thêm các bộ công
cụ rất mạnh và sự tích hợp rất hoàn hảo với các Web server. JSP và ASP có những nét
tương đương vì chúng đều được thiết kế để phân tách qua trình xử lí khỏi quá trình biểu
diễn. Có sự khác biệt về kỹ thuật, song cả hai đều cho phép các nhà thiết kế Web tập
trung vào cách bố trí (layout) trong khi các nhà phát triển phần mềm thì tập trung vào
các kỹ thuật lập trình logic.
Flash:Năm 1996, FutureWave đã đưa ra sản phẩm FutureSplash Animator. Sau
đó FutureWave thuộc sở hữu của Macromedia, và công ty này đưa ra sản phẩm Flash.
Flash cho phép các nhà thiết kế tạo các ứng dụng hoạt họa và linh động. Flash không đòi
hỏi các kỹ năng lập trình cao cấp và rất dễ học. Cũng giống như các nhiều giải pháp
khác Flash yêu cầu phần mềm phía client. Chẳng hạn như gói Shockwave Player plug-in
có thể được tích hợp trong một số hệ điều hành hay trình duyệt.
DHTML:Khi Microsoft và Netscape đưa ra các version 4 của các trình duyệt của
họ, thì các nhà phát triển Web có một lựa chọn mới: Dynamic HTML (DHTML).
DHTML không phải là một chuẩn của W3C; nó giống một bộ công cụ thương mại hơn.
Trong thực tế nó là một tập hợp gồm HTML, Cascading Style Sheets (CSS), JavaScript,
và DOM. Tập hợp các công nghệ trên cho phép các nhà pháp triển sửa đổi nội dung và
cấu trúc của một trang Web một cách nhanh chóng. Tuy nhiên, DHTML yêu cầu sự hỗ
trợ từ các trình duyệt. Mặc dù cả Internet Explorer và Netscape hỗ trợ DHTML, nhưng
các thể hiện của chúng là khác nhau, các nhà phát triển cần phải biết được loại trình
duyệt nào mà phía client dùng. DHTML thật sự là một bước tiến mới, nhưng nó vẫn cần
một sự qui chuẩn để phát triển. Hiện nay DHTML vẫn đang trên con đường phát triển
mạnh.
SV :Nguyễn Văn Đại
18
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
XML:Kể từ khi ra đời vào giữa năm 1990, eXtensible Markup Language (XML)
của W3C dẫn xuất của SGML đã trở nên rất phổ biến. XML có mặt ở khắp nơi,
Microsoft Office 12 cũng sẽ hỗ trợ định dạng file XML.Ngày nay chúng ta có rất nhiều
dạng dẫn xuất của XML cho các ứng dụng Web (tất nhiên là có cả XHTML): XUL của
Mozilla; XAMJ, một sản phẩm mã nguồn mở trên nền Java; MXML từ Macromedia; và
XAML của Microsoft.
2.1.3 Các khái niệm và thuật ngữ liên quan đến tấn công và bảo
mật ứng dụng web
2.1.3.1 Khái niệm hacker
Khái niệm hacker có từ những 50, 60 của thế kỉ trước , và cho đến nay trải qua
một thời gian phát triển khá dài hacker chia làm 4 loại:
- Hacker mũ trắng: là những chuyên gia lập trình chuyên tìm các lỗi của phần mềm với
mục đích sửa chữa, xây dựng hệ thống an toàn hơn.
- Hacker mũ đen: đối lập với hacker mũ trắng, là những hacker phá hoại và trục lợi cho
mình.
- Hacker mũ xanh/samurai: là những chuyên gia lập trình tài năng, được các hãng như
Microsoft mời về làm việc chuyên tìm lỗi cho phần mềm của họ.
- Hacker mũ xám hay mũ nâu: là những người đôi khi làm công việc của hacker mũ
trắng nhưng vẫn làm công việc của hacker mũ đen.
- Dù tự nhận mình là giới nào, họ vẫn đang làm công việc xâm nhập hệ thống thông qua
những lỗ hổng bảo mật. Vì vậy tôi sẽ sủ dụng thuật ngữ hacker để chỉ nhũng người tấn
công ứng dụng web.
2.1.3.2 HTTP HEARDER
HTTP HEARDER là trường phần đầu chứa các thông số hoạt động của một yêu
cầu HTTP giữa máy chủ và máy khách .Những thông tin trình khách gửi trình chủ gọi là
SV :Nguyễn Văn Đại
19
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
HTTP requests(yêu cầu ),những thông tin trình chủ gửi cho trình khách gọi là HTTP
responses(trả lời )
Các trường tiêu đề xác định đặc điểm khác nhau của việc chuyển dữ liệu được
yêu cầu hoặc các dữ liệu được cung cấp trong thông điệp. HTTP Header có thể có nhiều
dòng và thường bắt đầu với tên trường, chấm dứt với một ký tự đại tràng, tiếp theo là giá
trị trường. Tên trường và các giá trị có thể là bất kỳ ứng dụng cụ thể chuỗi , nhưng tập
lõi các lĩnh vực được chuẩn hóa bởi Internet Engineering Task . Một số tham số được sử
dụng cả trong trình khách mà trình chủ.
- (Có bảng danh sách các tham số ở cuối đồ án .)
2.1.3.3 SESSION
HTTP là giao thức hướng đối tượng phi trạng thái, nó không lưu trữ trạng thái
làm việc giữa trình chủ và trình khách . Điều này gây khó khăn cho việc quản lý một số
ứng dụng web bởi vì trình chủ không biết rằng trước đó trình khách đã ở trạng thái nào.
Để giải quyết vấn đề này , người ta đưa ra khái niệm SESSION(phiên làm việc) vào giao
thức HTTP.
SessionID là một chuỗi để chứng thực phiên làm việc . Một số trình chủ sẽ cấp
phát session cho người dùng khi họ xem trang web trên trình chủ
-Để duy trì phiên làm việc sessionID thường được lưu trữ vào :
+Biến trên URL
+Biến ẩn from
+Cookie
-Phiên làm việc chỉ tồn tại trong khoảng thời gian cho phép, thời gian này được quy định
tại trình chủ hoặc bởi ứng dụng thực thi.Trình chủ tự động giải phóng phiên làm việc để
khôi phục tài nghuyên hệ thống.
2.1.3.4 COOKIE
SV :Nguyễn Văn Đại
20
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
Là một phần dữ liệu nhỏ có cấu trúc được chia sẻ giữa trình chủ và trình duyệt
người dùng.
Các cookie được lưu trũ dưới dạng những file dữ liệu nhỏ dạng text , được ứng
dụng tạo ra để lưu trữ truy tìm nhận biết những người dùng đã ghé thăm trang web và
những vùng họ đã ngang qua trang. Những thông tin nay có thể bao gôm thông tin
người dùng, tài khoản, mật khẩu…cookie được trình duyệt của người dùng chấp nhận
lưu trên đĩa cứng của mình . Nhiều trình duyệt không tự động lưu trữ cookie mà còn phụ
thuộc vào người dùng có chấp nhận lưu nó hay không.
Những lần truy cập sau vào trang web đó ứng ứng dụng có thể sử dụng lại những
thông tin trong cookie(các thôgn tin tai khoản liên quan) mà người dùng không cần phải
đăng nhập hay cung cấp thêm thông tin gì cả.
Có nhiều cách phân loại cookie, phân loại theo đối tượng thiết lập của cookie.thì
cookie chia làm 2 loại: Cookie của bên thứ nhất là cookie được thiết lập bởi tên miền
trang web được liệt kê trong thanh địa chỉ. Cookie của bên thứ ba đến từ các nguồn tên
miền khác có các mục, chẳng hạn như quảng cáo hoặc hình ảnh, được nhúng vào trang.
Ngoài ra còn cách chia chia khác chia cookie thành 4 loại vì có secure/non-secure và
perisent/non- perisent nên ta có:
-Persistent và Secure
-Persistent và Non-Secure
- Non-Persistent và Secure
- Non-Persistent và Non-Secure
• Persistent cookies được lưu trữ dưới dạng tập tin .txt (ví dụ trình duyệt
NetscapeNavigator sẽ lưu các cookie thành một tập tin cookie.txt còn Internet
Explorer sẽ lưu thành nhiều tập tin *.txt trong đó mỗi tập tin là một cookie) trên
máy khách trong mộtkhoản thời gian xác định.
• Non-persistent cookie thì được lưu trữ trên bộ nhớ RAM của máy khách và sẽ bị
hủy khi đóng trang web hay nhận được lệnh hủy từ trang web.
SV :Nguyễn Văn Đại
21
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
• Secure cookies chỉ có thể được gửi thông qua HTTPS (SSL).
• Non-Secure cookie có thể được gửi bằng cả hai giao thức HTTPS hay HTTP.
Thựcchất là đối với secure cookie thì trình chủ sẽ cung cấp chế độ truyền bảo
mật.
Các thành phầncủa một cookie gồm:
1. Domain: Tên miền của trang web đã tạo cookie ( trong ví dụ trên
2. Flag: mang giá trị TRUE/FALSE - Xác định các máy khác với cùng tên
miền có được truy xuất đến cookie hay không.
3. Path: Phạm vi các địa chỉ có thể truy xuấtcookie.Ví dụ: Nếu path là
“/tracuu” thì các địa chỉ trong thư mục /tracuu cũng như tất cả các thư mục
con của nó như /tracuu/baomat có thể truy xuất đến cookie này. Còn nếu
giá tri là “/” thì cookie sẽ được truy xuấtbởitất cả địa chỉ thuộcmiềntrang
web tạo cookie.
4. Sercure: mang giá trị TRUE/FALSE - Xác định đây là một secure cookie
hay không nghĩa là kết nối có sử dụng SSL hay không.
5. Expiration:thời gian hết hạn của cookie, được tính bằng giây kể từ
00:00:00 giờ GMT ngày 01/01/1970. Nếu giá trị này không được thiết lập
thì trình duyệt sẽ hiểu đây là non-persistent cookie và chỉ lưu trong bộ nhớ
RAM và sẽ xoá nó khi trình duyệt bị đóng.
6. Name:Tên biến (trong trường hợp này là Apache)
7. Value: Với cookie được tạo ở trên thì giá trị của Apache là
64.3.40.151.16018996349247480 và ngày hết hạn là 27/07/2006, của tên miền
.
- Các cookie của Netscape (NS) đặt trong một tập tin Cookies.txt, với đường dẫnCác
cookie của Netscape (NS) đặt trong một tập tin Cookies.txt, với đường dẫn
là: C:\Program Files\Netscape\Users\UserName\Cookies.tx
-Các cookies của IE được lưu thành nhiều tập tin, mỗi tập tin là một cookie và
SV :Nguyễn Văn Đại
22
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
được đặt trong [C:]\Documents and Setting\[username]\Cookies (Win2000), đối
với win9x, thư mục cookies nằm trong thư mục [C:]\Windows\cookies.
-Kích thước tối đa của cookie là 4kb. Số cookie tối đa cho một tên miền là 20 cookie.
Cookie bị hủy ngay khi đóng trình duyệt gọi là “ session cookie ”.
• Bạn cần biết về cài đặt cookie vì cookie có thể cho phép các trang web theo dõi
điều hướng của bạn khi bạn truy cập vào các trang web đó.
2.1.3.5 PROXY
Proxy cung cấp cho người sử dụng truy xuất Internet những nghi thức đặt biệt
hoặc một tập những nghi thức thực thi trên dual_homed host hoặc basion host. Những
chương trình client của người sử dụng sẽ qua trung gian proxy server thay thế cho
server thật sự mà người sử dụng cần giao tiếp.
Proxy server xác định những yêu cầu từ client và quyết định đáp ứng hay không
đáp ứng, nếu yêu cầu được đáp ứng, proxy server sẽ kết nối với server thật thay cho
client và tiếp tục chuyển tiếp những yêu cầu từ client đến server, cũng như trả lờicủa
server đến client. Vì vậy proxy server giống cầu nối trung gian giữa server và client.
CHƯƠNG 3:CÁC KĨ THUẬT TẤN CÔNG ỨNG WEB
CƠ BẢN
SV :Nguyễn Văn Đại
23
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
A. Lý thuyết
1. KIỂM SOÁT TRUY CẬP WEB (Web Access Control)
Thâm nhập hệ thống qua cửa sau (Back door)
Trong quá trình thiết kế ứng dụng, những người phát triển ứng dụng có thể cài
một “cửa sau” (back door) để sau này có thể thâm nhập vào hệ thống một cách dễ
dàng.
2. CHIẾM HỮU PHIÊN LÀM VIỆC(Session Mangement)
1.1 Ấn định phiên làm việc (Session Fixation)
Là kĩ thuật tấn công cho phép hacker mạo danh người dùng hợp lệ bằng cách gửi
một session ID hợp lệ đến người dùng, sau khi người dùng đăng nhập vào hệ
thống thành công, hacker sẽ dùng lại session ID đó và nghiễm nhiên trở thành
người dùng hợp lệ.
2.2 Đánh cắp phiên làm việc (Session Hijacking)
Là kĩ thuật tấn công cho phép hacker mạodanh người dùng hợp lệ sau khi nạn
nhân đã đăng nhập vào hệ thống bằng cách giải mã session ID của họ được lưu
trữ trong cookie hay tham số URL, biến ẩn của form.
3 LỢI DỤNG THIẾU SÓT TRONG VIỆC KIỂM TRA DỮ
LIỆU HỢP LỆ (INPUT VALIDATION)
Hacker lợidụng những ô nhập dữ liệu để gửi đi một đoạn mã bất kì khiến cho hệ
thống phải thực thi đoạn lệnh đó hay bị phá vỡ hoàn toàn.
3.1 Kiểm tra tính đúng đắn của dữ liệu bằng ngôn ngữ phía trình duyệt
(Client-Side validation)
SV :Nguyễn Văn Đại
24
Đồ án :Ứng dụng web và vấn đề bảo mật GVHD:Thầy Huỳnh Nguyễn Thành Luân
Do ngôn ngữ phía trình duyệt ( JavaScript, VBScript..) đuợc thực thi trên trình
duyệt nên hacker có thể sửa đổi mã nguồn để có thể vô hiệu hóa sự kiểm tra.
3.2 Tràn bộ đệm (Buffer OverFlow)
Một khối lượng dữ liệu được gửi cho ứng dụng vượt quá lượng dữ liệu được cấp
phát khiến cho ứng dụng không thực thi được câu lệnh dự định kế tiếp mà thay vào đó
phải thực thi một đoạn mã bất kì do hacker đưa vào hệ thống. Nghiêm trọng hơn nếu
ứng dụng được cấu hình để thực thi với quyền root trên hệ thống.
3.3 Mã hoá URL (URL Encoding)
Lợi dụng chuẩn mã hóa những kí tựđặc biệt trên URL mà hacker sẽ mã hoá tự
động những kí tự bất hợp lệ-những kí tự bị kiểm tra bằng ngôn ngữ kịch bản-để vượt
qua vòng kiểm soát này.
3.4 Kí tự Meta (Meta-characters Sử dụng những kí tự đặc biệt
Hacker có thể chènthêm vào dữ liệu gửi những kí tự trong chuỗi câu lệnh như
<script> trong kĩ thuật XSS, ‘ -- trong SQL….để thực thi câu lệnh.
3.5 Vượt qua đường dẫn (Path Traversal):
Là phương pháp lợi dụng đường dẫn truy xuất một tập tin trên URL để trả kết quả
về cho trình duyệt mà hacker có thể lấy được nội dung tập tin bất kì trên hệ thống.
3.6 Chèn mã lệnh thực thi trên trình duyệt nạn nhân
(Cross- Site Scripting):
Đây là kĩ thuật tấn công chủ yếu nhằm vào thông tin trên máy tính của người
dùng hơn là vào hệ thống máy chủ. Bằng cách thêm một đoạn mã bất kì ( thường được
lập trình bằng ngôn ngữ kịch bản như JavaScript, VBScript…), hacker có thể thực hiện
việc đánh cắp thông tin quan trọng như cookie để từ đó trở thành người dùng hợp lệ của
ứng dụng…dựa trên những thông tin đánh cắp này. Cross- Site scripting cũng là một
kiểu tấn công “session hijacking”.
3.7 Thêm câu lệnh hệ thống (OS Command Injection)
Khả năng thực thi được những câu lệnh hệ thống hay những đoạn mã được thêm
SV :Nguyễn Văn Đại
25