Tải bản đầy đủ (.doc) (58 trang)

Tìm hiểu về SQL Server

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (389.16 KB, 58 trang )

Bài 1: Giới Thiệu SQL Server 2000
SQL Server 2000 là một hệ thống quản lý cơ sở dữ liệu (Relational
Database Management System (RDBMS) ) sử dụng Transact-SQL để trao đổi dữ
liệu giữa Client computer và SQL Server computer. Một RDBMS bao gồm
databases, database engine và các ứng dụng dùng để quản lý dữ liệu và các bộ phận
khác nhau trong RDBMS.
SQL Server 2000 được tối ưu để có thể chạy trên môi trường cơ sở dữ liệu
rất lớn (Very Large Database Environment) lên đến Tera-Byte và có thể phục vụ
cùng lúc cho hàng ngàn user. SQL Server 2000 có thể kết hợp "ăn ý" với các server
khác như Microsoft Internet Information Server (IIS), E-Commerce Server, Proxy
Server....
SQL Server có 7 editions:
• Enterprise : Chứa đầy đủ các đặc trưng của SQL Server và có thể chạy tốt
trên hệ thống lên đến 32 CPUs và 64 GB RAM. Thêm vào đó nó có các dịch
vụ giúp cho việc phân tích dữ liệu rất hiệu quả (Analysis Services)
• Standard : Rất thích hợp cho các công ty vừa và nhỏ vì giá thành rẻ hơn
nhiều so với Enterprise Edition, nhưng lại bị giới hạn một số chức năng cao
cấp (advanced features) khác, edition này có thể chạy tốt trên hệ thống lên
đến 4 CPU và 2 GB RAM.
• Personal: được tối ưu hóa để chạy trên PC nên có thể cài đặt trên hầu hết
các phiên bản windows kể cả Windows 98.
• Developer : Có đầy đủ các tính năng của Enterprise Edition nhưng được chế
tạo đặc biệt như giới hạn số lượng người kết nối vào Server cùng một lúc....
Ðây là edition mà các bạn muốn học SQL Server cần có. Chúng ta sẽ dùng
edition này trong suốt khóa học. Edition này có thể cài trên Windows 2000
Professional hay Win NT Workstation.
• Desktop Engine (MSDE): Ðây chỉ là một engine chạy trên desktop và
không có user interface (giao diện). Thích hợp cho việc triển khai ứng dụng
ở máy client. Kích thước database bị giới hạn khoảng 2 GB.
• Win CE : Dùng cho các ứng dụng chạy trên Windows CE
• Trial: Có các tính năng của Enterprise Edition, download free, nhưng giới


hạn thời gian sử dụng.
1.1. Cài Ðặt SQL Server 2000 (Installation)
Các bạn cần có Developer Edition và ít nhất là 64 MB RAM, 500 MB
hard disk để có thể install SQL Server. Bạn có thể install trên Windows Server hay
Windows XP Professional, Windows 2000 Professional hay NT Workstation nhưng
không thể install trên Win 98 family.
Vì một trong những đặc điểm của các sản phẩm Microsoft là dễ install nên
chúng tôi không trình bày chi tiết về cách install hay các bước install mà chỉ trình
bày các điểm cần lưu ý khi install mà thôi. Nếu các bạn gặp trở ngại trong việc
install thì có thể đưa lên forum để hỏi thêm. Khi install bạn cần lưu ý các điểm sau:
Ở màn hình thứ hai bạn chọn Install Database Server. Sau khi install
xong SQL Server bạn có thể install thêm Analysis Service nếu bạn thích.
Ở màn hình Installation Definition bạn chọn Server and Client Tools.
Sau đó bạn nên chọn kiểu Custom và chọn tất cả các bộ phận của SQL
Server. Ngoài ra nên chọn các giá trị mặc định (default)
Ở màn hình Authentication Mode nhớ chọn Mixed Mode . Lưu ý vì SQL
Server có thể dùng chung chế độ bảo mật (security) với Win NT và cũng có thể
dùng chế độ bảo mật riêng của nó. Trong Production Server người ta thường dùng
Windows Authetication vì độ an toàn cao hơn và dễ dàng cho người quản lý mạng
và cả cho người sử dụng. Nghĩa là một khi bạn được chấp nhận (authenticated) kết
nối vào domain thì bạn có quyền truy cập dữ liệu (access data) trong SQL Server.
Tuy nhiên ta nên chọn Mixed Mode để dễ dàng cho việc học tập.
Sau khi install bạn sẽ thấy một icon nằm ở góc phải bên dưới màn hình,
đây chính là Service Manager. Bạn có thể Start, Stop các SQL Server services dễ
dàng bằng cách double-click vào icon này.
1.2. Một chút kiến thức về các Version của SQL Server
SQL Server của Microsoft được thị trường chấp nhận rộng rãi kể từ version
6.5. Sau đó Microsoft đã cải tiến và hầu như viết lại một engine mới cho SQL
Server 7.0. Cho nên có thể nói từ version 6.5 lên version 7.0 là một bước nhảy vọt.
Có một số đặc tính của SQL Server 7.0 không tương thích với version 6.5. Trong

khi đó từ Version 7.0 lên version 8.0 (SQL Server 2000) thì những cải tiến chủ yếu
là mở rộng các tính năng về web và làm cho SQL Server 2000 đáng tin cậy hơn.
Một điểm đặc biệt đáng lưu ý ở version 2000 là Multiple-Instance. Nói
cho dễ hiểu là bạn có thể install version 2000 chung với các version trước mà không
cần phải uninstall chúng. Nghĩa là bạn có thể chạy song song version 6.5 hoặc 7.0
với version 2000 trên cùng một máy (điều này không thể xảy ra với các version
trước đây). Khi đó version cũ trên máy bạn là Default Instance còn version 2000
mới vừa install sẽ là Named Instance.
1.3. Các thành phần quan trọng trong SQL Server 2000
SQL Server 2000 được cấu tạo bởi nhiều thành phần như Relational
Database Engine, Analysis Service và English Query.... Các thành phần này khi
phối hợp với nhau tạo thành một giải pháp hoàn chỉnh giúp cho việc lưu trữ và phân
tích dữ liệu một cách dễ dàng.
1.3.1. Relational Database Engine - Cái lõi của SQL Server:
Ðây là một engine có khả năng chứa data ở các quy mô khác nhau
dưới dạng table và support tất cả các kiểu kết nối (data connection) thông
dụng của Microsoft như ActiveX Data Objects (ADO), OLE DB, and Open
Database Connectivity (ODBC). Ngoài ra nó còn có khả năng tự điều chỉnh
(tune up) ví dụ như sử dụng thêm các tài nguyên (resource) của máy khi cần
và trả lại tài nguyên cho hệ điều hành khi một user log off.
1.3.2. Replication - Cơ chế tạo bản sao (Replica):
Giả sử bạn có một database dùng để chứa dữ liệu được các ứng dụng
thường xuyên cập nhật. Một ngày đẹp trời bạn muốn có một cái database
giống y hệt như thế trên một server khác để chạy báo cáo (report database)
(cách làm này thường dùng để tránh ảnh hưởng đến performance của server
chính). Vấn đề là report server của bạn cũng cần phải được cập nhật thường
xuyên để đảm bảo tính chính xác của các báo cáo. Bạn không thể dùng cơ
chế back up and restore trong trường hợp này. Thế thì bạn phải làm sao? Lúc
đó cơ chế replication của SQL Server sẽ được sử dụng để bảo đảm cho dữ
liệu ở 2 database được đồng bộ (synchronized). Replication sẽ được bàn kỹ

trong bài 12
1.3.3. Data Transformation Service (DTS) - Một dịch vụ chuyển dịch data
vô cùng hiệu quả
Nếu bạn làm việc trong một công ty lớn trong đó data được chứa
trong nhiều nơi khác nhau và ở các dạng khác nhau cụ thể như chứa trong
Oracle, DB2 (của IBM), SQL Server, Microsoft Access....Bạn chắc chắn sẽ
có nhu cầu di chuyển data giữa các server này (migrate hay transfer) và
không chỉ di chuyển bạn còn muốn định dạng (format) nó trước khi lưu vào
database khác, khi đó bạn sẽ thấy DTS giúp bạn giải quyết công việc trên dễ
dàng như thế nào. DTS sẽ được bàn kỹ trong bài 8.
1.3.4. Analysis Service - Một dịch vụ phân tích dữ liệu rất hay của
Microsoft
Dữ liệu (Data) chứa trong database sẽ chẳng có ý nghĩa gì nhiều nếu
như bạn không thể lấy được những thông tin (Information) bổ ích từ đó. Do
đó Microsoft cung cấp cho bạn một công cụ rất mạnh giúp cho việc phân tích
dữ liệu trở nên dễ dàng và hiệu quả bằng cách dùng khái niệm hình khối
nhiều chiều (multi-dimension cubes) và kỹ thuật "đào mỏ dữ liệu" (data
mining) sẽ được chúng tôi giới thiệu trong bài 13.
1.3.5. English Query - Một dịch vụ mà người Việt Nam chắc là ít muốn
dùng :-) (?)
Ðây là một dịch vụ giúp cho việc query data bằng tiếng Anh "trơn" (plain English).
1.3.6. Meta Data Service:
Dịch vụ này giúp cho việc chứa đựng và "xào nấu" Meta data dễ dàng
hơn. Thế thì Meta Data là cái gì vậy? Meta data là những thông tin mô tả về
cấu trúc của data trong database như data thuộc loại nào String hay Integer...,
một cột nào đó có phải là Primary key hay không....Bởi vì những thông tin
này cũng được chứa trong database nên cũng là một dạng data nhưng để
phân biệt với data "chính thống" người ta gọi nó là Meta Data. Phần này
chắc là bạn phải xem thêm trong một thành phần khác của SQL Server sắp
giới thiệu sau đây là SQL Server Books Online vì không có bài nào trong

loạt bài này nói rõ về dịch vụ này cả.
1.3.7. SQL Server Books Online - Quyển Kinh Thánh không thể thiếu:
Cho dù bạn có đọc các sách khác nhau dạy về SQL server thì bạn
cũng sẽ thấy books online này rất hữu dụng và không thể thiếu được( cho
nên Microsoft mới hào phóng đính kèm theo SQL Server).
1.3.8. SQL Server Tools - Ðây là một bộ đồ nghề của người quản trị cơ sở
dữ liệu (DBA )
Ái chà nếu kể chi tiết ra thì hơi nhiều đấy cho nên bạn cần đọc thêm
trong books online. Ở đây người viết chỉ kể ra một vài công cụ thông dụng
mà thôi.
 Ðầu tiên phải kể đến Enterprise Manager. Ðây là một công cụ cho ta thấy
toàn cảnh hệ thống cơ sở dữ liệu một cách rất trực quan. Nó rất hữu ích đặc
biệt cho người mới học và không thông thạo lắm về SQL.
 Kế đến là Query Analyzer. Ðối với một DBA giỏi thì hầu như chỉ cần công
cụ này là có thể quản lý cả một hệ thống database mà không cần đến những
thứ khác. Ðây là một môi trường làm việc khá tốt vì ta có thể đánh bất kỳ
câu lệnh SQL nào và chạy ngay lập tức đặc biệt là nó giúp cho ta debug mấy
cái stored procedure dễ dàng.
 Công cụ thứ ba cần phải kể đến là SQL Profiler. Nó có khả năng "chụp"
(capture) tất cả các sự kiện hay hoạt động diễn ra trên một SQL server và lưu
lại dưới dạng text file rất hữu dụng trong việc kiểm soát hoạt động của SQL
Server.
 Ngoài một số công cụ trực quan như trên chúng ta cũng thường hay dùng
osql và bcp (bulk copy) trong command prompt.
Bài 2: Giới Thiệu Sơ Lược Về Transact SQL (T-SQL)
Transact-SQL là ngôn ngữ SQL mở rộng dựa trên SQL chuẩn của ISO
(International Organization for Standardization) và ANSI (American National
Standards Institute) được sử dụng trong SQL Server khác với P-SQL (Procedural-
SQL) dùng trong Oracle.
Trong bài này chúng ta sẽ tìm hiểu sơ qua về T-SQL. Chúng được chia làm 3 nhóm:

2.1. Data Definition Language (DDL):
Ðây là những lệnh dùng để quản lý các thuộc tính của một database như định
nghĩa các hàng hoặc cột của một table, hay vị trí data file của một database...thường
có dạng
• Create object_Name
• Alter object_Name
• Drop object_Name
Trong đó object_Name có thể là một table, view, stored procedure, indexes...
Ví dụ:
Lệnh Create sau sẽ tạo ra một table tên Importers với 3 cột
CompanyID,CompanyName,Contact
USE Northwind
CREATE TABLE Importers(
CompanyID int NOT NULL,
CompanyName varchar(40) NOT NULL,
Contact varchar(40) NOT NULL
)
Lệnh Alter sau đây cho phép ta thay đổi định nghĩa của một table như thêm(hay
bớt) một cột hay một Constraint...Trong ví dụ này ta sẽ thêm cột ContactTitle vào
table Importers
USE Northwind
ALTER TABLE Importers
ADD ContactTitle varchar(20) NULL
Lệnh Drop sau đây sẽ hoàn toàn xóa table khỏi database nghĩa là cả định nghĩa
của table và data bên trong table đều biến mất (khác với lệnh Delete chỉ xóa
data nhưng table vẫn tồn tại).
USE Northwind
DROP TABLE Importers
2.2. Data Control Language (DCL):
Ðây là những lệnh quản lý các quyền truy cập lên từng object (table, view, stored

procedure...). Thường có dạng sau:
• Grant
• Revoke
• Deny
Ví dụ:
Lệnh sau sẽ cho phép user trong Public Role được quyền Select đối với table
Customer trong database Northwind (Role là một khái niệm giống như Windows
Group sẽ được bàn kỹ trong phần Security)
USE Northwind
GRANT SELECT
ON Customers
TO PUBLIC
Lệnh sau sẽ từ chối quyền Select đối với table Customer trong database Northwind
của các user trong Public Role
USE Northwind
DENY SELECT
ON Customers
TO PUBLIC
Lệnh sau sẽ xóa bỏ tác dụng của các quyền được cho phép hay từ chối trước đó
USE Northwind
REVOKE SELECT
ON Customers
TO PUBLIC
2.3. Manipulation Language (DML):
Ðây là những lệnh phổ biến dùng để xử lý data như Select, Update, Insert, Delete
Ví dụ:
Select
USE Northwind
SELECT CustomerID, CompanyName, ContactName
FROM Customers

WHERE (CustomerID = 'alfki' OR CustomerID = 'anatr')
ORDER BY ContactName
Insert
USE Northwind
INSERT INTO Territories
VALUES (98101, 'Seattle', 2)
Update
USE Northwind
UPDATE Territories
SET TerritoryDescription = 'Downtown Seattle'
WHERE TerritoryID = 98101
Delete
USE Northwind
DELETE FROM Territories
WHERE TerritoryID = 98101
Vì phần này khá căn bản nên chúng tôi thiết nghĩ không cần giải thích nhiều. Chú ý
trong lệnh Delete bạn có thể có chữ From hay không đều được.
Nhưng mà chúng ta sẽ chạy thử các ví dụ trên ở đâu?
Ðể chạy các câu lệnh thí dụ ở trên bạn cần sử dụng và làm quen với Query
Analyser
Cú Pháp Của T-SQL:
Phần này chúng ta sẽ bàn về các thành phần tạo nên cú pháp của T-SQL
Identifiers
Ðây chính là tên của các database object. Nó dùng để xác định một object. (Chú ý
khi nói đến Object trong SQL Server là chúng ta muốn đề cập đến table, view,
stored procedure, index.....Vì hầu như mọi thứ trong SQL Server đều được thiết kế
theo kiểu hướng đối tượng (object-oriented)). Trong ví dụ sau TableX, KeyCol,
Description là những identifiers
CREATE TABLE TableX
(KeyCol INT PRIMARY KEY, Description NVARCHAR(80))

Có hai loại Identifiers một loại thông thường (Regular Identifier) và một loại gọi
là Delimited Identifier, loại này cần có dấu "" hay dấu [] để ngăn cách. Loại
Delimited được dùng đối với các chữ trùng với từ khóa của SQL Server (reserved
keyword) hay các chữ có khoảng trống.
Ví dụ:
SELECT * FROM [My Table]
WHERE [Order] = 10
Trong ví dụ trên chữ Order trùng với keyword Order nên cần đặt trong dấu ngoặc
vuông [].
Variables (Biến)
Biến trong T-SQL cũng có chức năng tương tự như trong các ngôn ngữ lập trình
khác nghĩa là cần khai báo trước loại dữ liệu trước khi sử dụng. Biến được bắt đầu
bằng dấu @ (Ðối với các global variable thì có hai dấu @@)
Ví dụ:
USE Northwind
DECLARE @EmpIDVar INT
SET @EmpIDVar = 3
SELECT * FROM Employees
WHERE EmployeeID = @EmpIDVar + 1
Functions (Hàm)
Có 2 loại hàm một loại là built-in và một loại user-defined
Các hàm Built-In được chia làm 3 nhóm:
• Rowset Functions : Loại này thường trả về một object và được đối xử như
một table. Ví dụ như hàm OPENQUERY sẽ trả về một recordset và có thể
đứng vị trí của một table trong câu lệnh Select.
• Aggregate Functions : Loại này làm việc trên một số giá trị và trả về một
giá trị đơn hay là các giá trị tổng. Ví dụ như hàm AVG sẽ trả về giá trị trung
bình của một cột.
• Scalar Functions : Loại này làm việc trên một giá trị đơn và trả về một giá
trị đơn. Trong loại này lại chia làm nhiều loại nhỏ như các hàm về toán học,

về thời gian, xử lý kiểu dữ liệu String....Ví dụ như hàm
MONTH('2002-09-30') sẽ trả về tháng 9.
Các hàm User-Defined (được tạo ra bởi câu lệnh CREATE FUNCTION và phần
body thường được gói trong cặp lệnh BEGIN...END) cũng được chia làm các nhóm
như sau:
• Scalar Functions : Loại này cũng trả về một giá trị đơn bằng câu lệnh
RETURNS.
• Table Functions : Loại này trả về một table
Data Type (Loại Dữ Liệu)
Các loại dữ liệu trong SQL Server sẽ được bàn kỹ trong các bài sau
Expressions
Các Expressions có dạng Identifier + Operators (như +,-,*,/,=...) + Value
Các thành phần Control-Of Flow
Như BEGIN...END, BREAK, CONTINUE, GOTO, IF...ELSE, RETURN,
WHILE.... Xin xem thêm Books Online để biết thêm về các thành phần này.
Comments (Chú Thích)
T-SQL dùng dấu -- để đánh dấu phần chú thích cho câu lệnh đơn và dùng /*...*/ để
chú thích cho một nhóm
Thực Thi Các Câu Lệnh SQL
Thực thi một câu lệnh đơn:
Một câu lệnh SQL được phân ra thành các thành phần cú pháp như trên bởi một
parser, sau đó SQL Optimizer (một bộ phận quan trọng của SQL Server) sẽ phân
tích và tìm cách thực thi (Execute Plan) tối ưu nhất ví dụ như cách nào nhanh và tốn
ít tài nguyên của máy nhất... và sau đó SQL Server Engine sẽ thực thi và trả về kết
quả.
Thực Thi một nhóm lệnh (Batches)
Khi thực thi một nhóm lệnh SQL Server sẽ phân tích và tìm biện pháp tối ưu cho
các câu lệnh như một câu lệnh đơn và chứa execution plan đã được biên dịch
(compiled) trong bộ nhớ sau đó nếu nhóm lệnh trên được gọi lại lần nữa thì SQL
Server không cần biên dịch mà có thể thực thi ngay điều này giúp cho một batch

chạy nhanh hơn.
Lệnh GO
Lệnh này chỉ dùng để gởi một tín hiệu cho SQL Server biết đã kết thúc một batch
job và yêu cầu thực thi. Nó vốn không phải là một lệnh trong T-SQL.
Bài tập 2 SQL Server 2000
Manipulate Data and Stored Procedure
Please follow those steps to practise:
1. Use bcp to export all data from Orders table of PracticeDB to c:\Orders.txt
(or to c:\Orders.csv)
2. Change some data in the c:\Orders.txt and save. Then import to Orders table
from the text file using bcp
3. Import Orders.txt to Orders table using BULK INSERT
4. Create a Linked Server ‘LinkedPracticeDB’ which link to an Access
database ‘PracticeDB.mdb’ (firstly you have to create an Access database
similar to PracticeDB in SQL Server and input some data). Then do a select
data using four-part name and OPENQUERY
5. Using ad hoc computer name with OPENROWSET and
OPENDATASOURCE functions to select data from ‘PracticeDB.mdb’
6. Create the following Cursor
DECLARE @au_lname varchar(40), @au_fname varchar(20)
DECLARE Employee_Cursor CURSOR FOR
SELECT LastName, FirstName FROM Northwind.dbo.Employees
OPEN Employee_Cursor
FETCH NEXT FROM Employee_Cursor INTO @au_lname,
@au_fname
WHILE @@FETCH_STATUS = 0
BEGIN
PRINT 'Author:' + @au_fname + ' ' + @au_lname
FETCH NEXT FROM Employee_Cursor INTO @au_lname,
@au_fname

END
CLOSE Employee_Cursor
DEALLOCATE Employee_Cursor
7. Create the following stored procedure and try to execute with some values
CREATE PROCEDURE AddNewOrder
@OrderID smallint,
@ProductName varchar(50),
@CustomerName varchar(50),
@Result smallint=1 Output
AS
DECLARE @CustomerID smallint
BEGIN TRANSACTION
If not Exists(SELECT CustomerID FROM Customers WHERE
[Name]=@CustomerName)
BEGIN
SET @CustomerID= (SELECT Max(CustomerID) FROM
Customers)
SET @CustomerID=@CustomerID+1
INSERT INTO Customers
VALUES(@CustomerID,@CustomerName)
If Exists(SELECT OrderID FROM [Orders] WHERE
OrderID=@OrderID)
BEGIN
SELECT @Result=1
ROLLBACK TRANSACTION
END
Else
BEGIN
INSERT INTO [Orders]
(OrderID,ProductName,CustomerID)

VALUES(@OrderID,@ProductName,@CustomerID)
SELECT @Result=0
COMMIT TRANSACTION
END
END
Else
BEGIN
If Exists(SELECT OrderID FROM [Orders] WHERE
OrderID=@OrderID)
BEGIN
SELECT @Result=1
ROLLBACK TRANSACTION
END
Else
BEGIN
INSERT INTO [Orders]
(OrderID,ProductName,CustomerID)
VALUES(@OrderID,@ProductName,@CustomerID)
SELECT @Result=0
COMMIT TRANSACTION
END
END
Print @Result
Return
9. Using VB 6 or VB.NET to execute the ‘AddNewOrder’ stored procedure
10. Using xp_cmdshell extended stored procedure to send a message
(xp_cmdshell ‘net send Hello’)
Bài 3: Design and Implement a SQL Server Database
3.1. Cấu Trúc Của SQL Server
Như đã trình bày ở các bài trước một trong những đặc điểm của SQL Server

2000 là Multiple-Instance nên khi nói đến một (SQL) Server nào đó là ta nói đến
một Instance của SQL Server 2000, thông thường đó là Default Instance. Một
Instance của SQL Server 2000 có 4 system databases và một hay nhiều user
database. Các system databases bao gồm:
• Master : Chứa tất cả những thông tin cấp hệ thống (system-level
information) bao gồm thông tin về các database khác trong hệ thống như vị
trí của các data files, các login account và các thiết đặt cấu hình hệ thống của
SQL Server (system configuration settings).
• Tempdb : Chứa tất cả những table hay stored procedure được tạm thời tạo ra
trong quá trình làm việc bởi user hay do bản thân SQL Server engine. Các
table hay stored procedure này sẽ biến mất khi khởi động lại SQL Server hay
khi ta disconnect.
• Model : Database này đóng vai trò như một bảng kẻm (template) cho các
database khác. Nghĩa là khi một user database được tạo ra thì SQL Server sẽ
copy toàn bộ các system objects (tables, stored procedures...) từ Model
database sang database mới vừa tạo.
• Msdb : Database này được SQL Server Agent sử dụng để hoạch định các
báo động và các công việc cần làm (schedule alerts and jobs).
3.2. Cấu Trúc Vật Lý Của Một SQL Server Database
Mỗi một database trong SQL Server đều chứa ít nhất một data file chính (primary),
có thể có thêm một hay nhiều data file phụ (Secondary) và một transaction log file.
• Primary data file (thường có phần mở rộng .mdf) : đây là file chính chứa
data và những system tables.
• Secondary data file (thường có phần mở rộng .ndf) : đây là file phụ thường
chỉ sử dụng khi database được phân chia để chứa trên nhiều dĩa.
• Transaction log file (thường có phần mở rộng .ldf) : đây là file ghi lại tất cả
những thay đổi diễn ra trong một database và chứa đầy đủ thông tin để có thể
roll back hay roll forward khi cần.
Data trong SQL Server được chứa thành từng Page 8KB và 8 page liên tục tạo
thành một Extent như hình vẽ dưới đây:

Trước khi SQL Server muốn lưu data vào một table nó cần phải dành riêng
một khoảng trống trong data file cho table đó. Những khoảng trống đó chính là các
extents. Có 2 loại Extents: Mixed Extents (loại hỗn hợp) dùng để chứa data của
nhiều tables trong cùng một Extent và Uniform Extent (loại thuần nhất) dùng để
chứa data của một table. Ðầu tiên SQL Server dành các Page trong Mixed Extent để
chứa data cho một table sau đó khi data tăng trưởng thì SQL dành hẳn một Uniform
Extent cho table đó.
3.3. Nguyên Tắc Hoạt Ðộng Của Transaction Log Trong SQL Server
Transaction log file trong SQL Server dùng để ghi lại các thay đổi xảy ra trong
database. Quá trình này diễn ra như sau: đầu tiên khi có một sự thay đổi data như
Insert, Update, Delete được yêu cầu từ các ứng dụng, SQL Server sẽ tải (load) data
page tương ứng lên memory (vùng bộ nhớ này gọi là data cache), sau đó data trong
data cache được thay đổi(những trang bị thay đổi còn gọi là dirty-page). Tiếp theo
mọi sự thay đổi đều được ghi vào transaction log file cho nên người ta gọi là write-
ahead log. Cuối cùng thì một quá trình gọi là Check Point Process sẽ kiểm tra và
viết tất cả những transaction đã được commited (hoàn tất) vào dĩa cứng (flushing
the page).
Ngoài Check Point Process những dirty-page còn được đưa vào dĩa bởi một
Lazy writer. Ðây là một anh chàng làm việc âm thầm chỉ thức giấc và quét qua
phần data cache theo một chu kỳ nhất định sau đó lại ngủ yên chờ lần quét tới.
Xin giải thích thêm một chút về khái niệm transaction trong database. Một
transaction hay một giao dịch là một loạt các hoạt động xảy ra được xem như một
công việc đơn (unit of work) nghĩa là hoặc thành công toàn bộ hoặc không làm gì cả
(all or nothing). Sau đây là một ví dụ cổ điển về transaction:
Chúng ta muốn chuyển một số tiền $500 từ account A sang
account B như vậy công việc này cần làm các bước sau:
1. Trừ $500 từ account A
2. Cộng $500 vào account B
Tuy nhiên việc chuyển tiền trên phải được thực hiện dưới dạng một
transaction nghĩa là giao dịch chỉ được xem là hoàn tất (commited) khi cả hai bước

trên đều thực hiện thành công. Nếu vì một lý do nào đó ta chỉ có thể thực hiện được
bước 1 (chẳng hạn như vừa xong bước 1 thì điện cúp hay máy bị treo) thì xem như
giao dịch không hoàn tất và cần phải được phục hồi lại trạng thái ban đầu (roll
back).
Thế thì Check Point Process hoạt động như thế nào để có thể đảm bảo một
transaction được thực thi mà không làm "dơ" database.
Trong hình vẽ trên, một transaction được biểu diễn bằng một mũi tên. Trục
nằm ngang là trục thời gian. Giả sử một Check Point được đánh dấu vào thời điểm
giữa transaction 2 và 3 như hình vẽ và sau đó sự cố xãy ra trước khi gặp một Check
point kế tiếp. Như vậy khi SQL Server được restart nó sẽ dựa trên những gì ghi
trong transaction log file để phục hồi data (xem hình vẽ).
Ðiều đó có nghĩa là SQL Server sẽ không cần làm gì cả đối với transaction 1
vì tại thời điểm Check point data đã được lưu vào dĩa rồi. Trong khi đó transaction
2 và 4 sẽ được roll forward vì tuy đã được commited nhưng do sự cố xảy ra trước
thời điểm check point kế tiếp nên data chưa kịp lưu vào dĩa. Tức là dựa trên những
thông tin được ghi trên log file SQL Server hoàn toàn có đầy đủ cơ sở để viết vào
dĩa cứng. Còn transaction 3 và 5 thì chưa được commited (do bị down bất ngờ) cho
nên SQL Server sẽ roll back hai transaction này dựa trên những gì được ghi trên log
file.
3.4. Cấu Trúc Logic Của Một SQL Server Database
Hầu như mọi thứ trong SQL Server được tổ chức thành những objects ví dụ
như tables, views, stored procedures, indexes, constraints.... Những system objects
trong SQL Server thường có bắt đầu bằng chữ sys hay sp. Các objects trên sẽ được
nghiên cứu lần lượt trong các bài sau do đó trong phần này chúng ta chỉ bàn sơ qua
một số system object thông dụng trong SQL Server database mà thôi.
Một số Sytem objects thường dùng:
System Stored Procedure Ứng dụng
Sp_help ['object']
Cung cấp thông tin về một database object (table,
view...) hay một data type.

Sp_helpdb ['database'] Cung cấp thông tin về một database cụ thể nào đó.
Sp_monitor Cho biết độ bận rộn của SQL Server
Sp_spaceused ['object',
'updateusage' ]
Cung cấp thông tin về các khoảng trống đã được sử
dụng cho một object nào đó
Sp_who ['login'] Cho biết thông tin về một SQL Server user
Ví dụ:
sp_helpdb 'Northwind' sẽ cho kết quả có dạng như bảng dưới đây
name db_size owner dbid created status .....
-----------------------------------------------------------------------------------------------------
--------------------------- -------
Northwind 3.94 MB sa 6 Aug 6 2000 Status=ONLINE,
Updateability=READ_WRITE, .....
stored procedure sp_spaceused như ví dụ sau
USE Northwind
Go
sp_spaceused 'Customers'
sẽ cho biết thông tin về table Customer:
name rows reserved data index_size unused
------------------------------------- ------------------------------------------
Customers 91 104 KB 24 KB 80 KB 0 KB

3.5. Cách tạo một User Database
Chúng ta có thể tạo một database dễ dàng dùng SQL Server Enterprise bằng
cách right-click lên trên "database" và chọn "New Database" như hình vẽ sau:
Sau đó chúng ta chỉ việc đánh tên của database và click OK.
Ngoài ra đôi khi chúng ta cũng dùng SQL script để tạo một database. Khi đó ta phải
chỉ rõ vị trí của primary data file và transaction log file.
Ví dụ:

USE master
GO
CREATE DATABASE Products
ON
( NAME = prods_dat,
FILENAME = 'c:\program files\microsoft SQL server\mssql\data\prods.mdf',
SIZE = 4,
MAXSIZE = 10,
FILEGROWTH = 1
)
GO
Trong ví dụ trên ta tạo một database tên là Products với logical file name là
prods_dat và physical file name là prods.mdf, kích thước ban đầu là 4 MB và data
file sẽ tự động tăng lên mỗi lần 1 MB cho tới tối đa là 10 MB. Nếu ta không chỉ
định một transaction log file thì SQL sẽ tự động tạo ra 1 log file với kích thước ban
đầu là 1 MB.
Lưu Ý:
Khi tạo ra một database chúng ta cũng phải lưu ý một số điểm sau: Ðối với các
hệ thống nhỏ mà ở đó vấn đề tốc độ của server không thuộc loại nhạy cảm thì chúng
ta thường chọn các giá trị mặc định (default) cho Initial size, Automatically
growth file. Nhưng trên một số production server của các hệ thống lớn kích thước
của database phải được người DBA ước lượng trước tùy theo tầm cỡ của business,
và thông thường người ta không chọn Autogrowth(tự động tăng trưởng) và
Autoshrink(tự động nén). Câu hỏi được đặt ra ở đây là vì sao ta không để SQL
Server chọn một giá trị khởi đầu cho datafile và sau đó khi cần thì nó sẽ tự động nới
rộng ra mà lại phải ước lượng trước? Nguyên nhân là nếu chọn Autogrowth (hay
Autoshrink) thì chúng ta có thể sẽ gặp 2 vấn đề sau:
• Performance hit: Ảnh hưởng đáng kể đến khả năng làm việc của SQL
Server. Do nó phải thường xuyên kiểm tra xem có đủ khoảng trống cần thiết
hay không và nếu không đủ nó sẽ phải mở rộng bằng cách dành thêm khoảng

trống từ dĩa cứng và chính quá trình này sẽ làm chậm đi hoạt động của SQL
Server.
• Disk fragmentation : Việc mở rộng trên cũng sẽ làm cho data không được
liên tục mà chứa ở nhiều nơi khác nhau trong dĩa cứng điều này cũng gây
ảnh hưởng lên tốc độ làm việc của SQL Server.
Trong các hệ thống lớn người ta có thể dự đoán trước kích thước của database
bằng cách tính toán kích thước của các tables, đây cũng chỉ là kích thước ước đoán
mà thôi (xin xem "Estimating the size of a database" trong SQL Books Online để
biết thêm về cách tính) và sau đó thường xuyên dùng một số câu lệnh SQL (thường
dùng các câu lệnh bắt đầu bằng DBCC .Phần này sẽ được bàn qua trong các bài
sau) kiểm tra xem có đủ khoảng trống hay không nếu không đủ ta có thể chọn một
thời điểm mà SQL server ít bận rộn nhất (như ban đêm hay sau giờ làm việc) để nới
rộng data file như thế sẽ không làm ảnh hưởng tới performance của Server.
Chú ý giả sử ta dành sẵn 2 GB cho datafile, khi dùng Window Explorer để xem ta sẽ
thấy kích thước của file là 2 GB nhưng data thực tế có thể chỉ chiếm vài chục MB
mà thôi.
3.6. Những Ðiểm Cần Lưu Ý Khi Thiết Kế Một Database
Trong phạm vi bài này chúng ta không thể nói sâu về lý thuyết thiết kế
database mà chỉ đưa ra một vài lời khuyên mà bạn nên tuân theo khi thiết kế.
Trước hết bạn phải nắm vững về các loại data type. Ví dụ bạn phải biết rõ
sự khác biệt giữa char(10), nchar(10) varchar(10), nvarchar(10). Loại dữ liệu
Char là một loại string có kích thước cố định nghĩa là trong ví dụ trên nếu data đưa
vào "This is a really long character string" (lớn hơn 10 ký tự) thì SQL Server sẽ tự
động cắt phần đuôi và ta chỉ còn "This is a". Tương tự nếu string đưa vào nhỏ hơn
10 thì SQL sẽ thêm khoảng trống vào phía sau cho đủ 10 ký tự. Ngược lại loại
varchar sẽ không thêm các khoảng trống phía sau khi string đưa vào ít hơn 10. Còn
loại data bắt đầu bằng chữ n chứa dữ liệu dạng unicode.
Một lưu ý khác là trong SQL Server ta có các loại Integer như : tinyint,
smallint, int, bigint. Trong đó kích thước từng loại tương ứng là 1,2,4,8 bytes.
Nghĩa là loại smallint tương đương với Integer và loại int tương đương với Long

trong VB.
Khi thiết kế table nên:
• Có ít nhất một cột thuộc loại ID dùng để xác định một record dễ dàng.
• Chỉ chứa data của một entity (một thực thể)
Trong ví dụ sau thông tin về Sách và Nhà Xuất Bản được chứa trong cùng
một table
Books
BookID Title Publisher PubState PubCity PubCountry
1
Inside SQL
Server 2000
Microsoft
Press
CA Berkely USA
2
Windows 2000
Server
New
Riders
MA Boston USA
3
Beginning
Visual Basic 6.0
Wrox CA Berkely USA
Ta nên tách ra thành table Books và table Publisher như sau:
Books
BookID Title PublisherID
1 Inside SQL Server 2000 P1
2 Windows 2000 Server P2
3 Beginning Visual Basic 6.0 P3


Publishers
PublisherID Publisher PubState PubCity PubCountry
P1 Microsoft Press CA Berkely USA
P2 New Riders MA Boston USA
P3 Wrox CA Berkely USA
• Tránh dùng cột có chứa NULL và nên luôn có giá trị Default cho các cột
• Tránh lập lại một giá trị hay cột nào đó
Ví dụ một cuốn sách có thể được viết bởi hơn một tác giả và như thế ta có
thể dùng một trong 2 cách sau để chứa data:
Books
BookID Title Authors
1 Inside SQL Server 2000 John Brown
2 Windows 2000 Server
Matthew Bortniker, Rick
Johnson
3 Beginning Visual Basic 6.0
Peter Wright, James Moon,
John Brown
hay
Books
BookID Title Author1 Author2 Author3
1
Inside SQL Server
2000
John Brown Null Null
2
Windows 2000
Server
Matthew

Bortniker
Rick Johnson Null
3
Beginning Visual
Basic 6.0
Peter Wright James Moon John Brown
Tuy nhiên việc lập đi lập lại cột Author sẽ tạo nhiều vấn đề sau này. Chẳng
hạn như nếu cuốn sách có nhiều hơn 3 tác giả thì chúng ta sẽ gặp phiền phức
ngay....Trong ví dụ này ta nên chặt ra thành 3 table như sau:
Books
BookID Title
1 Inside SQL Server 2000
2 Windows 2000 Server
3 Beginning Visual Basic 6.0
Authors
AuthID First Name Last Name
A1 John Brown
A2 Matthew Bortniker
A3 Rick Johnson
A4 Peter Wright
A5 James Moon
AuthorBook
BookID AuthID
1 A1
2 A2
2 A3
3 A4
3 A5
3 A1
Ngoài ra một trong những điều quan trọng là phải biết rõ quan hệ (Relationship)

giữa các table:
• One-to-One Relationships : trong mối quan hệ này thì một hàng bên table
A không thể liên kết với hơn 1 hàng bên table B và ngược lại.
• One-to-Many Relationships : trong mối quan hệ này thì một hàng bên table
A có thể liên kết với nhiều hàng bên table B.
• Many-to-Many Relationships : trong mối quan hệ này thì một hàng bên
table A có thể liên kết với nhiều hàng bên table B và một hàng bên table B
cũng có thể liên kết với nhiều hàng bên table A. Như ta thấy trong ví dụ trên
một cuốn sách có thể được viết bởi nhiều tác giả và một tác giả cũng có thể
viết nhiều cuốn sách. Do đó mối quan hệ giữa Books và Authors là quan hệ

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×