Tải bản đầy đủ (.pdf) (34 trang)

Tìm kiếm dữ liệu trên windows

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.11 MB, 34 trang )

Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

Tr-ờng đại học vinh
Khoa công nghệ thông tin
--------------

Võ thị tĩnh ngô công nghĩa

Tìm kiếm dữ liệu trên windows
đồ án tốt nghiệp đại học

Giáo viên h-ớng dẫn

: ThS. Tr-ơng Trọng Cần

Nhóm sinh viên thực hiện: Võ Thị Tĩnh
Ngô Công Nghĩa

Vinh - 2009
1
Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

Lời cảm ơn.
Suốt quá trình học tập trong khoa CNTT- Đại Học Vinh vừa qua,


chúng em đà đ-ợc quý thầy cô cung cấp và truyền đạt nhiều kiến thức về
chuyên môn cần thiết và quý giá nhất. Ngoài ra, còn đ-ợc rèn luỵên một tinh
thần học tập và làm việc độc lập sáng tạo. Đây là điều kiện hết sức cần thiết
để có thể thành công khi bắt tay vào nghề nghiệp t-ơng lai.
Qua thời gian làm đồ án tốt nghiệp đ-ợc sự h-ớng dẫn tận tình của
thầy giáo Th.S Tr-ơng Trọng Cần cho đến nay đề tài của chúng em đÃ
hoàn thành. Qua đồ án tốt nghiệp này đà giúp chúng em hiểu biết thêm rất
nhiều về chuyên môn, cũng nh- kỹ năng xử lý bài toán và nâng cao khả năng
lập trình. Có đ-ợc thành quả này tr-ớc hết chúng em xin chân thành cảm ơn
thầy giáo Th.S Tr-ơng Trọng Cần ng-ời đà h-ớng dẫn chúng em trong suốt
thời gian làm đồ án tốt nghiệp .
Chúng em chân thành cảm ơn ban giám hiệu nhà tr-ờng ban chủ
nhiệm khoa CNTT đà tạo nhiều điều kiện giúp đỡ cho chúng em và toàn thể
các thầy cô giáo, những ng-ời đà dạy dỗ và truyền đạt cho chúng em kiến
thức để đạt đ-ợc nh- ngày hôm nay.
Cuối cùng chúng em không quên chân thành cảm ơn tới các bạn bè là những
ng-ời đà tham gia và đóng ghóp ý kiến cho đồ án của chúng em thành công.
Xin chân thành cảm ơn!
Vinh, ngày 10 tháng 05 năm 2009

2
Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows
I. Mở ĐầU.

1. Lý do chọn đề tài.

Đối với ngành công nghệ thông tin lúc bây giờ đà trở thành một trong
những ngành mũi nhọn của đất n-ớc.Nó không chỉ có trong phạm vi nhà
tr-ờng, viện nghiên cứu mà còn đ-ợc ứng dụng rộng rÃi trong tất cả các lĩnh
vực của ®êi sèng x· héi. Cã thĨ nãi sù ph¸t triĨn v-ợt bậc của công nghệ
thông tin đà giúp con ng-ời hoá giải đ-ợc rất nhiều bài toán phức tạp mà
tr-ớc đây đà mất nhiều thời gian, công sức mà kết quả đạt đ-ợc lại không
chính xác. Giờ đây nó đà trở nên đơn giản hơn, nhanh chóng hơn và đạt độ
chính xác cao hơn. Điều này đà đánh dấu một b-ớc ngoặt trong sự phát triển
của tin học nói riêng cũng nh- của khoa học nhân loại nói chung.
Tuy nhiên, viƯc øng dơng tin häc vµo nhiỊu lÜnh vùc ë Việt Nam còn tiến
triển chậm và ch-a khai thác hết thế mạnh của máy tính, trong đó có công
tác quản lý dữ liệu trên máy tính và tìm kiếm thông tin của dữ liệu trên máy
tính một cách chính xác và nhanh chóng. Nhằm đáp ứng nhu cầu ngày càng
cao của ng-ời sử dụng và đảm bảo đ-ợc tính bảo mật của các loại thông tin,
dữ liệu trong máy tính cá nhân. Để giúp ng-ời sử dụng có thể dễ dàng tìm
kiếm dữ liệu đà l-u trữ trên máy tính, thì dữ liệu đó cần phải đ-ợc mô tả
bằng nhiều thông tin giúp ta tìm đến nó một cách nhanh nhất. Để khắc phục
tình trạng trên, đòi hỏi phải có sự đầu t-, nghiên cứu áp dụng công nghệ
thông tin để thiết kế và xây dựng một phần mềm chuyên dụng và có tính
thống nhất cao đáp ứng yêu cầu tìm kiếm thông tin trên máy tính cá nhân
cũng nh- trên mạng internet.
Vỡ vậy để xử lý thông tin một cách nhanh chóng, chính xác và có hiệu
quả cao, ngành công nghệ thông tin đà cung cấp cho chúng ta những biện
pháp và công cụ cần thiết.
Nh- vậy công nghệ thông tin đà thâm nhập vào tất cả các ngành trong
đời sống xà hội với một ph-ơng thức hoạt động hoàn toàn mới mẻ, sáng tạo,
nhanh chóng mà không làm mất đi sự chính xác đặc biệt, nó đà đánh dấu
một b-ớc ngoặt trong việc áp dụng tin học vào ®êi sèng cđa con ng-êi.
Hiện nay đang cã nhiỊu c¸c phần mềm cũng nh- trang web tỡm kim các
thông tin và dữ liệu trên mạng internet.


3
Nhóm SV : Ngô Công NghÜa_Vâ ThÞ TÜnh – Líp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

Vớ dụ về cơng cụ tìm kiếm của trang web ;
. Với chuỗi tìm kiếm: Lớp45k - đồ án tốt nghiệp.
Chuỗi tìm kiếm:

Kết Quả:

Lớp45k - tốt nghiệp đồ án

Không có kết quả.

Lớp45k - đồ án tốt nghiệp

Có kết quả.

Nh- mọi ng-ời đều thấy trang tìm kiếm Google hiệu quả nh- thế nào.
ở đây, Google đà có các chiến l-ợc tìm kiếm đến các chỉ mục web trong cơ
s dữ liệu tại máy chủ thay vì phải đào bới hết toàn bộ internet mỗi lần
thực hiện tìm kiếm. Phần mềm tìm kiếm cũng làm điều t-ơng tự nh- thế trên
Windows để đ-a tới một ph-ơng pháp tìm kiếm hiệu quả nhanh hơn cách tìm
kiếm trên Windows sẵn có tr-ớc đây. Cũng nh- trong mọi lĩnh vực tìm kiếm
khác việc áp dụng một ngôn ngữ lập trình vào một đối t-ợng cụ thể để xây

dựng chương trình. Chính vì vậy chúng em đà chọn đề tài Tìm kiếm dữ
liệu trên Windows. Đây là một giải pháp phù hợp cho tất cả mọi
ng-ời trong công việc tìm kiếm dữ liệu trên máy tính.
Việc xây dng phn mm tìm kiếm dữ liệu trên
windows vi mc ích tìm kim dữ liệu hiu qu,nhanh chóng, linh
hot, mềm dẻo hơn. Nh»m gióp cho chóng ta qu¶n ly dữ liệu trên máy tính
cá nhân một cách tốt nhất.
2. Yêu cầu đề tài.
2.1. Mục đích.
Ngày nay vic qun lý d liu trên máy tính rất đa dạng, phc tp v
òi hi tính bo mt cao, vì vậy phải có một hệ thống tiện lợi thích hợp để
qun lý d liệu, nhưng mặt tr¸i của nã là cã những lóc chúng ta không th
4
Nhóm SV : Ngô Công Nghĩa_Võ Thị TÜnh – Líp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

nh c d liu cn tìm c lu gi âu. Do đó chúng ta cn phi xây
dng cụng c tìm kim hiu qu, nhanh chóng v chính xác.
Việc xây dựng phần mềm tìm kiếm dữ liệu trên windows
nhằm tạo nhiều thuận lợi cho nhng ngi s dng máy tính nh-: Tìm kiếm
thông tin năng suất, tiết kiệm thời gian, chính xác, nhanh chóng, linh hot
2.2. Nội dung và nguyên lí hoạt động.
Xây dựng phần mềm phải giải quyết đ-ợc những yêu cầu do bài toán đặt
ra đó là : tìm kiếm thông tin nhanh chóng, linh hoạt, tiết kiệm thời gian
Tiện ích trong phần mềm tìm kiếm sẽ đ-a ra cùng một kết quả tìm kiếm
vì chúng đều dựa vào một cơ sở dữ liệu chỉ mục duy nhất. Đó là tiện ích tìm

kiếm độc lập. Các tiện ích này có thể tìm kiếm tập tin trong Outlook hay
Outlook Express, cũng nh- các tập tin trong Word, Excel và các tập tin
Office khác. Ngoài ra chúng cũng lập chỉ mục cho các tập tin văn bản, PDF
v HTML.
Tạo danh sách chỉ mục: Ch-ơng trình tìm kiếm chỉ tìm kiếm các khoản
mục dựa vào danh sách chỉ mục sẵn có. Mặc định, ch-ơng trình sẽ tạo chỉ
mục cho email và c¸c tËp tin trong th- mơc MyDocuments cđa hƯ thèng. Bạn
có thể mở rộng danh sách chỉ mục này bằng cách nhấp phải chuột lên biểu
t-ợng trong bảng kết quả để thực hiện các chức năng khác.
Trong hộp thoại ở bảng chọn đ-ờng dẫn, hộp thoại Browser For Folder
xuất hiện. Kế đến, bạn có thể đánh dấu tùy chọn vào các ổ dữ liệu của máy
tính hoặc để tăng tốc tìm kiếm, bạn cấu hình ch-ơng trình chỉ lập chỉ mục
ứng với vài th- mục nhất định bằng cách đánh dấu tùy chọn Specific
locations, sau đó nhấn Browse và đánh dấu các ổ đĩa hay th- mục mà bạn
muốn công cụ này kiểm tra trong quá trình tìm kiếm.
Kể từ đây trở đi, ch-ơng trình sẽ tìm kiếm các tập tin ngay trên máy
tính. Để tìm kiếm các tập tin trên máy tính của mình bạn nhấn chuột vào liên
kết Desktop hoặc Files ngay trên hộp thoại nhập từ khóa tên tệp hoặc nội
dung.

5
Nhóm SV : Ngô Công Nghĩa_Võ Thị TÜnh – Líp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

L-u ý quá trình tìm kiếm này sẽ không giống nh- việc nhấn F3 hoặc
Ctrl-E, hay chọn View.Explorer Bar.Search để mở công cụ tìm kiếm có sẵn

của Windows. Theo mặc định, tiƯn Ých t×m kiÕm cđa Windows chØ cho phÐp
t×m kiÕm trong th- mục dang hiển thị. Ng-ợc lại, MSN Toolbar giống nhcác công cụ tìm kiếm khác, lục tìm tất cả các tập tin có trong danh sách chỉ
mục dù bất kể chúng đ-ợc l-u ở đâu trên hệ thống.
Thu kết quả: Sau khi đà gõ từ khóa tìm kiếm vào tên th- mục hoặc nội
dung, nhấp vào nút tìm kiếm hoặc nhấn Enter để phần mềm bắt đầu công
việc tìm kiếm và xem xét các kết quả đ-ợc liệt kê trong cửa sổ hiển thị (về cơ
bản đây là một cửa sổ Explorer). Cửa sổ này hiển thị các ảnh đồ họa và các
tập tin d-ới dạng hình thu nhỏ (thumbnail), giúp bạn có một khái niệm cơ
bản về nội dung tập tin. i vi các tập tin văn bản, ch-ơng trình sẽ hiển thị
folder chứa nội dung tập tin. Bạn có thể dung các liên kết hoặc các trình đơn
bật ra bên d-ới hộp văn bản tìm kiếm để lọc lại các kết quả căn cứ vào định
dạng tập tin.
Để tìm kiếm nhanh, bạn chỉ cần gõ vào từ khóa tìm kiếm của mình
trong thư mục tên tập tin hoặc nội dung trên thanh tác vụ. Ngay sau đó,
một cửa sổ sẽ xuất hiện và hiển thị các kết quả tìm kiếm đ-ợc sắp xếp theo
thứ tự định dạng tập tin. Nhấn chuột lên một tập tin bất kỳ trong cửa sổ kết
quả để mở nó bằng trình ứng dụng liên kết, hoặc nhấp phải lên một tập tin để
xem các trình đơn ngữ cảnh giống trong Explorer. Nếu không tìm đ-ợc tệp
tin đó, bạn nhấn Enter (nếu con trỏ vẫn còn trong Deskbar) hoặc nhấn chuột
vào liên kết more bên d-ới định dạng tệp tin t-ơng ứng để xem tiếp các kết
quả tìm kiếm.
3. Ph-ơng pháp nghiên cứu
Để hoàn thành tốt đề tài thì chúng em lần l-ợt có các b-ớc thực hiện đó là:
- Tìm hiểu về đối sánh mẫu.
- Nghiên cứu một số thuật toán về tìm kiếm
- Cài đặt ch-ơng trình.
- Phn mm tìm kim dữ liệu hiệu quả trên windows.
-.Kt lun.
6
Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT



Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

Chng I :
giới thiệu về ngôn ngữ C#.
* Ngụn ng C#:
Ngụn ngữ C# khá đơn giản, chỉ khoảng 80 từ khóa và hơn mười mấy kiểu
dữ liệu được xây dựng sẵn. Tuy nhiên, ngơn ngữ C# có ý nghĩa cao khi nó
thực thi những khái niệm lập trình hiện đại. C# bao gồm tất cả những hỗ trợ
cho cấu trúc, thành phần component, lập trình hướng đối tượng. Những tính
chất đó hiện diện trong một ngơn ngữ lập trình hiện đại. Và ngôn ngữ C# hội
đủ những điều kiện như vậy, hơn nữa nó được xây dựng trên nền tảng của
hai ngôn ngữ mạnh nhất là C++ và Java.Ngôn ngữ C# được phát triển bởi
đội ngũ kỹ sư của Microsoft, trong đó người dẫn đầu là Anders Hejlsberg và
Scott Wiltamuth. Cả hai người này điều là những người nổi tiếng, trong
đó Anders Hejlsberg được biết đến là tác giả của Turbo Pascal, một ngơn
ngữ lập trình PC phổ biến. Và ơng đứng đầu nhóm thiết kế Borland Delphi,
một trong những thành công đầu tiên của việc xây dựng môi trường phát
triển tích hợp (IDE) cho lập trình client/server. Phần cốt lõi hay cịn gọi là
trái tim của bất cứ ngơn ngữ lập trình hướng đối tượng là sự hỗ trợ của nó
cho việc định nghĩa và làm việc với những lớp. Những lớp thì định nghĩa
những kiểu dữ liệu mới, cho phép người phát triển mở rộng ngôn ngữ để tạo
mô hình tốt hơn để giải quyết vấn đề. Ngơn ngữ C# chứa những từ khóa cho
việc khai báo những kiểu lớp đối tượng mới và những phương thức hay
thuộc tính của lớp, và cho việc thực thi đóng gói, kế thừa, và đa hình, ba
thuộc tính cơ bản của bất cứ ngơn ngữ lập trình hướng đối tượng.
Trong ngơn ngữ C# mọi thứ liên quan đến khai báo lớp điều được tìm

thấy trong phần khai báo của nó. Định nghĩa một lớp trong ngơn ngữ C#
khơng địi hỏi phải chia ra tập tin header và tập tin nguồn giống như trong
ngôn ngữ C++. Hơn thế nữa, ngôn ngữ C# hỗ trợ kiểu XML, cho phép chèn
các tag XML để phát sinh tự động các document cho lớp. C# cũng hỗ trợ
giao diện interface, nó được xem như một cam kết với một lớp cho những
dịch vụ mà giao diện quy định. Trong ngơn ngữ C#, một lớp chỉ có thể kế
thừa từ duy nhất một lớp cha, tức là không cho đa kế thừa như trong ngôn
ngữ C++, tuy nhiên một lớp có thể thực thi nhiều giao diện. Khi một lớp
thực thi một giao diện thì nó sẽ hứa là nó sẽ cung cấp chức năng thực thi
giao diện. Trong ngôn ngữ C#, những cấu trúc cũng được hỗ trợ, nhưng khái
niệm về ngữ nghĩa của nó thay đổi khác với C++. Trong C#, một cấu trúc
được giới hạn, là kiểu dữ liệu nhỏ gọn, và khi tạo thể hiện thì nó u cầu ít
7
Nhãm SV : Ng« C«ng NghÜa_Vâ ThÞ TÜnh – Líp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

hn về hệ điều hành và bộ nhớ so với một lớp. Một cấu trúc thì khơng thể kế
thừa từ một lớp hay được kế thừa nhưng một cấu trúc có thể thực thi một
giao diện. Ngôn ngữ C# cung cấp những đặc tính hướng thành phần
(component-oriented), như là những thuộc tính, những sự kiện. Lập trình
hướng thành phần được hỗ trợ bởi CLR cho phép lưu trữ metadata với mã
nguồn cho một lớp. Metadata mô tả cho một lớp, bao gồm những Microsoft
.NET 16 Ngơn Ngữ Lập Trình C# phương thức và những thuộc tính của nó,
cũng như những sự bảo mật cần thiết và những thuộc tính khác. Mã nguồn
chứa đựng những logic cần thiết để thực hiện những chức năng của nó. Do
vậy, một lớp được biên dịch như là một khối self-contained, nên môi trường

hosting biết được cách đọc metadata của một lớp và mã nguồn cần thiết mà
không cần những thông tin khác để sử dụng nó.Một lưu ý cuối cùng về ngơn
ngữ C# là ngơn ngữ này cũng hỗ trợ việc truy cập bộ nhớ trực tiếp sử dụng
kiểu con trỏ của C++ và từ khóa cho dấu ngoặc [] trong tốn tử. Các mã
nguồn này là khơng an tồn (unsafe). Và bộ giải phóng bộ nhớ tự động của
CLR sẽ không thực hiện việc giải phóng những đối tượng được tham chiếu
bằng sử dụng con trỏ cho đến khi chúng được giải phóng.
Tại sao phải sử dụng ngôn ngữ C#.
Nhiều người tin rằng không cần thiết có một ngơn ngữ lập trình mới. Java,
C++, Perl,Microsoft Visual Basic, và những ngôn ngữ khác được nghĩ rằng
đã cung cấp tất cả những chức năng cần thiết.Ngôn ngữ C# là một ngôn ngữ
được dẫn xuất từ C và C++, nhưng nó được tạo từ nền tảng phát triển hơn.
Microsoft bắt đầu với công việc trong C và C++ và thêm vào những đặc tính
mới để làm cho ngôn ngữ này dễ sử dụng hơn. Nhiều trong số những đặc
tính này khá giống với những đặc tính có trong ngơn ngữ Java. Khơng dừng
lại ở đó, Microsoft đưa ra một số mục đích khi xây dựng ngơn ngữ này.
Những mục đích này được được tóm tắt như sau:
- C# là ngôn ngữ đơn giản
- C# là ngôn ngữ hiện đại
- C# là ngôn ngữ hướng đối tượng
- C# là ngôn ngữ mạnh mẽ và mềm dẻo
- C# là ngơn ngữ có ít từ khóa
- C# là ngơn ngữ hướng module
- C# sẽ trở nên phổ biến
-C# là ngôn ngữ đơn giản
-C# loại bỏ một vài sự phức tạp và rối rắm của những ngôn ngữ như Java
và c++, bao gồm việc loại bỏ những macro, những template, đa kế thừa, và
lớp cơ sở ảo (virtual base class).
8
Nhãm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT



Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

Chỳng là những nguyên nhân gây ra sự nhầm lẫn hay dẫn đến những vấn đề
cho các người phát triển C++. Nếu chúng ta là người học ngôn ngữ này đầu
tiên thì chắc chắn là ta sẽ khơng trải qua những thời gian để học nó! Nhưng
khi đó ta sẽ khơng biết được hiệu quả của ngôn ngữ C# khi loại bỏ những
vấn đề trên.Ngơn ngữ C# đơn giản vì nó dựa trên nền tảng C và C++. Nếu
chúng ta thân thiện với C và C++ hoậc thậm chí là Java, chúng ta sẽ thấy C#
khá giống về diện mạo, cú pháp, biểu thức, toán tử và những chức năng khác
được lấy trực tiếp từ ngôn ngữ C và C++, nhưng nó đã được cải tiến để làm
cho ngơn ngữ đơn giản hơn. Một vài trong các sự cải tiến là loại bỏ các
dư thừa, hay là thêm vào những cú pháp thay đổi. Ví dụ như, trong C++ có
ba tốn tử làm việc với các thành viên là ::, . , và ->. Để biết khi nào dùng ba
toán tử này cũng phức tạp và dễ nhầm lẫn. Trong C#, chúng được thay thế
với một toán tử duy nhất gọi là . (dot). Đối với người mới học thì điều này
và những việc cải tiến khác làm bớt nhầm lẫn và đơn giản hơ
Nếu chúng ta đã sử dụng Java và tin rằng nó đơn giản, thì chúng ta cũng sẽ
tìm thấy rằng C# cũng đơn giản. Hầu hết mọi người đều không tin rằng Java
là ngôn ngữ đơn giản. Tuy nhiên, C# thì dễ hơn là Java và C++.C# là ngơn
ngữ hiện đại Điều gì làm cho một ngơn ngữ hiện đại? Những đặc tính như là
xử lý ngoại lệ, thu gom bộ nhớ tự động, những kiểu dữ liệu mở rộng, và bảo
mật mã nguồn là những đặc tính được mong đợi trong một ngơn ngữ hiện
đại. C# chứa tất cả những đặc tính trên. Nếu là người mới học lập trình có
thể chúng ta sẽ cảm thấy những đặc tính trên phức tạp và khó hiểu. Tuy
nhiên, cũng đừng lo lắng chúng ta sẽ dần dần được tìm hiểu những đặc tính
qua các chương trong cuốn sách này.

ỏ được tích hợp vào
ngơn ngữ C++. Chúng cũng là nguyên nhân gây ra những rắc rối của ngôn
ngữ này. C# loại bỏ những phức tạp và rắc rối phát sinh bởi con trỏ.
Trong C#, bộ thu gom bộ nhớ tự động và kiểu dữ liệu an tồn được tích hợp
vào ngôn ngữ, sẽ loại bỏ những vấn đề rắc rối của C++. C# là ngôn ngữ
hướng đối tượng Những đặc điểm chính của ngơn ngữ hướng đối tượng
(Object-oriented language) là sự đóng gói (encapsulation), sự kế thừa
(inheritance), và đa hình (polymorphism). C# hỗ trợ tất cả những đặc tính
trên. Phần hướng đối tượng của C# sẽ được trình bày chi tiết trong một
chương riêng ở phần sau. C# là ngôn ngữ mạnh mẽ và cũng mềm dẻo
Như đã đề cập trước, với ngôn ngữ C# chúng ta chỉ bị giới hạn ở chính bởi
bản thân hay là trí tưởng tượng của chúng ta. Ngôn ngữ này không đặt
những ràng buộc lên những việc có thể làm. C# được sử dụng cho nhiều các
dự án khác nhau như là tạo ra ứng dụng xử lý văn bản, ứng dụng đồ họa, bản
tính, hay thậm chí những trình biên dịch cho các ngơn ngữ khác.C# là ngơn
ngữ ít từ khóa,C# là ngơn ngữ sử dụng giới hạn những từ khóa. Phần lớn các
từ khóa được sử dụng để mơ tả thơng tin. Chúng ta có thể nghĩ rằng một
9
Nhãm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

ngụn ngữ có nhiều từ khóa thì sẽ mạnh hơn.Điều này khơng phải sự thật, ít
nhất là trong trường hợp ngơn ngữ C#, chúng ta có thể tìm thấy rằng ngơn
ngữ này có thể được sử dụng để làm bất cứ nhiệm vụ nào. Bảng sau liệt kê
các từ khóa của ngôn ngữ C#.abstract default foreach object sizeof unsafe
as delegate goto operator stackalloc ushort base do if out static using bool

double implicit override string virtual break else in params struct volatile
byte enum int private switch void case event interface protected this while
catch explicit internal public throw char extern is readonly true checked false
lock ref try class finally long return typeof const fixed namespace sbyte uint
continue float new sealed ulong decimal for null short unchecked Bảng 1.2:
Từ khóa của ngơn ngữ C#. C# là ngơn ngữ hướng module Mã nguồn C# có
thể được viết trong những phần được gọi là những lớp, những lớp này chứa
các phương thức thành viên của nó. Những lớp và những phương thức có thể
được sử dụng lại trong ứng dụng hay các chương trình khác. Bằng cách
truyền các mẫu thông tin đến những lớp hay phương thức chúng ta có thể tạo
ra những mã nguồn dùng lại có hiệu quả.C# sẽ là một ngơn ngữ phổ biến
C# là một trong những ngơn ngữ lập trình mới nhất. Vào thời điểm cuốn
sách này được viết, nó khơng được biết như là một ngôn ngữ phổ biến.
Nhưng ngôn ngữ này có một số lý do để trở thành một ngơn ngữ phổ biến.
Một trong những lý do chính là Microsoft và sự cam kết của .NET Microsoft
muốn ngôn ngữ C# trở nên phổ biến. Mặc dù một công ty không thể làm
một sản phẩm trở nên phổ biến, nhưng nó có thể hỗ trợ. Cách đây khơng lâu,
Microsoft đã gặp sự thất bại về hệ điều hành Microsoft Bob. Mặc dù
Microsoft muốn Bob trở nên phổ biến nhưng thất bại. C# thay thế tốt hơn để
đem đến thành công sơ với Bob. Thật sự là không biết khi nào mọi người
trong công ty Microsoft sử dụng Bob trong cơng việc hằng ngày của họ. Tuy
nhên,với C# thì khác, nó được sử dụng bởi Microsoft. Nhiều sản phẩm của
cơng ty này đã chuyển đổi và viết lại bằng C#. Bằng cách sử dụng ngôn ngữ
này Microsoft đã xác nhận khả năng của C# cần thiết cho những người lập
trình.
Micorosoft .NET là một lý do khác để đem đến sự thành công của C#. .NET
là một sự thay đổi trong cách tạo và thực thi những ứng dụng.
Ngoài hai lý do trên ngôn ngữ C# cũng sẽ trở nên phổ biến do những đặc
tính của ngơn ngữ này được đề cập trong mục trước như: đơn giản, hướng
đối tượng, mạnh mẽ...Ngôn ngữ C# và những ngôn ngữ khác.Chúng ta đã

từng nghe đến những ngôn ngữ khác như Visual Basic, C++ và Java. Có lẽ
chúng ta cũng tự hỏi sự khác nhau giữa ngơn ngữ C# và nhưng ngơn ngữ đó.
Và cũng tự hỏi tại sao lại chọn ngôn ngữ này để học mà không chọn một
trong những ngôn ngữ kia. Có rất nhiều lý do và chúng ta hãy xem mt s s
10
Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh – Líp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

so sánh giữa ngôn ngữ C# với những ngôn ngữ khác giúp chúng ta phần nào
trả lời được những thắc mắc.
Microsoft nói rằng C# mang đến sức mạnh của ngơn ngữ C++ với sự dễ
dàng của ngơn ngữ Visual Basic. Có thể nó khơng dễ như Visual Basic,
nhưng với phiên bản Visual Basic.NET (Version 7) thì ngang nhau. Bởi vì
chúng được viết lại từ một nền tảng. Chúng ta có thể viết nhiều chương trình
với ít mã nguồn hơn nếu dùng C#.
Mặc dù C# loại bỏ một vài các đặc tính của C++, nhưng bù lại nó tránh được
những lỗi mà thường gặp trong ngơn ngữ C++. Điều này có thể tiết kiệm
được hàng giờ hay thậm chí hàng ngày trong việc hồn tất một chương trình.
Chúng ta sẽ hiểu nhiều về điều này trong các chương của giáo trình.
Một điều quan trọng khác với C++ là mã nguồn C# không địi hỏi phải có
tập tin header.
Tất cả mã nguồn được viết trong khai báo một lớp. Như đã nói ở bên trên.
.NET runtime trong C# thực hiện việc thu gom bộ nhớ tự động. Do điều này
nên việc sử dụng con trỏ trong C# ít quan trọng hơn trong C++. Những con
trỏ cũngcó thể được sử dụng trong C#, khi đó những đoạn mã nguồn này sẽ
được đánh dấu là khơng an tồn (unsafe code).

C# cũng từ bỏ ý tưởng đa kế thừa như trong C++. Và sự khác nhau khác là
C# đưa thêm thuộc tính vào trong một lớp giống như trong Visual Basic. Và
những thành viên của lớp được gọi duy nhất bằng toán tử “.” khác với C++
có nhiều cách gọi trong các tình huống khác nhau.
Một ngôn ngữ khác rất mạnh và phổ biến là Java, giống như C++ và C#
được phát triển dựa trên C. Nếu chúng ta quyết định sẽ học Java sau này,
chúng ta sẽ tìm được nhiều cái mà học từ C# có thể được áp dụng.
Điểm giống nhau C# và Java là cả hai cùng biên dịch ra mã trung gian: C#
biên dịch ra MSIL còn Java biên dịch ra bytecode. Sau đó chúng được thực
hiện bằng cách thơng dịch hoặc biên dịch just-in-time trong từng máy ảo
tương ứng. Tuy nhiên, trong ngôn ngữ C# nhiều hỗ trợ được đưa ra để biên
dịch mã ngôn ngữ trung gian sang mã máy. C# chứa nhiều kiểu dữ liệu cơ
bản hơn Java và cũng cho phép nhiều sự mở rộng với kiểu dữ liệu giá trị. Ví
dụ, ngơn ngữ C# hỗ trợ kiểu liệt kệ (enumerator), kiểu này được giới hạn
đến một tập hằng được định nghĩa trước, và kiểu dữ liệu cấu trúc đây là kiểu
dữ liệu giá trị do người dùng định nghĩa. Chúng ta sẽ được tìm hiểu kỹ hơn
về kiểu dữ liệu tham chiếu và kiểu dữ liệu giá trị sẽ được trình bày trong
phần sau.Tương tự như Java, C# cũng từ bỏ tính đa kế thừa trong một lớp,
tuy nhiên mơ hình kế thừa đơn này được mở rộng bởi tính đa kế thừa nhiều
giao diện.Các bước chuẩn bị cho chương trình.Thơng thường, trong việc
phát triển phần mềm, người phát triển phải tuân thủ theo quy trình phát triển
phần mềm một cách nghiêm ngặt và quy trình này đã được chuẩn hóa. Tuy
11
Nhãm SV : Ng« C«ng NghÜa_Vâ ThÞ TÜnh – Líp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows


nhiờn trong phạm vi của chúng ta là tìm hiểu một ngơn ngữ mới và viết
những chương trình nhỏ thì khơng địi hỏi khắt khe việc thực hiện theo quy
trình. Nhưng để giải quyết được những vấn đề thì chúng ta cũng cần phải
thực hiện đúng theo các bước sau. Đầu tiên là phải xác định vấn đề cần giải
quyết. Nếu khơng biết rõ vấn đề thì ta khơng thể tìm được phương pháp giải
quyết. Sau khi xác định được vấn đề, thì chúng ta có thể nghĩ ra các kế
hoạch để thực hiện. Sau khi có một kế hoạch, thì có thể thực thi kế hoạch
này. Sau khi kế hoạch được thực thi, chúng ta phải kiểm tra lại kết quả để
xem vấn đề được giải quyết xong chưa. Logic này thường được áp dụng
trong nhiều lĩnh vực khác nhau, trong đó có lập trình.
Khi tạo một chương trình trong C# hay bất cứ ngôn ngữ nào, chúng ta nên
theo những bước tuần tự sau:
- Xác định mục tiêu của chương trình.
- Xác định những phương pháp giải quyết vấn đề.
- Tạo một chương trình để giải quyết vấn đề.
- Thực thi chương trình để xem kết quả.
Ví dụ mục tiêu để viết chương trình xử lý văn bản đơn giản, mục tiêu chính
là xây dựng chương trình cho phép soạn thảo và lưu trữ những chuỗi ký tự
hay văn bản. Nếu khơng có mục tiêu thì khơng thể viết được chương trình
hiệu quả.Bước thứ hai là quyết định đến phương pháp để viết chương trình.
Bước này xác định những thơng tin nào cần thiết được sử dụng trong chương
trình, các hình thức nào được sử dụng. Từ những thơng tin này chúng ta rút
ra được phương pháp để giải quyết vấn đề.Bước thứ ba là bước cài đặt, ở
bước này có thể dùng các ngơn ngữ khác nhau để cài đặt,tuy nhiên, ngôn
ngữ phù hợp để giải quyết vấn đề một cách tốt nhất sẽ được chọn. Trong
phạm vi của sách này chúng ta mặc định là dùng C#, đơn giản là chúng ta
đang tìm hiểu nó!
Và bước cuối cùng là phần thực thi chương trình để xem kết qu.

12

Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

Ch-ơng II :
Tìm hiểu về ĐốI Sánh Mẫu.

2.1. đối sánh mẫu trên văn bản :

2.1.1.Đối sánh mẫu:
Đối sánh mẫu là bài toán tìm sự xuất hiện của một mẫu với một số đặc
tính nào đó trong chuỗi các ký hiệu cho tr-ớc. Khái niệm chuỗi ở đây khá
rộng, có thể là một chuỗi văn bản gồm một dÃy các chữ, số và kí tự đặc biệt,
có thể là chuỗi nhị phân...
Dạng đơn giản nhất cuả bài toán đối sánh mẫu là tìm sự xuất hiện của
một xâu cho tr-ớc trong một chuỗi (còn gọi là xâu đích).
2.1.2. CáC PHƯƠNG PHáP Đối sánh:
* Dựa trên đặc tính mẫu:
- Tìm kiếm đơn mẫu.
- Tìm kiếm đa mẫu.
* Dựa trên kết quả trả về :
- Tìm kiếm chính xác.
- Tìm kiếm xấp xỉ.
2.1.3. độ t-ơng tự giữa 2 xâu văn bản:
Một cách t-ơng đối có thể hiểu độ t-ơng tự là mức độ giống nhau giứa 2
xâu kí tự.(xét theo quan điểm thống kê mức độ giống nhau giữa 2 xâu sẽ
phản ánh mức độ t-ơng tự về ngữ nghĩa).

Một số kỹ thuật đo độ t-ơng tự phổ biến: Đo độ t-ơng tự bằng khoảng cách
soạn thảo, xâu con chung dài nhất hay dÃy con chung lớn nhất.

13
Nhóm SV : Ngô Công Nghĩa_Võ Thị TÜnh – Líp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

2.2. một số thuật toán tìm kiếm:
Thuật toán tính độ lớn dÃy con chung dài nhất giữa 2 xâu kí tự.
Thuật toán tìm kiếm khúc con chung dài nhất giữa 2 xâu kí tự.
Thuật toán đánh giá độ t-ơng tự tựa ngữ nghĩa giữa 2 câu văn.
* Thuật toán tính độ lớn dÃy con chung dài nhất giữa 2 xâu kí
tự:

*Bài toán: cho một xâu mẫu P độ dài m, P=P1P2...Pm và xâu S độ dài n,
S=S1S2...Sn trên cùng một bảng chữ A.Tính độ lớn dÃy con dài nhất của P và
S. Độ lớn nhất dÃy con chung cđa P, S ký hiƯu lµ Ld (P,S).
Cã thĨ hiĨu đơn giản là bài toán tìm số l-ợng lớn nhất các kí tự chung giữa 2
xâu mà đảm bảo thứ tù xt hiƯn cđa chóng.
VD:
P=”VoThiTinh” ; m = 9 ;
S=”TinhNghia” ; n = 9;
Khi đó : DÃy con chung là : {i , h , Tinh}.
§é lín cđa d·y con chung dài nhất là : 4 ( Do thuật toán tìm dÃy con chung
đ-ợc tìm ng-ợc từ vị trí cuối đến đầu xâu )
* thuật toán tính độ dài dÃy con chung lín nhÊt :


#include<conio.h>
#include<math.h>
#include<string.h>
#include<ctype.h>
#include<stdio.h>
int Ap (char a, char xau[] )
{
for(int i = 0; i< strlen(xau) -1;i++)
if(a == xau[i]) return 1;
14
Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

return 0;
}
int Dl_Dayconchung( char s[], char p[])
{
int M[100],ketqua ;ketqua = 0;
for ( int i = 0; i < strlen(p) ; i++)
M[i] = 0;
for ( i = 0; i < strlen(s) ; i++)
if ( Ap(s[i],p))
{
for ( int j = 0; j < strlen (p ); j++)
if(s[i] == p[j])

{
int dem =0;
for( int k = j+1; kif(M[k]!=0) dem++;
if(dem == 0)
M[j] = 1;
else
{
M[k] = 0;
M[j] =1;
}
}
}
15
Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Líp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

for( i =0; iif(M[i] == 1) ketqua ++;
return ketqua;
}
* ThuËt toán tìm kiếm khúc con chung dài nhất giữa 2 xâu kí
tự:

*Bài toán: cho một xâu mẫu P độ dài m, P=P1P2...Pm và xâu S độ dài n,
S=S1S2...Sn trên cùng một bảng chữ A.Tìm khúc con chung lớn nhất của P

vµ S. Khóc con chung dµi nhÊt cđa P, S đ-ợc ký hiệu là Lk (P,S).
ví dụ:
với P = Lớp45k-Khoa công nghệ thông tin-Đại học vinh.
S = Đại Học Vinh.
Nếu bá qua c¸c kÝ tù viÕt hoa, nãi c¸ch kh¸c là không phân biệt chữ hoa,chữ
th-ờng thì : Lk( P , S ) = Đại Học Vinh .
*thuật toán tìm khúc con chung lớn nhất giữa 2 xâu kí tù :

#include<conio.h>
#include<math.h>
#include<string.h>
#include<ctype.h>
#include<stdio.h>
int Ap (char a, char xau[] )
{
for(int i = 0; i< strlen(xau) -1;i++)
if(a == xau[i]) return 1;
return 0;
}
16
Nhãm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

int Dl_Dayconchung( char s[], char p[])
{
int M[100],ketqua ;ketqua = 0;

for ( int i = 0; i < strlen(p) ; i++)
M[i] = 0;
for ( i = 0; i < strlen(s) ; i++)
if ( Ap(s[i],p))
{
for ( int j = 0; j < strlen (p ); j++)
if(s[i] == p[j])
{
int dem =0;
for( int k = j+1; kif(M[k]!=0) dem++;
if(dem == 0)
M[j] = 1;
else
{
M[k] = 0;
M[j] =1;
}
}
}
17
Nhãm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

for( i =0; iif(M[i] == 1) ketqua ++;

return ketqua;
}
void max_kcc( char s[], char p[])
{
int i,j,k,dem,max;
char M1[100],M[100];
dem = max =0;
for ( i =0; iif(Ap(s[i],p))
{
for( j= 0; jif(s[i] == p[j] )
{
int t = dem= 0; M1[0] = NULL;
while( s[i+t] == p[j+t])
{
dem ++; M1[t] = s[i+t]; t++;
}
M1[t] = NULL;
}
if(dem > max)
{
max = dem ; strcpy(M,M1);
}
18
Nhãm SV : Ng« C«ng NghÜa_Vâ ThÞ TÜnh – Líp 45k-CNTT


Đồ án tốt nghiệp :


Tìm kiếm dữ liệu trên Windows

}
printf("%s",M);
}
*Thuật toán đánh giá độ t-ơng tự tựa ngữ nghĩa
giữa 2 câu văn:
- Xét ví dụ sau:
+ Câu 1: Đồ án tốt nghiệp sẽ hoàn thành vào ngày hôm nay .
+ Câu 2: Đồ án tốt nghiệp sẽ bảo vệ vào tháng 5 năm 2009.
+ Câu 3: Dự đoán đồ án tốt nghiệp sẽ bảo vệ vào ngày 18.
+ Câu 4: Sau khi bảo vệ xong đồ án tốt nghiệp, chúng ta sẽ hoàn thành khóa
học.
Một cách t-ơng đối có thể thấy theo khía cạnh tựa ngữ nghĩa câu 3 gần
nghĩa với câu 2 hơn câu 1 và câu 2 gần tựa ngữ nghĩa với câu 1 hơn câu 4.
Có thể xây dựng một hàm f(c1,c2) để dánh giá mức độ tựa ngữ nghĩa giữa 2
câu trong tiếng việt.Nh- trong ví dụ trên thì :
f ( c1 , c2 ) < f ( c1 , c3 ) < f ( c1 , c4 )
Thư nghiƯm :
L1
1 + L1(L1-1)
f ( c1 , c2 ) = --------- x -----------------Lc(1,2)
DLC + 1 + L1(L1-1)
Trong đó :
L1 : Số từ câu 1.
Lc(1,2) : Độ dài dÃy từ chung giữa 2 câu.
DLC : là tổng độ lệch giữa các từ chung của 2 câu.
* thuật toán :
Procedure TuaNguNghia(c©u1 string, c©u2 string, α real)
Var i, j : integer;

m, n, TDL, SoTuChung: integer;
19
Nhãm SV : Ng« C«ng NghÜa_Vâ ThÞ TÜnh – Líp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

LuuDoLech: array[0..100 ] of integer;
f: Real;
Begin
a := 0;
f := 0;
m := sotu(cau1);//m là s t câu1.
n := sotu(cau2);//n là s t c©u2.
TDL := 0;
SoTuChung := 0;
For i:=1 to m do
For j:=1 to n do
If (M1[i] = M2[j]) va (M[i] chưa bị đ¸nh dấu) then
Begin
LuuDoLech[i] := d(i, j);
иnh dấu M1[i] và M2[j];
End;
For i:=1 to n do
If LuuDoLech[i] <> 0 then
Begin
TDL := TDL + LuuDoLech[i];
SoTuChung = SoTuChung + 1;

End;
f := -α * TDL / (P * (P + 1)) + SoTuChung / n;
End;
* Áp dụng thuật toán ta thu được:
f(câu1, câu2) = 0,44039
f(câu1, cõu3) = 0,55765
f(cõu1, cõu4) = 0,62343
Theo ví d trên thì mức độ gần (theo ngữ nghĩa trong thực tế) giữa
(c©u 2, c©u 1) nhỏ hơn (c©u 3, c©u 1) khi áp dng thut toán trên ta c:
20
Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

f(câu 1, c©u 2) = 0,44039 < 0,55765 = f(c©u 1, c©u 3). Tương tự mức độ gần
giữa (c©u 3 , c©u 1) cũng nhỏ hơn (c©u 4, c©u 1) cũng có mức độ gần nhỏ
hơn (c©u 4, c©u 1) khi ¸p dụng ta cũng thu được f(c©u 1, c©u 3) = 0,55765 <
0,62343 = f(câu 1, câu 4).
Khi so sánh 2 tõ, mét tõ cđa m¶ng P víi mét tõ của mảng S:
- Tìm số chữ cái chung giữa 2 từ, nếu không có chữ cái chung thì bỏ qua.
Ng-ợc lại nếu có n chữ cái chung lúc này nó sÏ kiĨm tra xem.
+ nÕu n >= ®é xÊp xØ nhập vào *max (từ1.length, từ2.lenght).
+ nếu vị trí xuất hiện của từ thứ nhất trong mảng P - số chữ cái chung
giữa 2 từ - 1 >= 0, và độ lƯch > vÞ trÝ xt hiƯn cđa tõ thø nhÊt - số từ
chung -1 thì độ lệch giữa 2 xâu là vị trí xuất hiện của từ thứ nhất j - số từ
chung(con trỏ) - 1. Và vị trí bị l-u là vị trí của từ thứ nhất (j).
Ng-ợc lại nếu : j vị trí từ trong xâu P và contro là số chữ cái chung giữa 2

từ trong xâu S vµ P.
(j - contro -1 < 0 ) & (dolech > contro + 1 - j)
{
dolech = contro + 1 - j;
luu = j;
}
* nÕu n >= DCX * max(tu1.lenght, tu2.lenght)
{
contro = contro -1 ;
luudolech[contro] = dolech ;
dodaitrenP[luuj] = dolech ;
}
2.3. Thuật to¸n ¸p dụng :
- Thuật to¸n tÝnh độ lớn d·y con chung dài nhất giữa hai x©u ký t
- Thut toán tìm khúc con chung di nht gia hai xâu ký t .
- Thut toán ánh giá độ tương tự tựa ngữ nghĩa giữa hai c©u văn

21
Nhãm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

Ch-ơng IV:
mô tả chức năng và CàI đặt ch-ơng trình
3.1. chức năng chính của ch-ơng trình:
*Các chc nng chính ca chng trình :
- Chc nng tìm kim chính xác

- Chc nng tìm kim xp x
- Chức năng tìm kiếm tên tập tin
- Chức năng tìm kiếm theo nội dung
- Chc nng lưu kết quả
- Chức năng sắp xếp kết quả
- Chøc năng xóa kết quả tìm kiếm
- Chc nng thc thi chng trình ngay trên kt qu tìm kim.

3.1.1. Chức năng: tìm kiếm:
Đây cũng là nội dung chính của ch-ơng trình với mục đích tìm kiếm
dữ liệu mà chúng ta đà l-u ở trên máy tính cá nhân.
Công cụ mới, ang -ợc thử nghiệm sẽ tìm folder và nội dung t-ơng ứng
vi truy vấn. Nếu tìm đ-ợc, nó sẽ hiển thị các liên kết tới các danh mục
tai trang kết quả, với các thông số bao gồm: Tên tập tin, đ-ờng dẫn, dung
l-ợng, ngày tạo, độ t-ơng tự tên. Khi ng-ời sử dụng nhấp chuột vào chức
năng tìm kiếm, đường link sÏ dÉn hä tíi tƯp th­ mơc chøa folder vµ trang
nội dung của các từ khóa mà họ cần tìm kiếm.
3.1.2. Chức năng: Dừng:
Chức năng này với mục đích giúp cho ng-ời dùng có thể dừng ngay
ch-ơng trình lại theo nhu cầu của ng-ời sử dụng cho dù ch-ơng trình
đang trong trong quá trình tìm kiếm thông tin.

22
Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows


3.1.3. Chức năng Tìm kiếm chính xác tên tệp tin:
Chức năng này có tác dụng tìm kiếm thông tin một cách chính xác
theo tên từ khóa đ-ợc nhập vào trên thanh tác vụ. Ch-ơng trình tìm kiếm
chỉ tìm kiếm các khoản mục dựa vào danh sách chỉ mục sẵn có. Kể từ đây
trở đi, ch-ơng trình sẽ tìm kiếm các tập tin ngay trên máy tính một cách
chính xác, nhanh chóng .
3.1.4.Chức năng Tìm kiếm theo độ xấp xỉ :
Với công dụng có thể tìm dữ liệu trên máy tính một cách t-ơng đối
theo độ xấp xỉ gần giống với tên từ khóa ở bảng danh mục cần tìm kiếm.
Đây cũng là chức năng giúp cho công việc tìm kiếm linh hoạt hơn so với
công việc tìm kiếm bình th-ờng. Tìm kiếm theo độ xấp xỉ dựa trên tần
suất xt hiƯn cđa c¸c kÝ tù trong tõ khãa.
3.1.5. Chøc năng Tìm kiếm theo nội dung:
Nh- mọi ng-ời đều thấy trang tìm kiếm Google hiệu quả nh- thế nào.
Google có thể tìm kiếm nội dung của các tệp tin ở tất cả các trang web. ở
đây, Google đà có các chiến l-ợc tìm kiếm đến các chỉ mục web trong cơ
s dữ liệu tại máy chủ thay vì phải đào bới hết toàn bộ internet mỗi lần
thực hiện tìm kiếm. Phần mềm tìm kiếm cũng làm điều t-ơng tự nh- thế
trên Windows với việc tìm ra nội dung của các tập tin đ-ợc l-u trữ trên
máy tính.
3.1.6. Một số chức năng khác của ch-ơng trình:
Ngoài các chức năng đà đ-ợc nêu ở trên thì phần mềm này còn có
những chức năng nh-: Có thể l-u kết quả vừa tìm kiếm đ-ợc vào một thmục mới hoặc có thể sắp xếp kết quả vừa tìm kiếm theo tên tập tin, theo
độ chính xác của tập tin và có thể thực hiện các tác vụ khác trực tiếp lên
kết quả mà chúng ta vừa tìm kiếm.

23
Nhóm SV : Ngô Công Nghĩa_Võ ThÞ TÜnh – Líp 45k-CNTT



Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

3.2. Cài đặt ch-ơng trình:
3.2.1. Giao diện chính của ch-ơng trình:

24
Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


Đồ án tốt nghiệp :

Tìm kiếm dữ liệu trên Windows

3.2.2. Form : Tìm kiếm theo tên tập tin:

Với chức năng tìm kiếm theo độ xấp xỉ 50% so với độ chính xác của tên tập
tin phần mềm cũng có thể tìm ra theo độ t-ơng tự tên.

25
Nhóm SV : Ngô Công Nghĩa_Võ Thị Tĩnh Lớp 45k-CNTT


×