Tải bản đầy đủ (.docx) (32 trang)

XÂY DỰNG ỨNG DỤNG PHÂN TÍCH NGỮ NGHĨA TRONG TÌM KIẾM TÀI LIỆU TRỰC TUYẾN PHẦN 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (434.81 KB, 32 trang )

PHẦN III: GIẢI PHÁP KỸ THUẬT
1.

GIẢI PHÁP ĐỌC ĐỊNH DẠNG TÀI LIỆU
1.1

Giao diện Ifilter

Giao diện Ifilter được thiết kế bởi Microsoft để sử dụng cho dịch vụ định chỉ số
(Indexing Service). Mục đích chính của nó là trích rút phẩn text từ file để dịch vụ Định
chỉ số có thể đánh chỉ số và tìm kiếm nó về sau. Một vài phiên bản của Windows có trình
thực thi Ifilter cho các file office, cũng có những phiên bản miễn phí hoặc thương mại
cho việc đọc các loại file khác (pdf có bộ lọc Adobe PDF là phổ biến nhất). Giao diện
IFilter có thể được sử dụng trong các dạng khơng phải dạng text giống như các tài liệu
office, tài liệu pdf…hay cũng của dụng dạng file text như html, xml, để trích rút những
phần quan trong của file. Mặc dù giao diện IFilter được sử dụng chủ yếu cho các mục
đích trích rút text từ tài liệu, nó cũng được sử dụng trong các bộ máy tìm kiếm. Windows
Desktop Search sử dụng các bộ lọc để đánh chỉ số cho file.
Chi tiết công nghệ của giao diện IFilter không được tiết lộ bởi Microsoft. Phần sau
đây, tôi giới thiệu cách phần mềm được chọn sử dụng giao diện IFilter để đọc file như
thế nào.
1.2

Chương trình EPocalipse.IFilter

Để thực hiện một việc tách từ, đơn giản sử dụng:
TextReader reader=new FilterReader(fileName);
using (reader)
{
textBox1.Text=reader.ReadToEnd();
}



Với fileName là đường dẫn tuyệt đối của file được định vị trên ổ cứng.
Quá trình thực thi nhận dạng extension của file được thực hiện như sau: Gọi phương
thức LoadIFilter và truy tìm theo dấu vết của các keys đăng ký trong registry trong q
trình thực hiện đó. Chi tiết được thực hiện trong lớp FilterLoader. Khi một cặp lớp/DLL
được tìm thấy cho mở rộng của file đó, các thơng tin này được lưu lại trong cach để
tránh việc phải đọc lại registry.
Khi có tên của DLL và ID của lớp thực hiện cho bộ lọc, lớp ComHelper thực hện
các công việc sau:
 Tải dll sử dụng phương thức LoadLibrary trong API của Win32.
 Gọi phương thức GetProcAddress để lấy một con trở tới hàm
DllGetClassObject.

 Sử dụng Marshal.GetDelegateForFunctionPointer()

để chuyển con trỏ

hàm tới một delegate. Chú ý, chỉ available trong .NET 2.0
 Gọi hàm DllGetClassObject để nhận một đối tượng IclassFactory
 Khi có một đối tượng IClassFactory , ta sử dụng nó để tạo một các instance của
lớp thực thi filter
private static IFilter LoadFilterFromDll(string dllName,
string filterPersistClass)

1


{
//Get a classFactory for our classID
IClassFactory classFactory=ComHelper.GetClassFactory(dllName,

filterPersistClass);
if (classFactory==null)
return null;
//And create an IFilter instance using that class factory
Guid IFilterGUID=new Guid("89BCB740-6119-101A-BCB7-00DD010655AF");
Object obj;
classFactory.CreateInstance(null, ref IFilterGUID, out obj);
return (obj as IFilter);

}



Cuối cùng, có một thực thể IFilter mà có thể thích hợp với lớp

FilterReader

IPersistFile persistFile=(filter as IPersistFile);
if (persistFile!=null)
{
persistFile.Load(fileName, 0);
IFILTER_FLAGS flags;
IFILTER_INIT iflags =
IFILTER_INIT.CANON_HYPHENS |
IFILTER_INIT.CANON_PARAGRAPHS |
IFILTER_INIT.CANON_SPACES |
IFILTER_INIT.APPLY_INDEX_ATTRIBUTES |
IFILTER_INIT.HARD_LINE_BREAKS |
IFILTER_INIT.FILTER_OWNED_VALUE_OK;
if (filter.Init(iflags, 0, IntPtr.Zero, out

flags)==IFilterReturnCode.S_OK)
return filter;
}

2.

GIẢI PHÁP TÁCH TỪ

2.1

Giải pháp tách từ Tiếng Anh

Với các tài liệu tiếng Anh, từ của tiếng Anh được phân cách với nhau bằng dấu cách.
Điều đó có nghĩa là chúng ta có thể tách từ tiếng Anh bằng dấu phân tách là dấu cách.
Việc xử lý các stopword của tiếng anh thì chúng tơi cũng có một file gồm hơn 300 từ
stopword của tiếng Anh để phục vụ cho việc loại bỏ stopword khỏi văn bản tách để tách
ra những từ quan trọng, tránh những từ mang ý nghĩa chung, hay chỉ là cảm thán.
2.2

Giải pháp cho Tiếng Việt
2.1.1

Các giải pháp đã có

Hiện có rất nhiều chương trình hỗ trợ việc phân tích cú pháp, tách từ, gán nhãn từ
tiếng Việt cùng với các giải thuật thuật toán khác nhau. Những đồ án được tham khảo là
chương trình Code_correct (chính xác loại văn bản dựa vào tập huấn luyện), chương
trình VNSegment của tác giả Phương Thái (chương trình khá hồn chỉnh trong việc tách
từ và phân loại từ tiếng Việt. Chỉ có điều viết trên nền Java và không được cung cấp
2



sourcode và file thư viện), chương trình VNTokenizer (đề cập tới một số nghiên cứu hữu
ích cho việc tác từ).
2.1.2 Giải pháp sử dụng và nhận xét
Giải pháp được sử dụng được mơ tả bằng giải thuật phía dưới. Dựa trên một bộ từ
điển tiếng Việt tương đối đầy đủ gồm hơn 99.000 từ và cụm từ.

Yes

Câu cần tách
In Dictionary?

No
No

Còn 1 từ

Cắt tiếng bêncắt
Câu được trái
Giữ các từ đã cắt

Yes
Thêm từ mới vào
mảng từ tách

Stack

Hình : Giải thuật tách từ từ câu
Tài liệu được tách thành các câu chuẩn (hoàn chỉnh). Giải thuật tách các từ khóa từ các câu đó.

Các từ trong câu sẽ được kiểm tra xem có tồn tại trong từ điển không bằng các so sánh nó với
Câu bên và
các từ trong từ điển. Nếu nó “giống” từ trong từ điển, thì tách từ đótráikiểm tra tiếp. Giải
thuật trên giảm thiểu tối đa tình huống nhập nhằng. Tuy nhiên trong trường hợp câu này thì
giải thuật tách sai: Học sinh học sinh học Học|sinh học|sinh học. Nhưng như tình huống này
(thuộc địa bàn) thì lại giải quyết tốt (thuộc|địa bàn).

Chi phí về thời gian cho giải thuật trên là rất lớn ở bước kiểm tra từ tách ra có trong
từ điển hay khơng. Từ điển với hơn 99.000 từ được load vào bộ nhớ trong dưới với kiểu
dữ liệu được tổ chức theo 2 kiểu như sau:
 Một là mảng các string. Mỗi phần tử là từ hay cụm từ của từ điển. Mảng này được
sắp xếp theo thứ tự tăng dần của mã ASCII (Trong C#, kiểu dữ liệu mảng nó.
 Tổ chức thành một arraylist mà mỗi phần tử của nó là mảng các string. Mảng các
string thuộc 1 phần tử nó giống nhau về âm tiết đầu tiên của từ. Ví dụ
ả đào
ả đầu
ả hồn
Nơng nổi

Ái
Ái ân
Ái chà
Ái quốc
Ái nam Ái thần Ái tình
ái
ái nữ
An cư lạc An dưỡng An giấc
an
nghiệp
Anh chàng Anh hùng Anh hùng Anh kiệt

Anh linh Anh vũ
Anh
chủ nghĩa
Ăn
Ăn cắp
Ăn trộm
Ăn


3


Table : Bảng một số ví dụ về cấu trúc lưu trữ từ điển

Khi đọc một từ, ta tách âm tiết đầu tiên của nó và kiểm tra trước với các phần tử đầu
tiên của mảng, sau đó, kiểm tra tiếp với các phần tử trong mảng của nó. Khi đó, nó sẽ
tăng tốc độ tìm kiếm lên đáng kể.

4


3.

GIẢI PHÁP LSA

Giải pháp LSA là một trong các giải pháp xử lý tài liệu về mặt ngữ nghĩa. Sau khi các
thu được bộ từ khóa cho từng văn bản, phương pháp LSA sẽ phân tích trên bộ từ khóa đó
với các văn bản khác để tìm ra mức độ tương đồng. Bộ từ khóa của một tài liệu và các
tài liệu cịn lại sẽ hình thành ma trận độ tương đồng về nội dung. Phương pháp LSA sử
dụng giải thuật SVD để giảm chiều cho ma trận trên.

Chi tiết về giải pháp này xin tham khảo ở đồ án của bạn Cường.
4.

GIẢI PHÁP PHÂN TÍCH NGƯỜI DÙNG

Một phiên làm việc được bắt đầu từ khi người dùng search với một từ khóa và kết
thúc bằng việc search bộ từ khóa mới. Phân tích lịch sử truy cập của người dùng là phân
tích độ yêu thích của họ với các tài liệu khác khi đọc một tài liệu nào đó. Khi người dùng
click vào những tài liệu gợi ý Cs (tài liệu được hệ thống đưa ra khi người dùng quyết
định đọc một tài liệu nào đó - A), hệ thống sẽ cập nhật mức độ yêu thích với các tài liệu
gợi ý C(một trong các Cs) của tài liệu A. Ngồi ra, hệ thống cịn cung cấp chức năng
khảo sát để thu thập ý kiến của người dùng về mức độ tương đồng của tài liệu C so với
tài liệu A. Các dữ liệu này sẽ được hệ thống xử lý để quyết định các thứ tự ưu tiên cho
các tài liệu gợi ý trong những lần làm việc sau.
Một phương pháp nữa để thu hẹp bộ lọc là thu thập các thơng tin về sở thích của
người dùng về các tiêu chí lĩnh vực nào đó. Khi đăng ký tài khoản với hệ thống, hệ
thống sẽ ghi nhận các sở thích ứng với người dùng đó, dùng làm các thông tin phục vụ
cho bộ lọc các kết quả trả về trong màn hình tìm kiếm cho người dùng.
5.

GIẢI PHÁP CÔNG NGHỆ

Như tên đề tài đã phản ánh, hệ thống sẽ như một modul tích hợp trên trình duyệt web
để hoạt động như bộ search engine. Nên giải pháp công nghệ được đề xuất là môi trường
.NET 2.0, hệ quản trị cơ sở dữ liệu MS SQL server 2005 để lưu trữ các index của tài liệu
thu thập được. Giao diện quản trị và người dùng được xây dựng dựa trên môi trường
web với ngôn ngữ ASP.Net và mã nguồn C#.
Chương trình cũng sử dụng kiến trúc 3 tầng để trao đổi với CSDL. Modul DAL xử lý
các trao đổi Database và Dataset, dataadapter. Modul BLL thực hiện việc chuyển các đổ
dữ liệu từ các dataset vào các kiểu dữ liệu của lớp giao diện xử lý. Các phương thức

chức năng được thiết kế trong modul Utilities…

5


PHẦN IV: XÂY DỰNG CHƯƠNG TRÌNH, CÀI
ĐẶT CHẠY DEMO
1.

PHÂN TÍCH HỆ THỐNG
1.1

Mơ hình use-case và đặc tả use-case

Hình : Biểu đồ use-case hệ thống

6


Đặc tả use-case
Use-case tìm kiếm

Hình : Use-case tìm kiếm

Hình : Biểu đồ cộng tác chức năng tìm kiếm

Lớp biên:
W_Tìm kiếm
W_Tài liệu
• Lớp điều khiển:

- QL_Tài liệu
• Lớp thực thể:
- TT_Tài liệu
Dưới đây là biểu đồ tiến trình.
-

Hình : Biểu đồ tiến trình chức năng tìm kiếm

7


Use-case quản lý tài liệu

Hình : Use-case quản lý tài liệu

Lớp biên:
W_admin
W_Danh sách tài liệu
W_Tài liệu
• Lớp điều khiển:
- QL_Tài liệu
• Lớp thực thể:
- TT_Tài liệu
-

-

Biểu đồ cộng tác:

Hình : Biểu đồ cộng tác

8


Chức năng thêm mới tài liệu:

Hình : Biểu đồ tiến trình chức năng thêm mới tài liệu

Chức năng sửa tài liệu:

Hình : Biểu đồ tiến trình chức năng sửa tài liệu

Chức năng xoá tài liệu:
9


Hình :Biểu đồ tiến trình chức năng xóa tài liệu
-

Biểu đồ cộng tác:

Hình : Biểu đồ cộng tác quản lý tài liệu

10


Use-case quản lý tác giả

Hình : Use-Case quản lý tác giả



Lớp biên:
- W_admin
- W_Danh sách tác giả
- W_Tác giả
• Lớp điều khiển:
- QL_Tác giả
• Lớp thực thể:
- TT_Tác giả
Biểu đổ trình tự:
- Chức năng thêm mới tác giả:

Hình : Biểu đồ tiến trình thêm mới tác giả

Chức năng sửa thơng tin tác giả:
11


Hình : Biểu đồ tiến trình sửa tác giả

Chức năng xố tác giả:

Hình : Biểu đồ tiến trình xóa tác giả
12


Biểu đồ cộng tác:

Hình : Biểu đồ cộng tác quản lý tác giả

Use-case quản lý nhà xuất bản


Hình : User-Case quản lý NXBLớp biên:

W_Admin
W_Danh sách NXB
W_NXB
• Lớp điều khiển:
- QL_NXB
• Lớp thực thể:
- TT_NXB
-

Biểu đổ trình tự:
13


Chức năng thêm mới NXB:

Hình : Biểu đồ tiến trình thêm mới NXB

Chức năng chỉnh sửa thơng tin NXB:

Hình : Biểu đồ tiến trình chỉnh sửa thơng tin NXB

Chức năng xoá NXB:
14


Hình : Biểu đồ tiến trình xóa thơng tin NXB


Biểu đồ cộng tác:

Hình : Biểu đồ cơng tác quản lý NXB

Use-case thành viên
15


Hình : Biểu đồ usercase quản lý thành viên

Lớp biên:
W_Admin
W_Danh sách User
W_User
W_Đăng ký/đăng nhập
• Lớp điều khiển:
- QL_User
• Lớp thực thể:
- TT_User
Biểu đổ trình tự:
Chức năng thêm mới User:
-

Hình : Biểu đồ tiến trình thêm mới user

Chức năng chỉnh sửa thông tin:
16


Hình : Biểu đồ tiến trình chỉnh sửa user


Chức năng xố User:

Hình : Biểu đồ tiến trình xóa user
17


Biểu đồ cộng tác:

Hình : Biểu đồ cộng tác quản lý user

1.2

Về cơ sở dữ liệu

Biểu đồ quan hệ thực thể

18


Hình : Biểu đồ cộng tác quản lý user
Bảng các thực thể chính

#

Tên

Tên thực thể

Miêu tả


A0 – Bảng chính
1

A01

Tài liệu

Chứa các thông tin cơ bản của
một tài liệu.

2

A02

Danh mục cấp 1

Chứa các thông tin về loại của
tài liệu. Danh mục phân cấp 1-23. Danh mục cấp 1 lớn nhất, 2 là
danh mục con của danh mục cấp
1, 3 là danh mục con của danh
muc cấp 2.

3

A03

4

A04


Tác giả

Chứa các thông tin cơ bản về tác
19


#

Tên

Tên thực thể

Miêu tả
giả.

5

A05

Nhà xuất bản

Chứa các thông tin cơ bản về
nhà xuất bản.

6

A06

Người dùng


Chứa các thông tin cơ bản của
người dùng.

7

A07

Danh mục cấp 2

Chứa các thông tin về loại của
tài liệu. Danh mục phân cấp 1-23. Danh mục cấp 1 lớn nhất, 2 là
danh mục con của danh mục cấp
1, 3 là danh mục con của danh
muc cấp 2.

8

A08

Danh mục cấp 3

Chứa các thông tin về loại của
tài liệu. Danh mục phân cấp 1-23. Danh mục cấp 1 lớn nhất, 2 là
danh mục con của danh mục cấp
1, 3 là danh mục con của danh
muc cấp 2.

9


A09

10

A10

Cấu hình hệ thống

Chứa các thơng tin liên quan tới
cấu hình hoạt động của hệ thống

11

A11

Tài liệu liên quan

Chứa những tài liệu liên quan về
mặt thống kế số lần được xem.

12

A12

Kết quả phân tích LSA

Chứa kết quả của phép phân tích
LSA.

.Table : Bảng các thực thể chính


Bảng các quan hệ thực thể
# Parent
Type

Child

Description

1

A01

N:N

A04

Một tài liệu có thể có một
hoặc nhiều tác giả, một tác
giả có thể có một hoặc
nhiều tài liệu.

2

A05

1:N

A01


Một nhà xuất bản có thể
20


xuất bản một hoặc nhiều
cuốn sách. Một cuốn sách
chỉ do một nhà xuất bản sản
xuất.
3

A02

1:N

A07

Danh mục cấp 1 có thể có
một hoặc nhiều danh mục
con cấp 2.

4

A07

1:N

A08

Danh mục cấp 2 có thể có
một hoặc nhiều danh mục

con cấp 3

5

A01

1:N

A11

Tài liệu có thể có nhiều tài
liệu liên quan về mặt nội
dung.

6

A01

1:N

A12

Tài liệu có nhiều kết quả
LSA với các tài liệu khác.

Table : Bảng quan hệ các thực thể

Danh sách bảng
#
Tên Mô tả


Lệnh SQL

1

A01

Tài liệu: Chứa thông
tin cơ bản của một tài
liệu.

CREATE TABLE [dbo].[A01] (
[A01_ID] [int] IDENTITY (1, 1) NOT NULL ,
[A01_Name] [nvarchar] (100) NULL ,
[A01_Code] [char] (8) NOT NULL ,
[A01_Description] [ntext] NULL ,
[A05_ID] [int] NOT NULL ,
[A01_DatePublished] [datetime] NULL ,
[IsActive] [bit] NULL ,
[A01_LinkDown] [Varchar] NULL ,
[A01_RelatedDocs] [text] NULL ,
[A01_LSA] [text] NULL ,
[A01_KeyWords] [text] NULL
) ON [PRIMARY] TEXTIMAGE_ON [PRIMARY]
GO

2

A02


Danh mục cấp 1: Chứa CREATE TABLE [dbo].[A02] (
các thông tin về loại
[A02_ID] [int] IDENTITY (1, 1) NOT NULL ,
của tài liệu. Danh mục
[A02_Name] [nvarchar] (50) NULL ,
phân cấp 1-2-3. Danh
[A02_Code] [char] (3) NOT NULL ,
mục cấp 1 lớn nhất, 2
21


#

Tên

Mô tả

Lệnh SQL

là danh mục con của
danh mục cấp 1, 3 là
danh mục con của
danh muc cấp 2.

[IsActive] [bit] NULL
) ON [PRIMARY]
GO

3


A04

Tác giả: Chứa các
CREATE TABLE [dbo].[A04] (
thông tin cơ bản về tác
[A04_ID] [int] IDENTITY (1, 1) NOT NULL ,
giả.
[A04_Name] [nvarchar] (100) NULL ,
[A04_Birthday] [datetime] NULL ,
[A04_Address] [nvarchar] (100) NULL ,
[A04_NativePlace] [nvarchar] (100) NULL ,
[A04_Phone] [int] NULL ,
[A04_Email] [varchar] (100) NULL ,
[IsActive] [bit] NULL
) ON [PRIMARY]
GO

4

A05

Nhà xuất bản: Chứa
các thông tin cơ bản
về nhà xuất bản.

5

A06

Người dùng: Chứa các CREATE TABLE [dbo].[A06] (

thông tin cơ bản của
[A06_ID] [int] IDENTITY (1, 1) NOT NULL ,
người dùng.
[A06_Name] [nvarchar] (100) NULL ,
[A06_UseName] [nvarchar] (100) NOT NULL ,
[A06_PassWord] [nvarchar] (100) NOT NULL ,
[A06_Phone] [int] NULL ,
[A06_Email] [varchar] (100) NULL ,
[IsActive] [bit] NULL
) ON [PRIMARY]
GO

CREATE TABLE [dbo].[A05] (
[A05_ID] [int] IDENTITY (1, 1) NOT NULL ,
[A05_Name] [nvarchar] (100) NULL ,
[A05_Address] [nvarchar] (100) NULL ,
[A05_Phone] [int] NULL ,
[A05_Email] [varchar] (100) NULL ,
[A05_Remark] [ntext] NULL ,
[IsActive] [bit] NULL
) ON [PRIMARY] TEXTIMAGE_ON [PRIMARY]
GO

22


#

Tên


Mô tả

Lệnh SQL

6

A07

Danh mục cấp 2: Chứa CREATE TABLE [dbo].[A07] (
các thông tin về loại
[A07_ID] [int] IDENTITY (1, 1) NOT NULL ,
của tài liệu. Danh mục
[A07_Name] [nvarchar] (100) NULL ,
phân cấp 1-2-3. Danh
[A07_Code] [char] (5) NOT NULL ,
mục cấp 1 lớn nhất, 2
[A02_ID] [int] NOT NULL ,
là danh mục con của
[IsActive] [bit] NULL
danh mục cấp 1, 3 là
) ON [PRIMARY]
danh mục con của
danh muc cấp 2.
GO

7

A08

Danh mục cấp 3: Chứa CREATE TABLE [dbo].[A08] (

các thông tin về loại
[A08_ID] [int] IDENTITY (1, 1) NOT NULL ,
của tài liệu. Danh mục
[A08_Name] [nvarchar] (100) NULL ,
phân cấp 1-2-3. Danh
[A08_Code] [char] (8) NOT NULL ,
mục cấp 1 lớn nhất, 2
[A07_ID] [int] NOT NULL ,
là danh mục con của
[IsActive] [bit] NULL
danh mục cấp 1, 3 là
) ON [PRIMARY]
danh mục con của
danh muc cấp 2.
GO

8

A09

Bảng quan hệ: Thành
lập quan hệ nhiều
nhiều giửa bảng A01
và A04.

CREATE TABLE [dbo].[A09] (
[A01_ID] [int] NOT NULL ,
[A04_ID] [int] NOT NULL
) ON [PRIMARY]
GO


9

A10

Bảng chứa thông tin
hệ thống.

CREATE TABLE [dbo].[A10] (
[A10_ID] [int] IDENTITY (1, 1) NOT NULL ,
[A10_NumberOfDimensionReduce] [int] NOT
NULL ,
[A10_MaxOfWords] [int] NOT NULL ,
[A10_MaxOfResultOfLSA] [int] NOT NULL ,
[A10_MaxOfRelatedDocs] [int] NOT NULL ,
[A10_DegreeOfAccuracy] [float] NOT NULL
) ON [PRIMARY]

10 A11

Bảng chứa thông tin
tài liệu liên quan tới
tài liệu.

CREATE TABLE [dbo].[A11] (
[A11_ID] [int] IDENTITY (1, 1) NOT NULL ,
[A01_ID] [int] NOT NULL ,
[A11_RelatedID] [int] NOT NULL ,
[A11_Index] [float] NOT NULL ,
[A11_StandIndex] [float] NOT NULL

23


#

Tên

Mô tả

Lệnh SQL
) ON [PRIMARY]

11 A12

Bảng chứa kết quả của CREATE TABLE [dbo].[A12] (
LSA.
[A12_ID] [int] IDENTITY (1, 1) NOT NULL ,
[A01_ID] [int] NOT NULL ,
[A12_RelatedID] [int] NOT NULL ,
[A12_Index] [int] NOT NULL ,
[A12_StandIndex] [float] NOT NULL
) ON [PRIMARY]

24


Table : Danh sách các bảng chínhMơ tả chi tiết bảng

Bảng A01
#


Tên trường

Kiểu dữ liệu Cho phép Giá Khố
null
trị chính
mặ
c
địn
h

Kho Ghi chú
á
ngồ
i

1

A01_ID

INT

NOT
NULL

Yes

No

2


A01_Name

NVARCHAR NULL
(100)

No

No

3

A01_Code

CHAR(8)

NOT
NULL

No

No

4

A01_LinkDow VARCHAR( NULL
n
100)

No


No

5

A01_Decriptio NTEXT
n

NULL

No

No

6

A05_ID

INT

NOT
NULL

No

Yes

7

IsActive


BIT

NULL

No

No

8

A01_KeyWord NTEXT
s

NULL

No

No

Chứa các từ khố đại
diện cho nôi dung vb.

9

A01_RelatedD NTEXT
ocs

NULL


No

No

10

A01_LSA

NULL

No

No

Chứa những tài liệu
liên quan tới tài liệu
này về mặt nội dung.
Chứa kết quả của phân
tích LSA.

NTEXT

Table : Mơ tả bảng tài liệu A01

A02

25

1


Chứa link liên kết cho
phép download tài liệu.


×