Chuyên ngành:
thông tin
Trong thc hin lun vn này, ngoài n lc
chính bn thân, tôi nhn rt nhiu giúp
. ây là m lc vô cùng to
l giúp tôi hoàn thành ln vn. , tôi xin bày lòng bt
chân thành n:
Thy TS. Nguyn Tn ng
truyn t cho tôi nhng kin thc
chuyên ngành và
kinh
nghim
trong nghiên cu khoa .
to mi u kin
thn l cho trong su t gian tôi thc hin tài.
.
Các thành viên trong nhóm NLKE do thy Nguyn Tun ng làm
ch nhim
.
Gia ình là ngu lc và là ch da tinh thn vng ch
.
Đồng Nai, Tháng 6 năm
2011.
1
1.1 1
1.2 1
1.3 2
1.4 3
1.5 3
1.6 4
5
2.1
5
2.2 6
2.3 7
2.3.1 9
2.3.2 9
2.3.3 10
2.3.4 11
2.4 12
2.5 13
-BASED GRAMMAR 15
3.1 -BASED GRAMMAR 15
3.1.1 -Based Grammar 15
3.1.2 17
3.1.3 19
A. Phép So sánh (Subsumption) 19
B. 21
C. 22
3.1.4 23
3.2
UNIFICATION-BASED GRAMMAR 24
3.2.1 24
3.2.2 28
A. 28
B. 30
C. 32
D. 34
E. 37
F. 40
G. 41
H. 42
45
4.1. 45
4.2. 45
4.2.1 46
4.2.2 46
4.2.3 47
4.3. 50
4.3.1 50
4.3.2 54
4.3.3 Phát sinh cây cú pháp 55
4.4. 56
4.4.1 56
4.4.2 57
4.5. 58
4.5.1 59
4.5.2 59
4.5.3 59
4.5.4 60
4.6. 60
4.6.1 60
4.6.2 61
65
5.1 65
5.2 65
TÀI
UBG Unification-
CFG
BNF
EBNF
ANTLR
pháp.
LEX
YACC ân tích cú pháp.
PROLOG
SQL
trúc.
CSDL
Hình 2.1 Mô hình 7
Hình 2.2 Mô hình c 8
Hình 2.3 10
Hình 2.4 . 12
Hình 2.5 14
Hình 3.1 17
Hình 3.2 18
Hình 3.3 18
Hình 3.4 reentrancy. 19
Hình 3.5 reentrancy 19
Hình 3.6 nhau 20
Hình 3.7 20
Hình 3.8 20
Hình 3.9 21
Hình 3.10 21
Hình 3.11 tính. 22
Hình 3.12 23
Hình 3.13 24
Hình 3.14 reentrancy. 24
Hình 4.1 Các . 45
Hình 4.2 . 47
Hình 4.3 50
Hình 4.4 . 54
Hình 4.5 Phát sinh cây cú pháp. 56
Hình 4.6 58
Hình 4.7 61
Hình 4.8 62
Hình 4.9 63
Hình 4.10 63
Hình 4.11 64
g tin. 5
. 25
2 28
3 31
4 32
5 34
6 37
7 40
8 41
9 42
51
1
1.1
quan
(CFG: Context-Free Grammar) ho
àn toàn
khác, t chúng tôi
(Unification-
.
, UBG
.
1.2
các
2
Công
này n
các , tác
1.3
công trình khác ([1], [2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12])
chúng tôi
thông tin
: tên
các
sau:
- (tên tài
sai).
-
có tính .
- , câu không
- câu có rõ ràng,
.
3
-
1.4
:
-
dùng các thông
.
- UBG
.
- : UBG, xác
- .
1.5
tài
riêng:
- UBG thay
vì công trình ([1], [2],
[3], [4], [5], [6], [7], [8], [9], [10], [11], [12]).
- UBG
4
1.6
L 5
-
C
i
.
- .
C: các
trúc.
- . -
Based Grammar (UBG).
.
- .
rình bày xây
tìm
.
- . .
.
-
5
C 2
MÔ HÌNH
2.1
.
Trong ,
tên ,
, chúng tôi xác
.
Object: Books
BookID
BookName
ParallelTitle
Language
CopyrightYear
Abstract
URLAddress
Object: Authors
6
AuthorID
Mã
AuthorName
Role
Object: Publishers
PublisherID
PublishserName
Place
Object: Topics
TopicID
TopicName
Mô
2.2
7
Hình 2.1 Mô
.
2.3
n:
- .
K
- Phân tích UBG.
cây
.
- .
T
8
- .
C
dùng.
Hình 2.3.
Hình 2.2 Mô
Phân tích cú pháp câu
SQL
1
2
3
9
2.3.1 T
- ng câu
Lý
, , Tin , ).
.
-
.
-
.
elex).
2.3.2 UBG
-
.
-
.
- Phát sinh cây cú pháp
.
10
Hình 2.3 S quá trình pUBG
2.3.3
- :
.
ìm ra
1
Phát sinh cây cú
g
âu
V
2
3
4
5
11
- :
g.
-
.
-
trình mà .
2.3.4
-
c nhau. .
-
.
12
Hình 2.4 S xá
2.4 CÁC QUI TC CÚ PHÁP
chúng tôi
sau:
-
câu
Phát sinh
thi
Ph
2
1
3
4
13
.
-
theo
(Unification-Based Grammar).
2.5
cú pháp x, chúng ta
Trong
trúc cú pháp có các thông tin và
rong quá
cây cú pháp
- và gán chúng vào
SELECT.
- dùng làm và gán vào
14
-
và gán vào FROM.
thì .
câu
5.
Hình 2.5 S
1
2
thông tin
Câu
Phát sinh cây cú
pháp
Phát sinh câu
3
4
5
n
15
3
UNIFICATION-BASED GRAMMAR
3.1 T UNIFICATION-BASED GRAMMAR
3.1.1 -Based Grammar
Unification-Based Grammar (UBG) ,
([13], [14], [15]).
UBG
-
- T = .
-
(V T)*.
-
là các ký
.
3.1
1
: Xe dog barks
.
V :
1
].
16
S NP VP: number of NP = number of VP
NP Det N
VP IV
Det the
N dog: number of N = singular
N dogs: number of N = plural
IV barks: number of IV = singular
IV bark: number of IV = plural
V :
S NP VP
NP Det N
VP IV
Det the
N dog
N dogs
IV barks
IV bark
Tuy nhiên, có
n câu
. Rõ ràng
2 câu sau là không .
CFG
S NPsg VPsg
S NPpl VPpl
NPsg Det Nsg
NPpl Det Npl