Tải bản đầy đủ (.pdf) (40 trang)

Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng việt 09

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (824.23 KB, 40 trang )

Mô hình rút trích cm t c trng ng ngha trong ting Vit


i

PH LC A
GII THIU JWPL

1. Tng quan


Java-based Wikipedia Library (JWPL) là th vin phn mm c phát trin
cho các h thng truy xut thông tin t ngun tài nguyên Wikipedia. JWPL cung
cp các chc nng rút trích và tìm kim các tri thc ng ngha cho các ng dng
x lý ngôn ng t nhiên vi hiu sut cao và kh nng m rng ln.
2. Kin trúc ca JWPL
JWPL hot ng trên c s d liu ã c ti u hóa to ra t c s d liu
thô (dumps) ca wikipedia. Thun li ca mô hình kin trúc JWPL (Hình A) là:
+ X lý hiu qu các tác v x lý ngôn ng t nhiên trên phm vi rng ln.
+ Cho phép k tha các kt qu tìm kim.
+ Kh nng tích hp vi các ng dng hng i tng.















JWPL
CSDL Wikipedia /
Wiktionary XML dump
Phiên bn Ting Vit
CSDL Wikipedia /
Wiktionary XML dump
Phiên bn Ting Anh
CSDL ã ti u hóa
CSDL ã ti u hóa
ng dng
ng dng ng dng
Truy xut các i tng
Bin i d liu
Hình A: Kin trúc h thng ca JWPL
Mô hình rút trích cm t c trng ng ngha trong ting Vit


ii
JWPL c thit k vi giao din lp trình hng i tng tp trung khai thác
các i tng chính nh WIKIPEDIA, PAGE và CATEGORY. Trong ó:
- i tng WIKIPEDIA: c s dng  thit lp các kt ni vi c s d
liu và tìm kim các i tng PAGE và CATEGORY. Ngoài vic h tr tìm
kim bng t khoá hoc thông qua các giao din truy vn i tng WIKIPEDIA,
JWPL còn cung cp c ch lp t ng trên các tác v truy xut các i tng
trang và th loi.
- i tng PAGE: trang thông tin có th là mt bài vit bình th ng nói v

mt khái nim hay mt thc th. Mt trang thông tin c!ng có th là mt trang i
hng - trang cha liên kt n trang có tên khác (có th thông dng hn) nói v
cùng mt  tài. Mt trang thông tin c!ng có th là mt trang nh hng - mt
bài vit gii thích v ý ngha ph" bin nht ca thut ng, bên di lit kê các liên
kt n các bài vit có ta  tng t hoc có khái nim tng t, giúp #nh
hng cho ng i $c n úng bài vit mà h$ ang tìm.
- i tng CATEGORY: i din cho nhng th loi ca Wikipedia và cho
phép truy vn n nhng bài vit có trong th loi ó. Nó còn cung cp cách 
truy vn n cha m% hoc con ca chúng.
- Ngoài ra, JPWL còn cung cp i tng CATEGORYGRAPH – Cây th loi
cho phép tìm ra  ng d&n ng'n nht gia hai th loi.
3. Cách to CSDL ti u hóa
a. Yêu cu ca h thng
- H CSDL mysql ( ti xung t
- JDK (ti xung t
- JWPL( ti xung t
- Gii nén tp tin va ti xung thu c th mc có cha các tp tin sau:
+ JWPLDataMachine.jar.
+ Languages.txt.
+ Tables.sql.
d. Quá trình chuyn i
Bc 1: To mt c s d liu mysql bng lnh:
Mô hình rút trích cm t c trng ng ngha trong ting Vit


iii
[path/file thc thi mysql]-u[user] –p[password] create database [tên
database];
Bc 2: a tables.sql vào c s d liu va to bng lnh Import:
[file thc thi mysql] -uUSER -p tên c s d liu va to  trên <

tables.sql

Bc 3: Ti xung 3 tp tin (ti #a ch( )
[LANGCODE]wiki-[DATE]-pages-articles.xml.bz2
[LANGCODE]wiki-[DATE]-pagelinks.sql.gz
[LANGCODE]wiki-[DATE]-categorylinks.sql.gz

Bc 4: Gii nén 3 tp tin trên và chy lnh sau  chuyn "i
[file thc thi java] [ngôn ng] [tên _CATEGORY_chính] [tên các thành
phn cu to nên category] [th mc cha 3 tp tin trên]
Kt qu chy dòng lnh này trên ubuntu 8.0 nh sau:


Kt qu thu c th mc cha các tp tin sau:
 Category.txt
 category_inlinks.txt
 category_outlinks.txt
 category_pages.txt
Mô hình rút trích cm t c trng ng ngha trong ting Vit


iv
 MetaData.txt
 Page.txt
 page_categories.txt
 page_inlinks.txt
 page_outlinks.txt
 page_redirects.txt
 PageMapLine.txt
Bc 5: a các tp tin va to c vào c s d liu to  trên bng

lnh import:
[path\mysqlimport] –u[USER] –p[pass] --default-character-set=utf8 {tên
c s d liu to  trên} {txt_file1} {txt_file2} ... {txt_file_n}

Kt qu thu c c s d liu ã c ti u.









Mô hình rút trích cm t c trng ng ngha trong ting Vit


v

PH LC B
GII THIU VN PHM JAPE

1. Tng quan
B x lý vn phm JAPE (Java Annotation Patterns Engine) là mt phn ca
kin trúc x lý vn bn (GATE), cho phép c t các lut so trùng các m&u và có
th xác #nh các hành ng c!ng nh các chuyn "i s) xy ra nu lut so trùng
vi mt cm t trong vn bn. Lun án ã iu ch(nh b x lý JAPE nhm iu
khin các thông tin liên quan ti Ontology và so trùng các m&u.

2. Vn phm JAPE

Vn phm JAPE bao gm mt tp các công on, mi công on bao gm mt
tp lut (tp lut ca các m&u hoc tp lut các thao tác thc hin). Các công on
c thc thi mt cách tun t và to thành các b chuyn trng thái hu hn cho
các chú gii (annotation). Mi lut ca vn phm JAPE bao gm hai phn: phn
bên trái và phn bên phi.
Phn bên trái ca lut cha mt m&u chú gii. Trong m&u chú gii có th cha
các toán hng ca biu thc chính qui (nh *, ?, +). Phn bên phi ca lut là phn
thao tác cho chú gii.
Mi vn phm c b't u bng mt trong hai tùy ch$n sau:
- Control: cho phép xác #nh phng pháp so trùng lut cho vn phm.
- Debug: t bng “true” nu vn phm c thc thi trong c ch Appelt (c
ch ch$n m&u có chiu dài ln nht trong các m&u c so trùng. Nu tr ng
hp hai m&u so trùng có chiu dài bng nhau thì c ch này ch$n m&u c so
trùng sm nht) và khi có nhiu kt qu so trùng thì các m&u c so trùng s)
c th hin  thit b# u ra.
Mt ví d minh h$a hai lut n gin trong tr ng hp oán nhn mt t có
nhãn là date nh sau:
Rule: date1
(
({Token.kind=="number"})((({SpaceToken})*{Token.string=="-"}
Mô hình rút trích cm t c trng ng ngha trong ting Vit


vi
({SpaceToken})*|({SpaceToken})*{Token.string=="/"}({SpaceToken})*)
{Token.kind=="number"})+
)+ --> date
Rule: date2
(
({Token.string=="ngày"}|{Token.string=="Ngày"})

({SpaceToken})+
{Token.kind=="number"}({SpaceToken})+
({Token.string=="tháng"}|{Token.string=="Tháng"})({SpaceToken})+
{Token.kind=="number"}({SpaceToken})+
({Token.string=="nm"}|{Token.string=="Nm"})({SpaceToken})+
{Token.kind=="number"} ({SpaceToken})+
)+ --> date
Trong ó: Token.kind – Loi Token, SpaceToken – Ký t tr'ng, * có ngha là
không hoc nhiu, + có ngha là mt hoc nhiu, và | có ngha là Hoc.
Vi lut date1 s) oán nhn các dng date nh 1/2/2006, 1-2-2006, …. Và lut
date2 s) oán nhn các dng date nh Ngày 2 Tháng 3 Nm 2006, Ngày 03 tháng
03 nm 2006,….

3. Các tp lut vn phn JAPE dùng trong lun án
GATE cung cp mt tp lut vn phm JAPE có s*n trong thành phn có tên
g$i là ANNIE, giúp nhn ra và so trùng mt s lp c bn nh Con ng i, Ni
chn, T" chc,… Tuy nhiên, tp lut này áp dng cho các thc th có tên ting
Anh và da trên thành phn phân lp ting Anh có s*n ca GATE. Vì th, lun án
ã c t ba tp lut hoàn toàn mi so vi ANNIE và áp dng cho công on gán
nhãn t loi, nhn din cm danh t và xác #nh CTTNN cho câu trong ting
Vit.
3.1 Tp lut áp dng cho công on gán nhãn t loi
// ChauNguyen 12/09/2006

Phase:postprocess
Input: Token SpaceToken
Options: control = appelt

Mô hình rút trích cm t c trng ng ngha trong ting Vit



vii
//------- ChauNguyen starts ------

Rule: PP

(({Token.string=="Anh"}|{Token.string=="anh"}|{Token.string=="Em"}|{To
ken.string=="em"}|{Token.string=="Thy"}|{Token.string=="Cháu"}|{Token
.string=="cháu"}|{Token.string=="Chú"}|{Token.string=="chú”}|{Token.st
ring=="Thng"}|{Token.string=="thng"}|{Token.string=="Cô"}|{Token.str
ing=="cô"}|{Token.string=="Bác"}|{Token.string=="bác"}|{Token.string==
"Thy"}|{Token.string=="thy"})({SpaceToken})+({Token.string=="đó"}|
{Token.string=="ấy"}|{Token.string=="kia"}|{Token.string=="ny"}))+
:pp
-->
{
gate.AnnotationSet toNew = (gate.AnnotationSet)bindings.get("pp");
//get the tokens
java.util.ArrayList tokens = new java.util.ArrayList(toNew);
//define a comparator for annotations by start offset
Collections.sort(tokens, new gate.util.OffsetComparator());
String text = "";
Iterator tokIter = tokens.iterator();
while(tokIter.hasNext())
text +=
(String)((Annotation)tokIter.next()).getFeatures().get("string");

gate.FeatureMap features = Factory.newFeatureMap();
features.put("kind", "word");
features.put("string", text);

features.put("length", Integer.toString(text.length()));
features.put("orth", "Pp");
annotations.add(toNew.firstNode(), toNew.lastNode(), "vnWord",
features);
}

//------- ChauNguyen end ------
….
+ trên trình bày mt lut cho phép gán nhãn t loi Pp cho các t ting Vit
trong tp lut c xây dng cho công on gán nhãn t loi.
3.2 Tp lut áp dng cho công on nhn din cm danh t
// ChauNguyen 08/08/2007

Phase:postprocess
Input: vnWord SpaceToken
Options: control = appelt

//------- ChauNguyen starts ------

Rule: Kp1
(
(
({vnWord.POS=="Ng"}|{vnWord.POS=="Nt"}|{vnWord.POS=="Pp"}) :t1
({SpaceToken})*({vnWord.POS=="Nu"}|{vnWord.POS=="Nn"}) :t2
({SpaceToken})*({vnWord.POS=="Nu"}|{vnWord.POS=="Nn"}|{vnWord.POS=="Ng
"}|{vnWord.POS=="Nt"}) :T1
({SpaceToken})*({vnWord.POS=="Np"}|{vnWord.POS=="Nc"}|{vnWord.POS=="Na
"}) :T2
({SpaceToken})*({vnWord.POS=="Aa"}|{vnWord.POS=="An"})* :s1
({SpaceToken})*({vnWord.POS=="Nl"})* :s2

Mô hình rút trích cm t c trng ng ngha trong ting Vit


viii
)
)+ :Kp1
-->
{
gate.AnnotationSet toNew = (gate.AnnotationSet)bindings.get("Kp1");
gate.AnnotationSet lannsT1 = (gate.AnnotationSet)bindings.get("T1");
gate.AnnotationSet lannsT2 = (gate.AnnotationSet)bindings.get("T2");
gate.AnnotationSet lannsS1 = (gate.AnnotationSet)bindings.get("s1");
gate.AnnotationSet lannsS2 = (gate.AnnotationSet)bindings.get("s2");

//get the tokens
java.util.ArrayList tokens = new java.util.ArrayList(toNew);
//define a comparator for annotations by start offset
Collections.sort(tokens, new gate.util.OffsetComparator());
String text = "";
Iterator tokIter = tokens.iterator();
while(tokIter.hasNext())
text+=(String)((Annotation)tokIter.next()).getFeatures()
.get("string");
gate.FeatureMap features = Factory.newFeatureMap();
features.put("kind", "vnNounPhrase");
features.put("string", text);
features.put("length", Integer.toString(text.length()));
features.put("orth", "vnNP");
if ((lannsT1 != null) && (lannsT1.size() > 0)) {
features.put("T1", lannsT1);

}
if ((lannsT2 != null) && (lannsT2.size() > 0)) {
features.put("T2", lannsT2);
}
if ((lannsS1 != null) && (lannsS1.size() > 0)) {
features.put("S1", lannsS1);
}
if ((lannsS2 != null) && (lannsS2.size() > 0)) {
features.put("S2", lannsS2);
}
annotations.add(toNew.firstNode(),toNew.lastNode(),"vnNounPhrase",
features);
}

+ trên trình bày mt lut cho phép nhn din mt m&u cu trúc cm danh t
ting Vit trong tp lut c xây dng cho công on nhn din cm danh t.
3.3 Tp lut áp dng cho công on xác nh CDTTNN
Lun án minh h$a mt lut cho phép xác #nh CTTNN trong tr ng hp gia
các cm t d tuyn có t ch( quan h nh sau.

// ChauNguyen 09/09/2008

Phase:postprocess
Input: vnWord vnNounPhrase
Options: control = appelt

//------- ChauNguyen starts ------

Rule: KNP
(

Mô hình rút trích cm t c trng ng ngha trong ting Vit


ix
({vnNounPhrase}) : NP1
({vnWord}) : word
({vnNounPhrase}) : NP2

)+ :KNP
-->
{
gate.AnnotationSet toNew = (gate.AnnotationSet)bindings.get("KNP");
gate.AnnotationSet wordSet =
(gate.AnnotationSet)bindings.get("word");

Annotation wordAnnot = (Annotation)wordSet.iterator().next();
String lsWordString =
(String)wordAnnot.getFeatures().get(gate.creole.vnPOSTagger.Ont_Consta
nts.msStringFeature);
if (lsWordString.equals("c\u00f3") || lsWordString.equals("bao
g\u1ed3m") || lsWordString.equals("ch\u1ee9a")) {
gate.AnnotationSet keyPhraseSet =
(gate.AnnotationSet)bindings.get("NP2");
//get the tokens
java.util.ArrayList tokens = new
java.util.ArrayList(keyPhraseSet);
//define a comparator for annotations by start offset
Collections.sort(tokens, new gate.util.OffsetComparator());
String text = "";
Iterator tokIter = tokens.iterator();

while(tokIter.hasNext())
text +=
(String)((Annotation)tokIter.next()).getFeatures().get("string");


gate.FeatureMap features = Factory.newFeatureMap();
features.put("kind", "vnKeyNounPhrase");
features.put("string", text);
features.put("length", Integer.toString(text.length()));
features.put("orth", "KeyNP");
annotations.add(keyPhraseSet.firstNode(),
keyPhraseSet.lastNode(), "vnKeyNounPhrase", features);


}
else
if (lsWordString.equals("c\u1ee7a") ||
lsWordString.equals("thu\u1ed9c")) {
gate.AnnotationSet keyPhraseSet =
(gate.AnnotationSet)bindings.get("NP1");
//get the tokens
java.util.ArrayList tokens = new
java.util.ArrayList(keyPhraseSet);
//define a comparator for annotations by start offset
Collections.sort(tokens, new gate.util.OffsetComparator());
String text = "";
Iterator tokIter = tokens.iterator();
while(tokIter.hasNext())
text +=
(String)((Annotation)tokIter.next()).getFeatures().get("string");



gate.FeatureMap features = Factory.newFeatureMap();
features.put("kind", "vnKeyNounPhrase");
features.put("string", text);
features.put("length", Integer.toString(text.length()));
Mô hình rút trích cm t c trng ng ngha trong ting Vit


x
features.put("orth", "KeyNP");
annotations.add(keyPhraseSet.firstNode(),
keyPhraseSet.lastNode(), "vnKeyNounPhrase", features);


}
else
if (lsWordString.equals("v\u00e0")|| lsWordString.equals("hay") ||
lsWordString.equals("ho\u1eb7c")) {
gate.AnnotationSet keyPhraseSet1 =
(gate.AnnotationSet)bindings.get("NP1");
gate.AnnotationSet keyPhraseSet2 =
(gate.AnnotationSet)bindings.get("NP2");
//get the tokens
java.util.ArrayList tokens1 = new
java.util.ArrayList(keyPhraseSet1);
java.util.ArrayList tokens2 = new
java.util.ArrayList(keyPhraseSet2);
//define a comparator for annotations by start offset
Collections.sort(tokens1, new gate.util.OffsetComparator());

Collections.sort(tokens2, new gate.util.OffsetComparator());
String text1 = "", text2 = "";
Iterator tokIter = tokens1.iterator();
while(tokIter.hasNext())
text1 +=
(String)((Annotation)tokIter.next()).getFeatures().get("string");
tokIter = tokens2.iterator();
while(tokIter.hasNext())
text2 +=
(String)((Annotation)tokIter.next()).getFeatures().get("string");

gate.FeatureMap features1 = Factory.newFeatureMap();
features1.put("kind", "vnKeyNounPhrase");
features1.put("string", text1);
features1.put("length", Integer.toString(text1.length()));
features1.put("orth", "KeyNP");
annotations.add(keyPhraseSet1.firstNode(),
keyPhraseSet1.lastNode(), "vnKeyNounPhrase", features1);

gate.FeatureMap features2 = Factory.newFeatureMap();
features2.put("kind", "vnKeyNounPhrase");
features2.put("string", text2);
features2.put("length", Integer.toString(text2.length()));
features2.put("orth", "KeyNP");
annotations.add(keyPhraseSet2.firstNode(),
keyPhraseSet2.lastNode(), "vnKeyNounPhrase", features2);

}
}








Mô hình rút trích cm t c trng ng ngha trong ting Vit


xi

PH LC C
Tp m&u thu c t TREC ( , www.lexxe.com (Qiao,
2010) và www.vnexpress.net bao gm 2079 câu ting Anh c Hi Nghiên Cu
D#ch Thut Tp. H Chí Minh d#ch sang tp m&u câu ting Vit tng ng nh sau:

VN TREC 07
1.

Krugman vit cho t báo nào?
2.

Krugman dy ti tr ng i h$c nào?
3.

Krugman ã nhn bng tin s, ti tr ng i h$c nào?
4.

Chuyên ngành ca Krugman là gì?
5.


Krugman ã ot gii thng gì có ngun gc t Tây Ban Nha?
6.

Tiêu  ca các tp sách c vit bi Krugman là gì?
7.

Nhng ng i ã b# Krugman ch( trích trong ct Ct op-ed là ai?
8.

Công ty nào ã xut bn các h s ca ông?
9.

Tên thc ca ông là gì?
10.

Ông ang d kin kt hôn vi ai?
11.

Ông là ch t#ch ca công ty nào?
12.

Ông ln lên  âu?
13.

Tên ca các album th hin rõ Jay-Z là gì?
14.

Darrell Hammond bao nhiêu tu"i?
15.


Hammond tt nghip tr ng i h$c nào?
16.

Thu nhp hng nm ca Hammond là bao nhiêu?
17.

Hammond th ng xuyên xut hin trên chng trình TV nào?
18.

Các chng trình biu di-n ca Hammond xut hin trên mng truyn hình nào?
19.

Hammond ã óng vai chính trên chng trình Comedy Central nào?
20.

Hammond ã th vai nhân vt nào?
21.

Curveball ào ng! nm nào?
22.

Culveball làm ngh gì?
23.

Tên thc ca Curveball là gì?
24.

C quan tình báo nào ã tuyn dng Curveball?
25.


Các viên chc chính ph nào ca Hoa K. ã chp nhn tuyên b ca Curveball v phòng thí
nghim v! khí ca Ir'c?
26.

Hin nay Curveball ang sng  âu?
27.

Ai là ng i ã thành lp công ty?
28.

Công ty c thành lp vào nm nào?
29.

Công ty nào ã thôn tính IMG vào nm 2004?
30.

Thành viên hi ng qun tr# IMG bao gm nhng ai?
31.

Ai là ng i ng u ca b phn sân gôn IMG ti B'c M,?
32.

C quan IMG nào i din cho Vijay Singh?
33.

Các ngôi sao th thao nào khác c IMG i din?
34.

Mint t tr s  âu?

35.

Mint c thành lp vào nm nào?
36.

Mint là mt b phn ca ban ni các nào?
37.

Ai là giám c ca Mint?
38.

Mi tháng Mint sn xut bao nhiêu ng 10 xu?
39.

ng tin ca ngi hành trình ca Lewis và Clark có tên là gì?
Mô hình rút trích cm t c trng ng ngha trong ting Vit


xii
40.

Tên ca nhng ng i ã c xut hin trên ng tin ca Mint.
41.

3M c thành lp khi nào?
42.

Công ty c t  âu?
43.


Ai là CEO (Giám c iu hành) ca công ty?
44.

Ai là ng i tin nhim CEO ca 3M?
45.

3M là vit t't cho cái gì?
46.

#a ch( trên mng ca 3M là gì?
47.

Nhãn hiu hàng hoá c 3M sn xut là gì?
48.

Ai là giám c iu hành?
49.

Ngành ngh kinh doanh ch yu ca Merrill Lynch là gì?
50.

Merrill Lynch t tr s  âu?
51.

Các tr s ca Merrill Lynch c t trên  ng ph nào?
52.

Công ty còn c bit ti bng tên khác là gì?
53.


Tên nhng ng i có liên quan ti v kin vi Merrill Lynch
54.

Ai là ch t#ch ca WWE?
55.

Ai là giám c iu hành ca WWE?
56.

WWE t tr s  âu?
57.

WWE là vit t't cho cái gì?
58.

WWE c phát trin t t" chc nào trc ó?
59.

Mng truyn hình cáp nào ã phát WWE?
60.

Nhng ô vt nào ã xut hin trong các s kin ca WWE?
61.

Thm ho ã xy ra vào ngày nào?
62.

Ai là ng i sng sót duy nht?
63.


Công ty nào s hu m/ Sago?
64.

Bao nhiêu th m/ ã b# cht trong thm ho ó?
65.

M/ Sago nm  bang nào?
66.

T" chc nào ã kho sát v thm h$a ó?
67.

Ai là nhng nn nhân ca thm ho ó?
68.

Bà ã rút kh/i s b" nhim vào ngày nào?
69.

Bà ã c b" nhim cho chc v ó vào ngày nào?
70.

Bà có th s) giành v# trí ca ai ti Toà án Ti cao?
71.

Ai ã b" nhim Miers?
72.

Ng i này ã da vào tiêu chu0n nào  vin d&n cho vic b" nhim Miers?
73.


Harriet Miers bao nhiêu tu"i?
74.

Nhng ngh# s, Cng hoà nào ã ng h vic b" nhim này?
75.

Ai ã b# Blake cáo buc git ng i?
76.

Toà án b't u sàng l$c thành viên ban hi th0m d kin vào ngày nào?
77.

Phiên toà xét x kt thúc vào ngày nào? '
78.

Ai ã b# xét x trong phiên toà?
79.

Phiên toà có phán quyt nh th nào?
80.

Lut s nào là bên nguyên cui cùng?
81.

Nhng ai là ng i làm chng trong phiên toà xét x?
82.

Madness kéo dài trong bao lâu?
83.


T ng lóng nào khác cho Madness là gì?
84.

Khi nào là êm kt thúc ca Madness?
85.

T nào mô t trn t kt ca Madness?
86.

Có bao nhiêu i thi u trong Madness?
87.

Các hun luyn viên trng nào có i thi u ti Madness?
88.

Cuc ph&u thut ã thc hin ti thành ph nào?
89.

Ng i nhn bao nhiêu tu"i?
90.

Ng i nhn có tên là gì?
Mô hình rút trích cm t c trng ng ngha trong ting Vit


xiii
91.

Cuc ph&u thut c thc hin vào ngày nào?
92.


Ai ã giám sát v cy ghép?
93.

Nguyên nhân ca s c i vi khuôn mt ca bnh nhân?
94.

Nhng ng i có kinh nghim chuyên môn v y khoa và o c nào ã ch( trích v quy trình
này?
95.

"AMT" c vit ra là gì?
96.

Tính toán AMT c thc hin i vi hình thc thu IRS nào?
97.

AMT c a vào Lut thu vào nm nào?
98.

S tin c mi-n AMT c áp dng cho ng i tr thu c thân trong nm 2006 là bao
nhiêu?
99.

T"ng thng Bush mun làm gì vi AMT?
100.

Nhng ai trong Quc hi Hoa K. mun thay "i AMT?
101.


Tên vit t't ca tàu dành cho Chin hm USS Abraham Lincoln là gì?
102.

Chin hm USS Abraham Lincoln c a vào hot ng vào ngày nào?
103.

Cng nhà ca Chin hm USS Abraham Lincoln là cng nào?
104.

T"ng thng Bush ã thm Chin hm USS Abraham Lincoln vào ngày nào?
105.

Ai là ng i ch( huy Chin hm USS Abraham Lincoln?
106.

Nhng loi máy bay nào có th bay t Chin hm USS Abraham Lincoln?
107.

Mt mã sân bay gm ba ch cho Dulles là gì?
108.

Tc hiu ã c phê duyt dành cho Dulles là gì?
109.

Dulles c t  bang nào?
110.

Sân bay c t tên theo tên ca ai?
111.


C quan nào vn hành sân bay?
112.

Nhng hãng hàng không nào s dng Dulles?
113.

Ai là ng i ã to nên ct tranh vui trong báo?
114.

Blondie c cung cp bi t" chc nào?
115.

Tên ca các nhân vt trong ct tranh vui trong báo bên cnh Blondie.
116.

Nhân vt Blondie có h$ gì?
117.

Tên ca b v Blondie là gì?
118.

Irving Berlin sinh ra  t nc nào?
119.

Irving Berlin ã vit bao nhiêu bài hát?
120.

Bài hát thành công ln u tiên ca Irving Berlin là gì?
121.


Lit kê mt s tác ph0m ca Berlin.
122.

Irving Berlin cht khi nào?
123.

Irving Berlin cht vì lý do gì?
124.

Susan Butcher sinh nm nào?
125.

Susan Butcher ã tham gia bao nhiêu ln cuc ua chó kéo Iditarod?
126.

Susan Butcher ã giành chin th'ng bao nhiêu ln ti cuc ua chó kéo Iditarod?
127.

Lit kê nhng nm Susan Butcher ã giành chin th'ng cuc ua chó kéo Iditarod.
128.

Susan Butcher sng  âu?
129.

Susan Butcher c ch0n oán b# bnh bch cu ty bào cp tính vào ngày nào?
130.

Ai là ng i ch( huy ca Boston Pops?
131.


Lit kê nhng ng i ch( huy trc ó ca Boston Pops.
132.

Lng nm ca ng i ch( huy ca Boston Pops là bao nhiêu?
133.

Ai là ng i qun lý Boston Pops?
134.

Ni nào là #a im hoà nhc ca Boston Pops?
135.

Boston Pops ã thc hin bao nhiêu bu"i hoà nhc trong nm 2005?
136.

Công ty nào s hu Cunard Cruise Lines?
137.

Công ty này c t  thành ph nào?
138.

Ai là giám c iu hành và ch t#ch ca Cunard?
139.

Tên ca tàu ln nht thuc Cunard Cruise Lines là gì?
Mô hình rút trích cm t c trng ng ngha trong ting Vit


xiv
140.


ã có bao nhiêu hành khách ã i du l#ch bng Cunard Cruise Lines?
141.

Lit kê các tàu thuc Cunard Cruise Lines.
142.

Ai ã ot gii 2004 World Series?
143.

i nào ã b# ánh bi trong 2004 World Series?
144.

Khong cách gia các gii vô #ch th gii cho i th'ng là bao nhiêu nm?
145.

Ai là ng i ã i n quyt #nh nhng lúc di chuyn nhanh trong trn u ca 2004 World
Series?
146.

Lit kê mt s ngôi sao trong 2004 World Series.
147.

Jeopardy c phát sóng ln u tiên vào ngày nào?
148.

Ai là ng i d&n chng trình u tiên ca Jeopardy?
149.

Ai hin nay là ng i d&n chng trình ca Jeopardy?

150.

Thí sinh nào ca Jeopardy là ng i giành gii thng bng tin ln nht trong l#ch s game
show trên truyn hình?
151.

Lit kê mt s thí sinh ca Jeopardy.
152.

Ai là tác gi ca “Harry Potter và chic cc la"?
153.

“Harry Potter và chic cc la” là quyn sách th my trong b sách Harry Potter?
154.

Harry Potter và chic cc la ã c d#ch sang bao nhiêu ngôn ng khác nhau?
155.

Tên ca trò chi phù thy trong truyn “Harry Potter và chic cc la” là gì?
156.

Lit kê tên ca các nhân vt trong truyn “Harry Potter và chic cc la”.
157.

Quyn sách u tiên ca Jasper Fforde là gì?
158.

Quyn sách u tiên c ông vit vào nm nào?
159.


Công ty nào ã xut bn quyn sách u tiên ca ông?
160.

Jasper Fforde vit quyn tiu thuyt Thursday Next u tiên khi ông bao nhiêu tu"i?
161.

Ông ã vit bao nhiêu sách trong b Thursday Next?
162.

Jasper Fforde ã vit nhng sách nào?
163.

Ai là ng i sáng lp nên Guinness Brewery?
164.

Guinness Brewery c thành lp vào nm nào?
165.

Ai là Guinness Brewmaster trong nm 2006?
166.

Mi ngày Guinness bán bao nhiêu banh bia en ti Ireland?
167.

Nng  cn trong bia en Guinness là bao nhiêu?
168.

Các lò sn xut bia nào khác c!ng sn xut bia en là nhng lò nào?
169.


Nhng nghi can trong các v ánh bom tn công khng b ti Luân ôn nm 2005 có tên là
gì?
170.

Các v tn công bng bom khng b ti Luân ôn ln u tiên trong nm 2005 di-n ra vào
ngày nào?
171.

ánh bom khng b Luân ôn ln th hai ã di-n ra vào ngày nào?
172.

Bao nhiêu k1 ánh bom ã b# git trong các cuc tn công bng bom khng b Luân ôn?
T"ng s ng i ã b# git hi trong các cuc tn công này là bao nhiêu?
173.

Ai là ng i phát minh ra khi Rubik?
174.

Ai là ng i sáng lp nên cuc thi khi Rubick Quc t ti Hoa K.?
175.

Th i gian k2 lc th gii ã c thit lp trong cuc thi nm 2006 là bao nhiêu?
176.

Th i gian k2 lc th gii trc ó là bao nhiêu?
177.

Ai là ng i c xem là ng i chi khi Rubik nhanh nht hành tinh?
178.


Ai là ng i ã lp các k2 lc v gii  khi Rubik?
179.

Có bao nhiêu xe hybrid ã c bán ti Hoa K. trong nm 2004?
180.

Nhà sn xut xe hi nào ln u tiên gii thiu xe hybrid?
181.

Xe Prius c gii thiu vào nm nào?
182.

Xe hybrid chim bao nhiêu phn trm trong t"ng s xe c bán ti Hoa K. trong nm 2004?
183.

Nhng nhà sn xut xe hi nào hin nay ang sn xut xe hybrid?
184.

Michael Brown ang gi chc v gì trc khi tr thành ng i ng u ca FEMA?
185.

Ai là ng i tin nhim ca Brown ti FEMA?
Mô hình rút trích cm t c trng ng ngha trong ting Vit


xv
186.

Khi nào Brown b't u làm vic FEMA?
187.


Brown t chc ng i ng u ca FEMA vào ngày nào?
188.

Ai ã c b" nhim làm quyn ng i ng u ca FEMA khi Brown t chc?
189.

FEMA trc thuc c quan chính ph nào ti th i im cn bão Katrina?
190.

Hit record u tiên ca Ella Fitzgerald là gì?
191.

Ella Fitzgerald bao nhiêu tu"i khi cô có a hát thành công ln u tiên?
192.

Ai là chng ca Ella Fitzgerald?
193.

Các ca s, nào ã thc hin ghi âm cùng vi Ella Fitzgerald?
194.

Anbum Giáng sinh ca Ella Fitzgerald có tên là gì?
195.

Trong nm 2005, Ella Fitzgerald ã c ghi tên vào toà nhà k2 nim nhng ng i n"i ting
nào?
196.

Ai là nhng nhà sáng tác bài hát c Ella Fitzgerald ghi âm?

197.

CSPI vit t't cho ch gì?
198.

Th thông báo ca CSPI có tên là gì?
199.

Tên các nhân viên ca CSPI.
200.

#a ch( trang web CSPI là gì?
201.

Theo CSPI, cht làm ng$t nhân to nào là an toàn nht?
202.

Nhà hàng nào ã c CSPI tán dng do ã a các thông tin dinh d3ng cho tt c hng
mc trong thc n?
203.

Chui nhà hàng nào ã b# CSPI kin lên C quan qun lý Thuc và Thc ph0m Hoa K.?
204.

Chng trình Fulbright c thành lp nm nào?
205.

C quan chính ph nào ca Hoa K. tài tr cho Chng trình Fulbright?
206.


C quan Liên hp quc nào ã ng cai t" chc bác s, thc tp ni trú theo Chng trình
Fulbright?
207.

Có th tìm h$c b"ng Fulbright  nhng quc gia nào?
208.

Chng trình Fulbright cp bao nhiêu xut h$c b"ng mi nm?
209.

Mt ng i có th nhn h$c b"ng Fulbright bao nhiêu ln?
210.

Thng ngh# s nào ã np n và nhn Fulbright nhng ã t b/?
211.

T báo nào ã phát hành tranh bim ho ln u tiên?
212.

Có bao nhiêu tranh bim ho trên báo ó?
213.

Các cuc phn i ã di-n ra  nhng nc nào?
214.

4n ph0m nào trc ó v Mohamed ã gây nên các cuc phn i và e do git?
215.

T báo nào ca Hoa K. ã phát hành mt trong s tranh bim ho này?
216.


Bo tàng nào d kin trng bày các tranh bim ho?
217.

Cn bnh Lyme ln u tiên ã c ghi nhn ti thành ph và bang nào?
218.

Cn bnh Lyme c t tên khi nào?
219.

Sinh vt nào gây nên bnh Lyme?
220.

Bnh Lyme là mt vn  n"i cm i vi nhng bang nào?
221.

Các loi thuc nào c s dng  cha bnh Lyme?
222.

Loi thuc xua u"i côn trùng nào có th có tác dng i vi b$ chét mang bnh Lyme?
223.

Búp bê Cô gái Hoa K. ln u tiên c gii thiu vào nm nào?
224.

Cho bit tên ca các búp bê l#ch s.
225.

Các búp bê Cô gái Hoa K. nào ã c lp thành phim truyn hình?
226.


Giá mi búp bê Cô gái Hoa K. là bao nhiêu tin?
227.

Bao nhiêu búp bê Cô gái Hoa K. ã c bán?
228.

Tên ca ca hàng búp bê Cô gái Hoa K. ti New York là gì?
229.

Công ty nào s hu công ty sn xut búp bê Cô gái Hoa K.?
230.

Kurt Weill c sinh ra vào ngày nào?
231.

Kurt Weill mt nm nào?
232.

Kurt Weill c sinh ra  nc nào?
233.

Kurt Weill ã vit nhng bn nhc nào?
Mô hình rút trích cm t c trng ng ngha trong ting Vit


xvi
234.

Ai là v ca Kurt Weill?

235.

Kurt Weill ã hp tác vi ai?
236.

Bobby Darin ã ot gii Grammy nh bài hát nào ca Kurt Weill?
237.

Ai là ng i ã thành lp Vin Chanel?
238.

Công ty c thành lp vào nm nào?
239.

Ai là ch t#ch ca Vin Chanel?
240.

Ai là ng i ã tip qun Vin Chanel vào nm 1983?
241.

Ng i ph n nào ã mc trang phc nhãn hiu Chanel ti các l- trao gii?
242.

Nhng bo tàng nào ã trng bày trang phc nhãn hiu Chanel?
243.

Sáng to nào ca Chanel là hng thm bán chy nht trên th gii?
244.

Ai là ch t#ch ca BAT?

245.

Các tr s ca BAT c t  thành ph nào?
246.

BAT sn xut thuc lá nhãn hiu gì?
247.

BAT tuyn dng bao nhiêu lao ng?
248.

BAT s hu bao nhiêu công ty?
249.

Nhóm sc kho1 cng ng nào c BAT tr giúp v tài chính?
250.

Bit i Buffalo c thành lp khi nào?
251.

Bit i Buffalo có tính s'c tc gì?
252.

Phn nào trong c cu Bit i gi nh li ng i da / ti Buffalo?
253.

Tên ca các thành viên ca Bit i Buffalo.
254.

Các nhóm bit i Buffalo ã sáp nhp vi quân i hp nht vào nm nào?

255.

Các nhóm bit i Buffalo ã b# gii tán vào nm nào?
256.

Bit i Buffalo ã bo v các Công viên quc gia ca bang nào?
257.

Ch DARPA là ch vit t't ca cái gì?
258.

Cuc ua chung kt Challenge di-n ra ti thành ph và bang nào?
259.

Có bao nhiêu phng tin tham gia vào cuc ua Challenge?
260.

Các phng tin tham gia Challenge có nhãn hiu gì, bao gm c các trn bán kt?
261.

Phng tin chin th'ng có nhãn hiu gì?
262.

Loi nhiên liu ca ng i th'ng cuc s dng có tên là gì?
263.

Phng tin chin th'ng c trng bày ti c quan nào ca chính ph?
264.

Bu c t"ng thng c di-n ra vào ngày nào?

265.

T( l ng i tham gia b/ phiu cho cuc bu c là bao nhiêu?
266.

Bao nhiêu ng i có th tham gia tranh c t"ng thng?
267.

Ai ã giành chin th'ng trong cuc bu c t"ng thng?
268.

Ng i th'ng cuc ã nhn c bao nhiêu phn trm phiu bu?
269.

Giá ca mt áp phích ca ng c viên th'ng cuc là bao nhiêu tin?
270.

Nhng nhà lãnh o quc t nào ã gi l i chúc mng?
271.

5ng c viên nào ã b# b't do gi mo?
272.

Gii vô #ch bida Snooker Th gii 2005 ã di-n ra ti thành ph nào?
273.

Gii vô #ch bida Snooker Th gii 2005 ã di-n ra ti toà nhà nào?
274.

Gii vô #ch bida Snooker Th gii 2005 b't u vào tháng nào?

275.

Cho bit tên ca các tay c tham gia Gii vô #ch bida Snooker Th gii 2005?
276.

Tay c nào ã giành Gii vô #ch bida Snooker Th gii 2005?
277.

Hàng nm có bao nhiêu gii bida Snooker Th gii?
278.

Cho bit tên ca nhng gii Bida Snooker Th gii?
279.

Ai hin nay ang gi danh hiu siêu sao bida snooker?
280.

Ninja Rùa (TMNT)
281.

Tên ca các nhân vt trong các truyn TMNT là gì?
282.

Trong truyn có bao nhiêu Ninja rùa?
283.

Ninja rùa n gì?
284.

Mng truyn hình cáp nào trình chiu TMNT?

×