Tải bản đầy đủ (.docx) (40 trang)

Khóa luận tốt nghiệp Tìm hiểu xây dựng hệ thống từ điển Việt - Lào

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (975.08 KB, 40 trang )

TRƯỜNG ĐẠI HỌC QUẢNG BÌNH
KHOA KỸ THUẬT – CÔNG NGHỆ THÔNG TIN
-----------

XAIYALATH LATDAVONE

KHÓA LUẬN
TỐT NGHIỆP ĐẠI HỌC

TÌM HIỂU XÂY DỰNG HỆ THỐNG
TỪ ĐIỂN VIỆT - LÀO
GIẢNG VIÊN HƯỚNG DẪN: TS. PHẠM XUÂN HẬU
NGÀNH: CÔNG NGHỆ THÔNG TIN
HỆ ĐÀO TẠO: CHÍNH QUY

Quảng Bình, năm 2019


KHÓA LUẬN TỐT NGHIỆP

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..


……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
Sinh viên thực hiện: NUT XAIYALATH


KHÓA LUẬN TỐT NGHIỆP

……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..
……………………………………………………………………………………

……..
……………………………………………………………………………………
……..
……………………………………………………………………………………
……..…………
Xác nhận của giáo viên hướng dẫn
LỜI CẢM ƠN
Trong quá trình thực hiện báo cáo Khóa luận tốt nghiệp này em đã nhận
được sự quan tâm giúp đỡ tận tình của nhiều tập thể, cá nhân trong và ngoài
trường.
Trước hết, em xin bày tỏ lòng biết ơn sâu sắc tới giảng viên
TS. Phạm Xuân Hậu - Người đã trực tiếp hướng dẫn em trong suốt quá trình
nghiên cứu và thực hiện đề tài.
Em xin chân thành cảm ơn các thầy giáo, cô giáo trong Khoa Kỹ thuật Công nghệ thông tin Trường Đại học Quảng Bình, Hội sinh viên Lào tại Trường
Đại học Quảng Bình đã tạo mọi điều kiện thuận lợi, động viên, giúp đỡ em
trong suốt quá trình học tập và rèn luyện tại trường.
Em xin bày tỏ lòng biết ơn vô hạn tới gia đình, người thân và bạn bè đã
luôn sát cánh bên em trong suốt quá trình học tập và nghiên cứu đề tài, đặc biệt
Sinh viên thực hiện: NUT XAIYALATH


KHÓA LUẬN TỐT NGHIỆP

là nhóm nghiên cứu của TS. Phạm Xuân Hậu gồm các bạn Trần Hữu Lương,
Trần Văn Dũng, Lương Duy Đăng và Mimee Phothila.
Mặc dù trong quá trình nghiên cứu đề tài, bản thân em có những cố gắng
nhất định, song do trình độ và thời gian có hạn nên đề tài không tránh khỏi
những thiếu sót. Vậy kính mong các thầy cô giáo và các bạn đóng góp ý kiến để
đề tài của em được hoàn thiện hơn và rất mong sản phẩm hiện thực của em sẽ
trở thành một sản phẩm mang tính xã hội và phục vụ được trong điều kiện phát

triển của nghành CNTT Việt Nam và thúc đẩy mối quan hệ hữu nghị Việt - Lào.
Em xin chân thành cảm ơn!
MỤC LỤC

DANH MỤC TỪ VIẾT TẮT

Các từ viết tắt

Diễn giải

APP

Application

CSDL

Cơ sở dữ liệu

IoT

Internet of Things

PDA

Personal Digital Assistant

HTML

HyperText Markup Language


XHTML

Extensible HyperText Markup Language

CMS

Content Management System

PHP

Personal Home Page
Sinh viên thực hiện: NUT XAIYALATH


KHÓA LUẬN TỐT NGHIỆP

OHA

Open Handset Alliance

OOP

Object-oriented programming

JVM

Java Virtual Machine

SDK


Software Development Kit

IDE

Integrated Development Environment

IDEA

International Data Encryption Algorithm

ADT

Android Development Tools

JSON

Javascript Object Notation

Sinh viên thực hiện: NUT XAIYALATH


KHÓA LUẬN TỐT NGHIỆP

DANH MỤC HÌNH ẢNH
Hình 3.1 Giao diện chính của ứng dụng
Hình 3.2 Giao diện các chức năngtrong Navigation Drawer của ứng dụng
Hình 3.3 Giao diện từ vựng yêu thích
Hình 3.4 Giao diện dịch bằng Yandex API
Hình 3.5 Giao diện chơi game luyện tập từ vựng
Hình 3.6 Giao diện kết quả sau khi kết thúc game

Hình 3.7 Giao diện tra cứu từ vựng
Hình 3.8 Giao diện kết quả tra cứu từ vựng 1
Hình 3.9 Giao diện kết quả tra cứu một số từ vựng

Sinh viên thực hiện: NUT XAIYALATH


KHÓA LUẬN TỐT NGHIỆP

A. TỔNG QUAN ĐỀ TÀI
1. Lý do chọn đề tài
Việc khai thác và tổng hợp dữ liệu để phục vụ cho các mục đích của cá
nhân hay tổ chức chưa bao giờ dễ như bây giờ nếu chúng ta biết tận dụng hết
tiềm năng của công nghệ hiện đại, cụ thể là công nghệ thông tin. Số hóa từ điển
đã và đang là một trong những điều cần thiết đối với nhu cầu học tập ngôn ngữ
và tìm hiểu văn hóa của con người. Cuộc cách mạng công nghệ 4.0 không
ngừng phát triển kéo theo đó là sự phát triển của điện thoại thông minh
(smartphone) và các thiết bị thông minh khác. Ngày nay trong cuộc sống hằng
ngày thì chiếc điện thoại thông minh không còn dừng lại ở mục đích chỉ nghe và
gọi như trước đây mà nó trở thành một phương tiện để phục vụ cho các hoạt
động công việc cũng như giải trí của con người với rất nhiều các ứng dụng. Nó
hỗ trợ trong nhiều việc để phục vụ cho mục đích sử dụng ngày càng nhiều của
chúng ta. Giúp cho người dùng ngày càng khai thác được thêm nhiều thông tin
bổ ích trên mạng Internet để phục vụ nhu cầu học tập, công việc và giải trí.
Chính phủ nước ta cũng đang dần xây dựng một chính phủ điện tử, tất cả các tài
liệu sẽ được số hóa, sẽ tiếp tục đưa mỗi cá nhân mạng thành một nhà cung cấp
thông tin, một công dân số.
Xã hội phát triển, quan hệ toàn cầu phát triển mạnh mẽ, sự giao lưu giữa
các nền văn hóa giữa các quốc gia ngày càng tăng. Một trong các quốc gia anh
em với Việt Nam đó là nước bạn Lào. Số lượng du học sinh Lào sang Việt Nam

học tập ngày càng tăng lên. Ngoài ra, còn có các khách du lịch, lao động, các
công việc nghiên cứu tìm hiểu văn hóa giữa hai quốc gia.
Từ điển dưới dạng ứng dụng (application - App) trên smartphone cho phép
người dùng tra cứu từ điển ngay trên chiếc điện thoại của mình. Như chúng ta đã
biết, có hai nền tảng hệ điều hành phổ biến hiện nay là IOS và Android. Mỗi
phiên bản hệ điều hành chỉ hỗ trợ được App tương thích với hệ điều hành đó.
Vì vậy, em đã chọn đề tài “Tìm hiểu xây dựng hệ thống Từ Điển
Việt - Lào” để thực hiện đề tài khoá luận tốt nghiệp.
Sinh viên thực hiện: NUT XAIYALATH

7


KHÓA LUẬN TỐT NGHIỆP

2. Đối tượng nghiên cứu
Với Khoá luận này, em tập trung vào các nội dung sau:


Tìm hiểu, nghiên cứu quy trình xây dựng App



Tìm hiểu quá trình xây dựng từ điển.



Xây dựng demo App Từ điển Lào –Việt.
3. Mục tiêu nghiên cứu
- Nghiên cứu lý thuyết giúp ta:




Hiểu được quy trình phát triển ứng dụng



Nắm vững ngôn ngữ lập trình Java và các công cụ kèm theo



Hiểu được thiết kế từ điển và khái niệm liên quan
- Nghiên cứu thực tiễn, công nghệ nhằm:



Lập trình Java để phát triển App



Áp dụng công cụ Yandex và xây dựng CSDL cho ứng dụng



Xây dựng demo Từ điển Lào – Việt
4. Phạm vi nghiên cứu của đề tài
Tập trung vào các vấn đề liên quan để xây dựng demo Ứng dụng Từ điển
Việt - Lào
5. Phương pháp nghiên cứu
- Nghiên cứu lý thuyết

- Khảo sát các ứng dụng từ điển hiện có trên các Store
- Phát triển ứng dụng và chạy thử
6. Ý nghĩa lý luận và thực tiễn của Khoá luận
- Thông qua việc thực hiện khoá luận giúp em nắm vững các kiến thức đã
học
- Vận dụng và rèn luyện kỹ năng lập trình trong phát triển phần mềm
- Xây dựng ứng dụng Từ điển Lào – Việt giúp sinh viên Lào trong hoạt
động học tập và nghiên cứu khoa học.

Sinh viên thực hiện: NUT XAIYALATH

8


KHÓA LUẬN TỐT NGHIỆP

B. NỘI DUNG ĐỀ TÀI
CHƯƠNG 1: TỪ ĐIỂN VÀ SỐ HÓA TỪ ĐIỂN
1.
1.1.

Từ điển nói chung
Khái niệm
Từ điển là danh sách các từ, ngữ được sắp xếp thành các từ vi
chuẩn (lemma) [8]. Một từ điển thông thường cung cấp các giải nghĩa các từ ngữ
đó hoặc các từ ngữ tương đương trong một hay nhiều thứ tiếng khác. Ngoài ra
còn có thể có thêm thông tin về cách phát âm, các chú ý ngữ pháp, các dạng biến
thể của từ, lịch sử hay từ nguyên, cách sử dụng hay các câu ví dụ, trích dẫn.Đối
với các ngôn ngữ sử dụng ký tự Latin thì các từ có thể được sắp xếp theo thứ tự
chữ cái.

Tiếng Lào là một ngôn ngữ thuộc Ngữ chi Thái trong hệ ngôn ngữ TaiKadai. Tiếng Lào chịu những ảnh hưởng của tiếng Phạn. Hiện nay tiếng Lào
được 2 trường phái khác nhau phiên âm, một là do các Hiệp hội Văn hóa Hữu
nghị Việt - Lào thực hiện thì họ phiên sang âm tiếng Việt vì tiếng Việt gần như
có khá đầy đủ các bộ âm chuẩn mà không thể phát âm sai được. Phiên âm theo
tiếng Việt là cách phiên âm chuẩn nhất đối với tiếng Lào và tiếng Thái nói chung
[9].

1.2.

Đặc trưng
Từ điển học ngày nay đã trở thành một bộ môn ngôn ngữ học ứng dụng
quan trọng. Từ điển được xếp vào một trong những ấn bản được xuất bản với số
lượng nhiều nhất và phong phú nhất. Sự phát triển mạnh mẽ của ngôn ngữ học
trong những năm gần đây, đặc biệt những thành tựu đã đạt được trong nghiên
cứu ngữ pháp và ngữ nghĩa, đã tạo tiền đề cho việc xây dựng cơ sở lí luận từ
điển học hiện đại cùng với sự hỗ trợ của công nghệ thông tin đã đưa việc xây
dựng từ điển lên một cấp độ mới. Việc ứng dụng công nghệ thông tin, các thuật
toán, cách tổ chức liệu thông minh đã tạo một bước phát triển mới của từ điển.
Sinh viên thực hiện: NUT XAIYALATH

9


KHÓA LUẬN TỐT NGHIỆP

Tuy nhiên, dù là bản in hay phần mềm từ điển thì các đặc trưng sau của một từ
điển phải được đảm bảo [1].
1.2.1. Tính chuẩn mực

Từ điển là nơi cung cấp thông tin hoặc giải thích một thuật ngữ, sự vật hay

hiện tượng một cách ngắn gọn và chính xác nhất [8]. Ngoài phương pháp định
nghĩa theo lối hàn lâm, bác học (phương pháp này sử dụng phổ biến trong từ
điển triết học hay những từ điển chuyên ngành khác), phương pháp kiến giải của
hầu hết từ điển hiện nay là luôn dùng những ngôn từ đơn giản và phổ biến nhất
trong xã hội. Thông tin trong từ điển luôn được kiểm chứng và thừa nhận rộng
rãi trong cộng đồng sử dụng ngôn ngữ đó và có thể cả toàn xã hội.
1.2.2. Tính tương đối

Từ điển chứa đựng những thông tin đã có, đã được kiểm chứng - do đó, nó
luôn bị thay đổi hoặc bổ sung theo thời gian, cùng với sự thăng trầm của sự vật
hoặc hiện tượng mà nó đã đề cập. Từ điển luôn đi sau những thay đổi hoặc tiến
bộ của xã hội loài người. Luôn được cập nhật và định nghĩa lại theo các kết
nghiên cứu của các nhà ngôn ngữ học.
Hiện nay đã có rất nhiều loại từ điển khác nhau. Chúng gần như hoàn toàn
độc lập với nhau. Nhưng, như Ladislav Zgusta đã nhận xét ngay ở lời mở đầu
công trình về từ điển học của mình (1971), một trong những đặc điểm lạ lùng
nhất của từ điển học là các nhà từ điển rất ít trao đổi kinh nghiệm với nhau. Sự
phân lập này có thể dẫn đến hiện tượng mâu thuẫn về nội dung của cùng một
vấn đề trong các từ điển khác nhau. Như vậy, tính tương đối của tự điển có thể
phát sinh khi xem xét về cùng một vấn đề ở hai từ điển khác nhau.
Từ điển mang đậm phong cách của nhóm tác giả biên soạn ra nó. Tính
tương đối của từ điển còn có nguyên nhân từ sự khác biệt của mỗi nền văn hóa văn minh, ngôn ngữ, dân tộc, quốc gia trên thế giới. Mỗi thành tố trên có thể lý
Sinh viên thực hiện: NUT XAIYALATH

10


KHÓA LUẬN TỐT NGHIỆP

giải về cùng một hiện tượng xã hội theo nhiều quan điểm, tư tưởng hay chính

kiến khác nhau. Do đó, có thể cùng một khái niệm, nhưng tùy theo mỗi nền văn
hóa khác nhau, có thể có cách sử dụng (vận dụng) khác nhau.
Như vậy, tính tương đối của từ điển có thể xuất phát từ sự chậm trễ khi cập
nhật, sự phân lập của các nhà từ điển học hoặc sự khác biệt của các nền văn hóa
trên Trái Đất.
1.2.3.

Tính đa dạng
Thông tin trong từ điển ghi nhận tất cả sự nhìn nhận, đánh giá, sử dụng hay
vận dụng một khái niệm (phạm trù) theo nhiều hướng khác nhau đảm bảo sự
toàn vẹn ngôn ngữ cùng với sự khác biệt giữa các nền văn hóa, văn minh, tầm

1.2.4.

ảnh hưởng và tiến bộ của các cộng đồng, dân tộc hoặc các quốc gia trên thế giới.
Tính trung lập
Tính đa dạng của từ điển bắt buộc nó phải thể hiện quan điểm trung lập
trong tất cả các vấn đề mà nó đã đề cập. Ở đây nó thể hiện là một kết quả nghiên

1.2.5.

cứu, là sản phẩm của các nhà ngôn ngữ học.
Tính lịch sử
Trong từ điển luôn chứa đựng đầy đủ sự hình thành và phát triển của một
khái niệm hay phạm trù mà nó lưu giữ. Ở đó, người xem tiếp cận được cả cách
sử dụng (vận dụng) từ ngữ từ lúc sơ khai cho đến hiện tại. Điều này thể hiện sự

phát triển không ngừng của từ điển theo thời gian.
1.3.
Ngôn ngữ Tiếng Lào

1.3.1. Bảng chữ cái tiếng Lào
1.3.1.1
Phụ âm

co

đo

p'hỏ

o
Chú ý: - chữ ຜ


khỏ

to

pho

ho
chữ ຝ







kho ngo cho só

xo
nho






thó tho no
bo
po
p'ho






phó mo do
lo
vo hó
ຫງ ຫຍ ໜ

ຫລ ຫວ
ngó nhó nó
mó ló

khi phát âm phải bậm môi lại sau đó mới phì hơi ra

nên tôi tạm phiên âm thành p'ho và p'hỏ.

- Chữ ຫລ (lỏ) còn có thể viết thành ຫຫ.
Sinh viên thực hiện: NUT XAIYALATH

11


KHÓA LUẬN TỐT NGHIỆP
1.3.1.2

Nguyên âm.
Khi ghép vần với phụ âm ở trên được sắp xếp theo thứ tự:

1.3.1.3

1.3.2.

Xະ


Xາ
a

Xິ


Xີ
y

Xຶ



Xອ
ư

Xຸ


ເX


ເ Xິ


ເX
ê

ແXະ


ແX
e

ໂXະ


ໂX
ô

ເ X າະ Xພ


o

ເ Xີ
ơ

ເ Xັຍ
ịa

ເ Xຶອ
ựa

ເ Xອອ
ưa

Xຄົວະ
ụa

ໄX
ạy

ໃX
ay

ເ Xຄົາ
au

ເX

ia
Xາ


Ăm

Xູ
u

Xຄົວ
ua

Các từ vựng
ຄອບຄຄົວ:

Gia đình

khọp khua

ພພພ

:

Bố

phò

ແມພ

:

Mẹ




ອອາຍ

:

Anh

ại

ເອອອອຍ :

Chị

ượi

Ngữ pháp tiếng Lào
Đối với các Ngôn ngữ Đông Dương như Lào, Campuchia, Việt Nam và
Thái Lan thì Ngữ pháp có rất nhiều điểm tương đồng. Tương đồng nhất về Ngữ
pháp giữa các Ngôn ngữ này là 'nói xuôi' tức là nếu ghép tất cả các Từ vựng lại
với nhau theo kiểu Từ - liền - Từ (word - to - word) thì Từ nào có ý nghĩa càng
quan trọng sẽ càng được xếp ở đầu câu, Từ nào càng ít quan trọng thì càng bị
xếp về cuối câu.
Vì thế khi muốn diễn nghĩa một câu tiếng Lào, tiếng Thái hoặc tiếng
Campuchia sang tiếng Việt thì có thể dịch nghĩa từng từ và xếp theo đúng thứ tự
tương ứng thì sẽ thành nghĩa một câu tiếng Việt khá hoàn chỉnh, loại trừ một số
trường hợp đặc biệt trong ngữ pháp của các nước.
Trong tiếng LÀO có chữ ໆ dùng để viết khi có những từ phải viết 2 lần, có
nghĩa là khi đọc đến từ nào mà đứng sau nó có chữ ໆ thì phải đọc lặp 2 lần. Ví
dụ từ ຊຊ້າໆ đọc là xạ xạ (từ từ).

Sinh viên thực hiện: NUT XAIYALATH

12


KHÓA LUẬN TỐT NGHIỆP

Trong tiếng Lào không có chữ "J" mà chỉ có chữ này "ຢ" (đọc là do). Chữ
này có thể dùng thay thế cho các chữ d, g trong tiếng Việt (đôi khi thay cho cả
chữ r)
Còn chữ ຽ của tiếng Lào thì thay thế cho chữ iê của tiếng Việt.Chữ này
đứng một mình thì không đọc được. Thí dụ từ ຮຽນ nghĩa là học được ghép như
sau: ຮ (ho) + ຽ (iê) + ນ (no) = hiên
Ví dụ cụ thể Danh từ trong các Ngôn ngữ Lào - Thái - Khmer

1.4.

Tiếng Lào: koy pen nuk-seuk-sa (khọi pen nặc-xức-xa)
Tiếng Thái: pom pen nuk-seuk-sa (phôm pen nặc-xức-xa)
Tiếng Khmer: nhom kir chea sers (nhom cừ chia xa)
Tiếng Việt: Tôi là Sinh viên
Số hóa văn bản và từ điển
Ngay từ những năm của thập niên 60 thế kỉ 20, máy tính đã được sử dụng
trong quá trình làm từ điển và từ đó đến nay vai trò của máy tính trong việc xây
dựng từ điển ngày càng được khẳng định. Với những ưu việt khi áp dụng công
nghệ thông tin khi xây dựng và phát triển từ điển như thuật tiện, gọn nhẹ, dễ
dàng và nhanh chóng đã giúp người dùng dễ dàng tiếp cận với từ điển mọi lúc,
mọi nơi và nhiều ngôn ngữ cùng lúc.
Trong thời đại của IoT (Internet of Things), lưu trữ đám mây và kết nối,
hợp tác di động qua môi trường Internet, dữ liệu số là yếu tố đầu tiên và yếu tố

quyết định cho các quy trình cần thiết.
Trong những năm trở lại đây, việc ứng dụng công nghệ thông tin và truyền
thông trong hoạt động của cơ quan nhà nước, hướng tới phát triển chính phủ
điện tử là xu thế tất yếu, là mô hình phổ biến của nhiều quốc gia. Đặc biệt vài
năm gần đây, làn sóng cách mạng công nghiệp 4.0 đang biến đổi toàn thế giới và
tác động mạnh mẽ tới từng ngóc ngách của cuộc sống. Những khái niệm mới
như văn bản số, từ điển số, công dân số, doanh nghiệp số, văn phòng điện tử,
chính phủ điện tử, thành phố thông minh trở nên phổ biến, trở thành xu hướng
tất yếu.
Không nằm ngoài xu thế đó, việc xây dựng Chính phủ điện tử ở Việt Nam
có những tác động không nhỏ đến lề lối, phương thức làm việc của các cơ quan,
Sinh viên thực hiện: NUT XAIYALATH

13


KHÓA LUẬN TỐT NGHIỆP

tổ chức. Thay vì ban hành văn bản, tài liệu giấy, các cơ quan, tổ chức chuyển
sang dùng văn bản, tài liệu điện tử. Đặc biệt là sau khi Luật Giao dịch điện tử,
Luật Công nghệ thông tin, Luật Lưu trữ … cùng nhiểu văn bản dưới luật công
nhận giá trị của văn bản, tài liệu điện tử và chữ ký số. Có thể nói rằng, văn bản,
tài liệu điện tử ra đời như môt kết quả tất yếu của Chính phủ điện tử.
Với những ưu điểm vượt trội như: chuyển giao dễ dàng, nhanh chóng; tiết
kiệm diện tích lưu trữ…, văn bản, tài liệu điện tử dần dần thay thế văn bản, tài
liệu truyền thống.
Tuy nhiên, theo quan điểm của nhiều nhà nghiên cứu, văn bản, tài liệu
truyển thống không bao giờ bị thay thế hoàn toàn. Đối với các cơ quan, tổ chức
sử dụng văn bản, tài liệu điện tử cùng hệ thống quản lý văn bản và điều hành
công việc qua mạng thì những văn bản, tài liệu quan trọng liên quan đến nhân

sự, tài chính đất đai hoặc chứa đựng bí mật nhà nước vẫn ở dạng giấy. Nhiều cơ
quan, tổ chức vẫn sử dụng 100% văn bản, tài liệu giấy và sau đó số hóa chúng
để cập nhật, quản lý bằng hệ thống quản lý văn bản và điều hành công việc qua
mạng. Đó là ở giai đoạn văn thư, còn ở giai đoạn lưu trữ, kết quả nhiều khảo sát
cho thấy phần lớn tài liệu giao nộp vào lưu trữ vẫn ở dạng giấy. Do đó, có thể
khẳng định rằng văn bản, tài liệu giấy ở giai đoạn văn thư, lưu trữ của các cơ
quan tổ chức vẫn chiếm đa số. Có những thời kì, “cơn bão giấy” tấn công không
gian làm việc, việc lưu trữ, quản lý, tìm kiếm thông tin trở nên khó khăn, mất
nhiều thời gian hơn, ảnh hưởng trực tiếp đến hiệu quả thực hiện công việc.
Thông thường từ điển được trình bày dưới dạng sách, ngày nay từ điển còn
được số hóa và cung cấp dưới dạng phần mềm máy tính hay truy cập trực tuyến
trên web, trên trình nhắn tin nhanh, hay có trong các thiết bị số cá nhân như
PDA, điện thoại...Trong thế kỷ 21 này, tất cả các từ điển có uy tín trên thế giới
đều có khai thác từ các kho ngữ liệu lớn và sử dụng các công cụ tin học để nhập
liệu, xử lí và tra cứu dữ liệu trong quá trình làm từ điển và thậm chí cho cả
người sử dụng cuối (end-user) khi từ điển đã hoàn thành.

Sinh viên thực hiện: NUT XAIYALATH

14


KHÓA LUẬN TỐT NGHIỆP

Trước thực tế như vậy, các cơ quan, tổ chức phải làm gì? Một giải pháp
được coi như “cứu tinh, giảm thiểu sự tấn công của “cơn bão giấy” là số hóa văn
bản, tài liệu.
Các cơ quan, tổ chức thấy rõ những lợi ích mà việc số hóa từ điển đem lại
như:
1.4.1.


Tiết kiệm không gian lưu trữ văn bản, tài liệu;
Giúp việc lưu trữ, truy xuất, chia sẻ, tiềm kiếm thông tin một cách dễ dàng
Linh hoạt trong việc chuyển đổi sang các loại dữ liệu số khác nhau
Có khả năng chỉnh sửa và tái sử dụng dữ liệu;
Bản sao dự phòng các rủi ro có thể xảy ra đối với bản giấy;
Giảm thiểu sự xuống cấp về mặt vật lý và hóa học của tài liệu gốc trong quá
trình khai thác, sử dụng.
Từ điển dưới dạng phần mềm máy tính hay truy cập trực tuyến trên web
Phần mềm máy tính, hay đơn giản là phần mềm, là tập hợp dữ liệu hoặc
hướng dẫn máy tính cho máy tính biết cách làm việc. Điều này trái ngược với
phần cứng vật lý, từ đó hệ thống được xây dựng và thực sự thực hiện công việc.
Trong khoa học máy tính và kỹ thuật phần mềm, phần mềm máy tính là tất cả
thông tin được xử lý bởi hệ thống máy tính, chương trình và dữ liệu. Phần mềm
máy tính bao gồm các chương trình máy tính, thư viện và dữ liệu không thể thực
thi liên quan, chẳng hạn như tài liệu trực tuyến hoặc phương tiện kỹ thuật số.
Phần cứng và phần mềm máy tính yêu cầu lẫn nhau và không thể tự sử dụng một
cách thực tế.
Website (tiếng Anh: website), còn gọi là trang WEB (có thể nhầm lẫn với
"web page") hoặc trang mạng, là một tập hợp trang web, thường chỉ nằm trong
một tên miền hoặc tên miền phụ trên World Wide Web của Internet. Một trang
web là tập tin HTML hoặc XHTML có thể truy nhập dùng giao thức HTTP.
Trang mạng có thể được xây dựng từ các tệp tin HTML (trang mạng tĩnh) hoặc
vận hành bằng các CMS chạy trên máy chủ (trang mạng động).
Trang mạng có thể được xây dựng bằng nhiều ngôn ngữ lập trình khác
nhau (PHP, ASP.NET, Java, Ruby on Rails, Perl,...).
Website được giao tiếp và hiển thị cho người dùng truy cập bằng các phần
mềm được gọi là trình duyệt website. Một sô trình duyệt website nổi tiếng có thể
kể đến như Internet Explorer được cài đặt mặc định vào mỗi máy tính cài hệ
Sinh viên thực hiện: NUT XAIYALATH


15


KHÓA LUẬN TỐT NGHIỆP

điều hành windows và được thay thế bởi Edge trên Windows 10 hay Chrome
được phát triển bởi Google và Firefox được phát triển bởi Mozilla.
Từ điển trực tuyến trên WEB là một website cho phép người dùng tra cứu
trực tuyến các từ hoặc cụm từ theo nhiều ngôn ngữ khác nhau.Loại từ điển số
này có thể tương thích với hầu hết các nền tảng hệ điều hành nhưng bắt buộc
1.4.2.

phải truy cập trực tuyến nên yêu cầu phải có kết nối internet.
Từ điển dưới dạng ứng dụng trên thiết bị thông minh
Ngày nay trong cuộc sống hằng ngày, công việc, lẫn giải trí và chiếc điện
thoại không còn là chiếc điện thoại chỉ nghe và gọi như trước đây mà nó trở
thành một chiếc điện thoại thông minh có thể hoạt động như những chiếc máy
tính với rất nhiều các ứng dụng sẽ giúp cho nó làm được nhiều việc hơn phục vụ
cho mục đích sử dụng ngày càng nhiều của chúng ta.
Điện thoại thông minh (Smartphone) là khái niệm để chỉ loại điện thoại di
động thích hợp một nền tảng hệ điều hành di động với nhiều tính năng hỗ trợ
tiên tiến về điện toán và có khả năng kết nối với nhiều thiết bị điện tử hiện đại
như TV thông minh, máy tính, robot, nhà thông minh, tích hợp hoặc không trí
thông minh nhân tạo, dựa trên nền tảng cơ bản của điện thoại di động thông
thường (điện thoại phổ thông).
Khái niệm smartphone ra mắt từ những năm 2003 - 2005. Ban đầu điện
thoại thông minh bao gồm các tính năng của điện thoại di động thông thường kết
hợp với các thiết bị phổ biến khác như PDA, thiết bị điện tử cầm tay, máy ảnh
kỹ thuật số, hệ thống định vị toàn cầu Android Development Tools. Điện thoại

thông minh hiện đại ngày nay bao gồm hầu như tất cả chức năng của laptop,
máy tính như duyệt web, Wi-Fi, đồ họa, văn phòng, chơi game, chụp ảnh, quay
phim, video call, định vị toàn cầu, trợ lý ảo, các ứng dụng của bên thứ 3 trên
Kho ứng dụng di động và các phụ kiện đi kèm cho máy. Thậm chí một số
smartphone cao cấp còn đóng vai trò như một món đồ trang sức đắt tiền, tô điểm
cho người chủ nhân.
Trong lịch sử đã từng có nhiều nền tảng hệ điều hành di động cũng như
nhiều phong cách thiết kế được sinh ra và bị khai tử. Năm 2007, với sự ra đời
của chiếc iPhone thế hệ đầu tiên của Apple với màn hình cảm ứng điện dung,
Sinh viên thực hiện: NUT XAIYALATH

16


KHÓA LUẬN TỐT NGHIỆP

iPhone đã được coi là sự định hình cho kiểu dáng thiết kế điện thoại thông minh
hiện đại.
Chiếc iPhone đầu tiên ra mắt năm 2007 - chiếc điện thoại định hình thế giới
smartphone hiện đại.
Những điện thoại thông minh phổ biến nhất hiện nay dựa trên nền tảng của
2 hệ điều hành trụ lại thành công duy nhất là Android của Google và iOS của
Apple.
Từ điển dưới dạng APP trên smartphone là một ứng dụng cho phép người
dùng tra cứu từ điển ngay trên chiếc điện thoại của mình. Như đã nói ở trên, có
hai nền tảng hệ điều hành phổ biến hiện nay là IOS và Android. Mỗi phiên bản
hệ điều hành chỉ hỗ trợ được APP tương thích với hệ điều hành đó. IOS không
thể chạy ứng dụng Android và ngược lại.

Sinh viên thực hiện: NUT XAIYALATH


17


KHÓA LUẬN TỐT NGHIỆP

CHƯƠNG 2: QUY TRÌNH XÂY DỰNG ỨNG DỤNG TỪ ĐIỂN
2.1. Android là gì?
Android là một hệ điều hành dựa trên nền tảng Linux được thiết kế dành
cho các thiết bị di động có màn hình cảm ứng như điện thoại thông minh và máy
tính bảng. Ban đầu, Android được phát triển bởi Tổng công ty Android, với sự
hỗ trợ tài chính từ Google và sau này được chính Google mua lại vào năm 2005.
Android ra mắt vào năm 2007 cùng với tuyên bố thành lập Liên minh thiết bị
cầm tay mở: một hiệp hội gồm các công ty phần cứng, phần mềm, và viễn thông
với mục tiêu đẩy mạnh các tiêu chuẩn mở cho các thiết bị di động. Chiếc điện
thoại đầu tiên chạy Android được bán vào năm 2008.
Android có mã nguồn mở và Google phát hành mã nguồn theo Giấy phép
Apache. Chính mã nguồn mở cùng với một giấy phép không có nhiều ràng buộc
đã cho phép các nhà phát triển thiết bị, mạng di động và các lập trình viên nhiệt
huyết được điều chỉnh và phân phối Android một cách tự do. Ngoài ra, Android
còn có một cộng đồng lập trình viên đông đảo chuyên viết các ứng dụng để mở
rộng chức năng của thiết bị, bằng một loại ngôn ngữ lập trình Java có sửa đổi.
Vào tháng 10 năm 2012, có khoảng 700.000 ứng dụng trên Android, và số lượt
tải ứng dụng từ Google Play, cửa hàng ứng dụng chính của Android, ước tính
khoảng 25 tỷ lượt.
Những yếu tố này đã giúp Android trở thành nền tảng điện thoại thông
minh phổ biến nhất thế giới, vượt qua Symbian OS vào quý 4 năm 2010, và
được các công ty công nghệ lựa chọn khi họ cần một hệ điều hành không nặng
nề, có khả năng tinh chỉnh, và giá rẻ chạy trên các thiết bị công nghệ cao thay vì
tạo dựng từ đầu. Kết quả là mặc dù được thiết kế để chạy trên điện thoại và máy

tính bảng, Android đã xuất hiện trên TV, máy chơi game và các thiết bị điện tử
khác. Bản chất mở của Android cũng khích lệ một đội ngũ đông đảo lập trình
viên và những người đam mê sử dụng mã nguồn mở để tạo ra những dự án do
cộng đồng quản lý. Những dự án này bổ sung các tính năng cao cấp cho những
Sinh viên thực hiện: NUT XAIYALATH

18


KHÓA LUẬN TỐT NGHIỆP

người dùng thích tìm tòi hoặc đưa Android vào các thiết bị ban đầu chạy hệ điều
hành khác.
Android chiếm 87,7% thị phần điện thoại thông minh trên toàn thế giới vào
thời điểm quý 2 năm 2017, với tổng cộng 2 tỷ thiết bị đã được kích hoạt và 1,3
triệu lượt kích hoạt mỗi ngày. Sự thành công của hệ điều hành cũng khiến nó trở
thành mục tiêu trong các vụ kiện liên quan đến bằng phát minh, góp mặt trong
cái gọi là "cuộc chiến điện thoại thông minh" giữa các công ty công nghệ.
Lịch sử phiên bản của hệ điều hành di động Android bắt đầu với bản
Android beta vào tháng 11 năm 2007. Phiên bản thương mại đầu tiên, Android
1.0, được phát hành vào tháng 9 năm 2008. Android đang được phát triển bởi
Google và Open Handset Alliance (OHA), và đã có một số bản cập nhật cho hệ
điều hành này kể từ khi ra mắt.
Từ tháng 4 năm 2009, phiên bản Android được phát triển dưới tên mã là
chủ đề bánh kẹo và phát hành theo thứ tự bảng chữ cái: Cupcake (1.5), Donut
(1.6), Eclair (2.0–2.1), Froyo (2.2–2.2.3), Gingerbread (2.3–2.3.7), Honeycomb
(3.0–3.2.6), Ice Cream Sandwich (4.0–4.0.4), Jelly Bean (4.1–4.3), KitKat (4.4),
Lollipop (5.0-5.1.1), Marshmallow (6.0), Nougat(7.0), Oreo(8.0), Pie(9.0), và
sắp tới là Q(10.0). Vào 3 tháng 9 năm 2013, Google công bố rằng 1 tỉ thiết bị đã
được kích hoạt hiện sử dụng Android OS trên toàn cầu. Bản cập nhật Android

gần đây nhất là Pie, nó được cập nhật thông qua OTA cho các thiết bị của
GOOGLE.
2.2. Ngôn ngữ lập trình JAVA
Java là một ngôn ngữ lập trình hướng đối tượng (OOP) và dựa trên các lớp
(class). Khác với phần lớn ngôn ngữ lập trình thông thường, thay vì biên dịch
mã nguồn thành mã máy hoặc thông dịch mã nguồn khi chạy, Java được thiết kế
để biên dịch mã nguồn thành bytecode, bytecode sau đó sẽ được môi trường
thực thi (runtime environment) chạy.
Trước đây, Java chạy chậm hơn những ngôn ngữ dịch thẳng ra mã máy như
C và C++, nhưng sau này nhờ công nghệ "biên dịch tại chỗ" - Just in time
compilation, khoảng cách này đã được thu hẹp, và trong một số trường hợp đặc
biệt Java có thể chạy nhanh hơn. Java chạy nhanh hơn những ngôn ngữ thông
Sinh viên thực hiện: NUT XAIYALATH

19


KHÓA LUẬN TỐT NGHIỆP

dịch như Python, Perl, PHP gấp nhiều lần. Java chạy tương đương so với C#,
một ngôn ngữ khá tương đồng về mặt cú pháp và quá trình dịch/chạy.
Cú pháp Java được vay mượn nhiều từ C & C++ nhưng có cú pháp hướng
đối tượng đơn giản hơn và ít tính năng xử lý cấp thấp hơn. Do đó việc viết một
chương trình bằng Java dễ hơn, đơn giản hơn, đỡ tốn công sửa lỗi hơn.
Trong Java, hiện tượng rò rỉ bộ nhớ hầu như không xảy ra do bộ nhớ được
quản lý bởi Java Virtual Machine (JVM) bằng cách tự động "dọn dẹp rác".
Người lập trình không phải quan tâm đến việc cấp phát và xóa bộ nhớ như C,
C++. Tuy nhiên khi sử dụng những tài nguyên mạng, file IO, database (nằm
ngoài kiểm soát của JVM) mà người lập trình không đóng (close) các streams thì
rò rỉ dữ liệu vẫn có thể xảy ra.

Có 6 mục tiêu chính trong việc xây dựng ngôn ngữ Java:







Đơn giản, hướng đối tượng và quen thuộc.
Mạnh mẽ và an toàn.
Kiến trúc trung lập và di động.
Thực thi với hiệu suất cao.
Dịch ra bytecode, phân luồng và năng động.
Dễ sử dụng cho người dùng Java
Các phiên bản Java đã phát hành:


















JDK 1.0 (23 tháng 01, 1996)
JDK 1.1 (19 tháng 2 năm 1997)
JDK 1.1.5 (Pumpkin) 03 tháng 12 năm 1997
JDK 1.1.6 (Abigail) 24 tháng 4 năm 1998
JDK 1.1.7 (Brutus) 28 tháng 9 năm 1998
JDK 1.1.8 (Chelsea) 08 tháng 4 năm 1999
J2SE 1.2 (Playground) 08 tháng 12 năm 1998
J2SE 1.2.1 (không có) 30 tháng 3 năm 1999
J2SE 1.2.2 (Cricket) 08 tháng 7 năm 1999
J2SE 1.3 (Kestrel) 08 tháng 5 năm 2000
J2SE 1.3.1 (Ladybird) 17 tháng 5 năm 2001
J2SE 1.4.0 (Merlin) 06 tháng 02, 2002
J2SE 1.4.1 (Hopper) 16 tháng 9 năm 2002
J2SE 1.4.2 (Mantis) 26 tháng 6 năm 2003
J2SE 5 (1.5.0) (Tiger) 30 tháng 9 năm 2004

Sinh viên thực hiện: NUT XAIYALATH

20


KHÓA LUẬN TỐT NGHIỆP


Java SE 6 (còn gọi là Mustang), được công bố 11 tháng 12 năm 2006, thông tin
chính tại Các bản cập nhật 2 và 3 được đưa ra vào








năm 2007, bản cập nhật 4 đưa ra tháng 1 năm 2008.
JDK 6.18, 2010
Java SE 7 (còn gọi là Dolphin), được bắt đầu từ tháng 8 năm 2006 và công bố
ngày 28 tháng 7 năm 2011.
JDK 8, 18 tháng 3 năm 2014
JDK 9, 21 tháng 9 năm 2017
JDK 10, 20 tháng 3 năm 2018
2.3. Firebase Realtime Database là gì?
Firebase là một dịch vụ API để lưu trữ và đồng bộ dữ liệu real-time (thời
gian thực). Điều này có nghĩa là bạn không cần phải lo lắng về backend server,
cơ sở dữ liệu, hay các thành phần real-time (socket.io). Firebase hoạt động trên
nền tảng đám mây được cung cấp bởi Google nhằm giúp các lập trình phát triển
nhanh các ứng dụng bằng cách đơn giản hóa các thao tác với cơ sở dữ liệu.
Có thể hiểuFirebase Database là một cơ sở dữ liệu NoSQL lưu và đồng bộ
dữ liệu trên mây. Dữ liệu được đồng bộ trên tất cả clients trong thời gian thực,
và vẫn khả dụng khi ứng dụng offline.Firebase Realtime Database là cơ sở dữ
liệu lưu trữ trên mây. Dữ liệu được lưu trữ và đồng bộ hóa theo thời gian thực
với mỗi client được kêt nối. Khi bạn xây dựng ứng dụng đa nền tẩng với iOS,
Android, và javascript SDK, tất cả các client của bạn chia sẽ một thể hiện
Realtime Database và tự động tiếp nhận các thay đổi với dữ liệu mới nhất.
Các khả năng chính của Realtime Database



Realtime:Firebase Realtime Database sử dụng đồng bộ dữ liệu mối khi dữ liệu




có thay đổi, mọi thiết bị được kết nối sẽ nhận được thay đổi trong vài mili giây.
Offline:Khi người dùng ngoại tuyến, dữ liệu sẽ được lưu trên bộ nhớ cache của



thiết bị và tự động đồng bộ khi bạn trực tuyến. Tất cả là tự động
Accessible from Client Devices: Firebase Realtime Database có thể truy cập từ
một thiết bị mobile hoặc trình duyệt web. Nó không cần một ứng dụng server
nào cả. Bảo mật và xác thực dữ liệu có thể thông qua các Rule bảo mật của
Firebase Realtime Database, các rule được thực thi khi dữ liệu được đọc hoặc
ghi.
Sinh viên thực hiện: NUT XAIYALATH

21


KHÓA LUẬN TỐT NGHIỆP

2.4. Android Studio
Android Studio là môi trường phát triển tích hợp (IDE) chính thức dành
cho phát triển nền tảng Android.Nó được ra mắt vào ngày 16 tháng 5 năm 2013
tại hội nghị Google I/O.
Android Studio được phát hành miễn phí theo giấy phép Apache Licence
2.0.Android Studio ở giai đoạn truy cập xem trước sớm bắt đầu từ phiên bản 0.1
vào tháng 5.2013, sau đó bước vào giai đoạn beta từ phiên bản 0.8 được phát
hành vào tháng 6 năm 2014. Phiên bản ổn định đầu tiên được ra mắt vào tháng
12 năm 2014, bắt đầu từ phiên bản 1.0.

Dựa trên phần mềm IntelliJ IDEA của JetBrains, Android Studio được thiết
kế đặc biệt để phát triển ứng dụng Android. Nó hỗ trợ các hệ điều hành
Windows, Mac OS X và Linux, và là IDE chính thức của Google để phát triển
ứng dụng Android gốc để thay thế cho Android Development Tools (ADT) dựa
trên Eclipse.
2.5. Tích hợp realtime database trong Firebase vào Android
2.5.1. Tạo một project mới trên firebase:


Bước 1: Tạo một tài khoản trên Firebase hoặc bạn có thể login vào Firebase
bằng tài khoản gmail.

Sinh viên thực hiện: NUT XAIYALATH

22


KHÓA LUẬN TỐT NGHIỆP


Bước 2: Sau khi đã đăng nhập tài khoản Firebase. Chúng ta tạo một project mới
trên Firebase. Ở đây mình tạo một project có tên demo-firebase. Chúng ta viết
vào dòng Project name và chọn CREAT PROJECT.

Sau khi đã tạo project mới chúng ta sẽ được chuyển vào trang dashboard
của project vừ mới tạo. Phía menu bên trái, chúng ta chọn Develop -> Database

Toàn bộ dữ liệu của project sẽ được hiển thị ở phần Data. Như vậy chúng ta
đã tạo xong một project mới trên Firebase.
2.5.2. Cấu hình Firebase lên Android Studio



Bước 1: Mở Android Studio, tạo một project mới và chọn MainActivity dạng



Empty Activity.
Bước 2: Tại cửa sổ của Firebase, vào mục project overview sau đó ấn vào nút
chọn tích hợp vào Android. Sau đó có một sửa sổ hiện thị để chúng ta nhập

Sinh viên thực hiện: NUT XAIYALATH

23


KHÓA LUẬN TỐT NGHIỆP

package name và project name. Nhập vào tên package và tên project giống như
project vừa tạo ở Android Studio.

Sau đó tải file google-services.json và copy vào trong thư mục app ở
Android Studio.



Bước 3: Thực hiện cấu hình thư viện trên Android Studio Trong Android Studio,
mở file build.gradle (project) và thêm dòng sau:
buildscript {
dependencies {
Sinh viên thực hiện: NUT XAIYALATH


24


KHÓA LUẬN TỐT NGHIỆP

// Add this line
classpath 'com.google.gms:google-services:3.1.0'
}
}

Trong file build.gradle (app) thêm dòng sau vào cuối:
dependencies {
//Add this line
compile 'com.google.firebase:firebase-database:11.8.0'
}
apply plugin: 'com.google.gms.google-services'
Tại phía góc trên bên phải của Android Studio ấn Sync Now Vậy là ta đã
hoàn thành cấu hình FireBase lên Android studio.
2.5.3. Đọc, ghi dữ liệu Firebase trên Android


Ghi dữ liệu. Trên Android studio ta vào MainActivity. Tại hàm onCreate ta gọi
hàm
// Write a message to the database
FirebaseDatabase database = FirebaseDatabase.getInstance();
DatabaseReference myRef = database.getReference("message");
myRef.setValue("Hello, World!");
Sau đó chạy thử chương trình thì sẽ thấy ở trên database đã được thêm dữ liệu
vào.


Sinh viên thực hiện: NUT XAIYALATH

25


×