Tải bản đầy đủ (.pdf) (53 trang)

xây dựng cơ sở dữ liệu bài báo điện tử liên quan tới gốm sứ việt nam phục vụ đào tạo tại học viện báo chí và tuyên truyền

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.1 MB, 53 trang )


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
  



PHẠM VĂN BẰNG




XÂY DỰNG CƠ SỞ DỮ LIỆU BÀI BÁO ĐIỆN TỬ LIÊN
QUAN TỚI GỐM SỨ VIỆT NAM PHỤC VỤ ĐÀO TẠO
TẠI HỌC VIỆN BÁO CHÍ VÀ TUYÊN TRUYỀN



LUẬN VĂN THẠC SĨ






HÀ NỘI – 2011

- 1 -
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn: “XÂY DỰNG CƠ SỞ DỮ LIỆU BÀI BÁO ĐIỆN TỬ
LIÊN QUAN TỚI GỐM SỨ PHỤC VỤ ĐÀO TẠO TẠI HỌC VIỆN BÁO CHÍ VÀ


TUYÊN TRUYỀN” là kết quả nghiên cứu của riêng tôi, không sao chép của riêng
ai. Các số liệu và bảng biểu là hoàn toàn chính xác và nội dung luận văn có tham
khảo và sử dụng các tài liệu, thông tin đuợc đăng tải trên các tác phẩm, tạp chí và
các trang web theo danh mục tài liệu của luận văn.



Hà nội, ngày 2 tháng 5 năm 2011
Tác giả luận văn


Phạm Văn Bằng


- 2 -

LỜI CẢM ƠN
Đầu tiên, tôi xin chân thành cảm ơn PGS. TS. Đỗ Trung Tuấn, Bộ môn Toán-
Tin, khoa Toán-Tin, Trường Đại học Tổng hợp, Đại học Quốc Gia Hà Nội, người
đã trực tiếp giảng dạy, định hướng đề tài, tận tình chỉ bảo, giúp đỡ tôi trong suốt quá
trình thực hiện luận văn cao học này.
Tiếp theo, tôi xin chân thành cảm các thầy giáo, cô giáo trường Đại học Công
Nghệ, Đại học Quốc gia Hà nội đã giảng dạy và truyền đạt những kiến thức bổ ích,
những kinh nghiệm quý báu trong suốt quá trình học Cao học.
Cuối cùng tôi xin cảm ơn Bố mẹ và gia đình, cảm ơn những người thân và bạn
bè đồng nghiệp đă luôn ở bên động viên, giúp đỡ, chia sẻ với tôi trong suốt quá
trình học tập và thực hiện luận cao học.














- 3 -

MỤC LỤC
LỜI CAM ĐOAN 1
LỜI CẢM ƠN 2
MỤC LỤC 3
BẢNG DANH MỤC CÁC KÍ HIỆU VIẾT TẮT 5
DANH MỤC HÌNH ẢNH 6
DANH MỤC BẢNG BIỂU 7
MỞ ĐẦU 8
Chương 1: VAI TRÒ CỦA CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN TRONG
CÔNG TÁC DẠY VÀ HỌC 10
1.1. Các dữ liệu đa phương tiện 10
1.1.1. Dữ liệu văn bản 10
1.1.2. Dữ liệu âm thanh 12
1.1.3. Dữ liệu hình ảnh 13
1.1.3. Dữ liệu hình động 14
1.2. Vai trò của dữ liêu đa phương tiện trong quá trình nhận thức của con người15
1.2.1. Phương pháp học tập cổ điển 15
1.2.2. Học tập tương tác, tích cực 16

1.2.3. Vai trò của dữ liệu đa phương tiện trong công tác học tích cực 17
1.3. Kho học liệu tại Học viện Báo chí và Tuyên truyền 18
1.3.1. Kho dữ liệu bài giảng 18
1.3.2. Năng lực truy cập thông tin trên Intrernet của Học viện 19
1.3.3. Nguồn thông tin của Gốm sứ cổ truyền trong công tác đào tạo của Học
viện 20
1.3.4. Nhu cầu về cơ sở dữ liệu thông tin đa phương tiện 20
1.4. Kết luận 20
- 4 -
Chương 2: KHAI PHÁ DỮ LIỆU TRONG CƠ SỞ DỮ LIỆU LIÊN QUAN
TỚI GỐM SỨ CỔ TRUYỀN 21
2.1. Kiến trúc cơ sở dữ liệu văn bản 21
2.1.1. Kiến trúc chung 21
2.1.2. Các chức năng trong cơ sở dữ liệu văn bản 22
2.2. Kiến trúc cơ sở dữ liệu văn bản liên quan tới Gốm sứ cổ truyền Việt Nam 23
2.2.1. Nội dung liên quan tới gốm sứ cổ truyền 23
2.2.2. Các chức năng cần thiết đối với cơ sở dữ liệu văn bản gốm sứ 27
2.3. Khai phá dữ liệu văn bản 28
2.4. Kết luận 35
Chương 3: KHAI THÁC CƠ SỞ DỮ LIỆU VỀ GỐM SỨ CỔ TRUYỀN
TRONG CÔNG TÁC GIẢNG DẠY TẠI HỌC VIỆN BÁO CHÍ VÀ TUYÊN
TRUYỀN 36
3.1. Hạ tầng công nghệ thông tin tại Học viện 36
3.2. Một số môn học liên quan tới Gốm sứ cổ truyền 36
3.3. Thiết kế chi tiết của cơ sở dữ liệu văn bản liên quan tới Gốm sứ cổ truyền 37
3.3.1. Công cụ Olap trong SQL Server 2005 37
3.3.2. Thiết kế chi tiết cơ sở dữ liệu 42
3.4. Một số trang màn hình cài đặt 44
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 51
Các kết quả đạt được 51

Phương hướng nghiên cứu tiếp theo 51
Tiếp tục thiết kế, cài đặt hoàn chỉnh CSDL 51
TÀI LIỆU THAM KHẢO 52
Tiếng việt 52
Internet 52



- 5 -

BẢNG DANH MỤC CÁC KÍ HIỆU VIẾT TẮT

Tên viết tắt
Tiếng Việt
CSDL Cơ sở dữ liệu
CNTT Công nghệ thông tin
OLAP Xử lý phân tích trực tuyến
ASCII Chuẩn mã trao đổi thông tin Hoa Kỳ
DBMS Hệ quản trị cơ sở dữ liệu
ANSI/SPARC Kiến trúc ANSI/SPARC














- 6 -
DANH MỤC HÌNH ẢNH
Hình 1.1 Giao diện phần mềm FontCreator v6.2 11
Hình 1.2 Giao diện phần mềm Fontographer 4.1 11
Hình 1.3 Giao diện phần mềm CoolEdit 2.0 12
Hình 1.5 Giao diện phần mềm tạo hình động Blender 14
Hình 2.1 Kiến trúc ANSI/SPARC 22
Hình 2.2 Chân đèn gốm tráng men lam, loại men nổi tiếng của Bát Tràng 25
Hình 2.3 Hai bình Âm dương gốm Chu đậu 26
Hinh 2.4 Bình hoa gốm Phù Lãng hiện đại 27
Hình 2.5 Mô hình kiến trúc hệ thống khai phá dữ liệu văn bản 28
Hình 2.6 Mô hình hệ thống CSDL dạng hỏi đáp 33
Hình 2.7 Mô tả quá trình trích rút quan hệ nghữ nghĩa 33
Hình 3.1 Tạo mô hình liên kết thực thể 44
Hình 3.3 Thêm thông tin bài báo 44
Hình 3.4 Thêm nội dung thông tin Tác giả 45
Hình 3.5 Thêm nội dung thông tin chuyên mục 45
Hình 3.6 Tạo tìm kiếm thông tin 46
Hình 3.7 Giao diện chương trình Demo 46
Hình 3.8 Giao diện tìm kiếm thông tin 47
Hình 3.9 Giao diện thêm thông tin về tác giả 47
Hình 3.10 Giao diện thêm thông tin về chủ đề 48
Hình 3.11 Giao diện thêm thông tin về bài báo 48
Hình 3.12 Hiển thị các báo cáo theo chuyên mục 1 49
Hình 3.13 Hiển thị các báo cáo theo chuyên mục 2 49
Hình 3.14 Hiển thị các báo cáo theo chuyên mục 3 50




- 7 -
DANH MỤC BẢNG BIỂU
Bảng 2.1 Thủ tục sinh mẫu mới của phương pháp Snowball 32
Bảng 2.2 Một số ví dụ về mẫu quan hệ 32
Bảng 2.3 Một số mẫu tổng quát 33
Bảng 3.1 Thông tin về bài báo 43
Bảng 3.2 Thông tin về tác giả bài báo 43
Bảng 3.3 Thông tin về chuyên mục bài báo 43






- 8 -

MỞ ĐẦU
Học viện báo chí và tuyên truyền trước thách thức về công tác dạy và học, có
nhu cầu cấp thiết sử dụng những công cụ hiện đại của Công nghệ thông tin. Một
mặt công tác quản lý đào tạo, quản lý học viên, quản lý nghiên cứu khoa học cần
sử dụng năng lực của công nghệ thông tin. Mặt khác việc chuẩn bị tư liệu cho các
chuyên nghành đào tạo đã được học viện chú trọng nhằm trang bị học liệu cho công
tác dạy và học.
Một trong những khoa học liệu đã được xây dựng trong nhiều năm qua là khoa
học liệu về văn hóa làng nghề, liên quan đến các đồ gốm sứ cổ truyền việt nam.
Để khoa học liệu được tổ chức và khai thác một cách khoa học, phù hợp với
công nghê đa phương tiện ngày càng thông dụng, luận văn trong đề tài là: Xây dựng
cơ sở dữ liệu bài báo điện tử liên quan tới Gốm sứ phục phụ đào tạo tại Học viện

Báo chí và Tuyên truyền.
Xây dựng CSDL các bài báo liên quan tới gốm sứ là một bài toán cơ bản, là
một bước quan trọng trong quá trình khai phá dữ liệu. CSDL xây dựng được phục
vụ, hỗ trợ cho việc truy vấn thông tin, quá trình tìm kiếm thông tin tại Học viện.
Mong muốn của Học viên là có được một CSDL các bài báo gốm sứ, một lượng
thông tin lớn, có khả năng truy xuất dữ liệu nhanh, đáp ứng nhu cầu về thông tin
trong Học viện.
Luận văn được chia thành các chương. Trừ chương mở đầu luận văn được cấu
trúc.
Chương 1: Vai trò của cơ sở dữ liệu đa phương tiện trong công tác dạy và
học.
Chương 2: Khá phá dữ liệu trong cơ sở dữ liệu liên quan tới gốm sứ cổ
truyền.
Chương 3: Khai thác cơ sở dữ liệu về gốm sứ cổ truyền trong công tác
giảng dạy tại Học viện Báo chí và Tuyên truyền.
Trong chương 1, luận văn trình bày tổng quan về các dữ liệu đa phương tiện,
các phương pháp học tập truyền thống, phương pháp dạy học tích cực, kho dữ liệu
- 9 -
bài giảng, nguồn thông tin về Gốm sứ tại Học viện, từ đó ta thấy được nhu cầu cần
thiết của dữ liệu đa phương tiện trong công tác dạy học và đào tạo tại Học viện.
Trong chương 2, luận văn trình bày khái quát về quá trình khai phá dữ liệu,
những vấn đề liện quan tới gốm sứ cổ truyền Việt nam, kiến trúc về cơ sở dữ liệu
nói chung và kiến trúc cơ sở dữ liệu văn bản nói riêng. Đó là cơ sở ban đầu cho quá
trình khai phá dữ liệu các bài báo liên quan tới gốm sứ cổ truyền Việt nam.
Trong chương 3, trọng tâm của chương này là tiến hành xây dựng cơ sở dữ
liệu các bài báo liên quan tới gốm sứ phục vụ cho Học viện Báo chí và Tuyên
truyền dựa trên ứng dụng trong phần mềm quản trị cơ sở dữ liệu SQL Server 2005.
Cuối luận văn là các nhận xét đánh giá về những nhiệm vụ công việc trong
quá trình làm luận văn tốt nghiệp, đồng thời chia ra phương hướng cho quá trình
tiếp theo.


- 10 -
Chương 1: VAI TRÒ CỦA CƠ SỞ DỮ LIỆU ĐA
PHƯƠNG TIỆN TRONG CÔNG TÁC DẠY VÀ HỌC
1.1. Các dữ liệu đa phương tiện
1.1.1. Dữ liệu văn bản
Dữ liệu văn bản là tập các ký tự được thao tác từ các phần mềm (Soạn thảo,
xử lý văn bản, bộ chữ, bộ gõ) thuộc tính của ký tự: chữ đậm, chữ nghiêng, gạch
chân, kiểu chữ…; Ký tự cho một đoạn thụt ra, thụt vào, đầu lề, dòng. Dữ liệu văn
bản là một loại dữ liệu rời rạc, dạng thông tin cơ bản nhất trong biểu diễn thông tin.
Các loại dữ liệu văn bản điển hình như:

Dữ liệu văn bản có cấu trúc như: Tác giả, Tiêu đề, chương, bảng…;

Dữ liệu văn bản phi cấu trúc như: kiểu chữ, cỡ chữ, font chữ; văn bản đánh
dấu: Tách biệt nội dung và cấu trúc
Các vấn đề đối với văn bản là thu nhân văn bản từ bàn phím, thu nhận tự động
bằng nhận dạng hình ảnh, xử lý tạo văn bản, chỉnh và biên tập, nguyên tắc, lưu trữ:
tách biệt nội dung và cấu trúc, mã hóa và nén, nén không mất thông tin; hiển thị,
hiển thị và cảm nhận; các vấn đề phổ biến đó là sự không tương thích giữa các văn
bản.
Có thể kể đến những vấn đề liên quan tới văn bản như sau:

Mã hóa văn bản: Mã ASCII có mã tiêu chuẩn 7 bít, có mã mở rộng 8 bít.

Các thao tác trên văn bản: thao tác trên ký tự, thể hiện thông qua ký tự.

Các thao tác trên xâu: Thao tác trên chuỗi ký tự.

Soạn thảo văn bản và biên tập văn bản: các thao tác thay đổi khuôn dạng và

cấu trúc của văn bản.

Định dạng văn bản: thực hiện các thao tác đặt các thuộc tính về bố trí văn
bản.

So sánh mẫu và tìm kiếm mẫu cho trước: tìm kiếm bằng cách so sánh với
mẫu hoặc các tiêu chí tìm kiếm.

Sắp xếp văn bản.

Phân văn bản theo các tiêu chí xác định
- 11 -

Một số phần mềm chỉnh sửa Font chữ: fontcreator, fontographer, metafont…
Fontcreator là một phần mềm chỉnh sửa Font chữ phổ biến, có giao diện trực
quan, cho phép người sử dụng làm việc hiệu quả nhờ có công cụ vẽ để tạo và chỉnh
sửa Font.

Hình 1.1 Giao diện phần mềm FontCreator v6.2
Fontographer là phương tiện đơn giản nhất để tạo nên những phông chữ riêng,
độc đáo phục vụ cho việc in ấn, các phương tiện truyền thông hay các ứng dụng trên
Internet. Ta dễ dàng sử dụng khi gặp phải những phông chữ có các kí hiệu số, kí tự
nước ngoài, ngoài ra với phần mềm này ta có thể tự tạo lập những kiểu chữ hoàn
chỉnh từ những bước đơn giản đầu tiên.

Hình 1.2 Giao diện phần mềm Fontographer 4.1


- 12 -
1.1.2. Dữ liệu âm thanh

Dữ liệu âm thanh: là một tập hợp các định dạng âm thanh, một định dạng âm
thanh là một định dạng Tệp để lưu trữ dữ liệu âm thanh trên một máy tính hệ thống,
là một thành phần điển hình của dữ liệu đa phương tiện. Âm thanh gồm có:

Âm thanh có thoại: Như bản nhạc mà tổng phổ phần chính và phần hòa âm,
ca từ (văn bản) gồm làn điệu và tiết tấu.

Âm thanh không có thoại: Gồm có tiếng động, tiếng tự nhiên…
Dữ liệu âm thanh được số hóa trên đĩa, đoạn nhạc âm thanh thường được xử lý
trong hậu trường (phòng thu âm), xử lý bằng phần mềm hay thiết bị xử lý âm thanh

Phần mềm CoolEdit: Cho phép lọc nhiễu lọc ồn;

Hình 1.3 Giao diện phần mềm CoolEdit 2.0

Thiết bị Equaliser: Equaliser là một thiết bị được thiết kế nhằm làm thay đổi
tính chất âm thanh khi âm thanh đi qua nó. Nó còn được hiểu là bộ cân bằng
âm thanh. Equaliser sử dụng nhiều bộ lọc điện tử mà mỗi cái làm việc theo
nguyên lý tăng giảm tín hiệu của từng dải tần. Có nhiều loại Equaliser khác
nhau và mỗi loại lại có những nút điều khiển khác nhau làm chúng ta khó
phân biệt. Cho phép lấy tần số, thêm tiếng Bass, trầm tăng chất lượng âm
thanh, âm nổi.
Tín hiệu âm thanh: là tín hiệu liên tục, trong thực tế âm thanh có dạng sóng
hình sin. Số hóa âm thanh ta phải chia thời gian của âm thanh thành các khoảng
nhỏ, tại mỗi khoảng đó, biên độ âm thanh sẽ được mã hóa thành một con số nhị
phân tương ứng. Có rất nhiều các phần mềm sở hữu các định dạng như:
- 13 -

Mp3-mpeg layer 3: Là một phần mềm định dạng tập tin âm thanh dạng
MP3, đây là một định dạng âm thanh với nhiều loại khác nhau của các

chương trình và các thiết bị âm thanh cầm tay;

Windowns media audio: Là một phầm mềm loại định dạng phổ biến được
Microsoft sản xuất, đây là công nghệ nén nhạc độc quyền của công nghệ
Windows Media.


Audio real: Là phần mềm được thiết kế âm thanh cho các tuyến âm thanh
trên Internet.
1.1.3. Dữ liệu hình ảnh
Dữ liệu hình ảnh: bao gồm tập hợp các tệp định dạng hình ảnh. Hình ảnh được
số hóa hay chụp (bằng máy quét hay máy kỹ thuật số) thể hiện cố định một nội
dung.
Tín hiệu ảnh là tín hiệu hai chiều liên tục trên miền không gian, để xử lý hình
ảnh ta phải tiến hành số hóa, tín hiệu liên tục được chuyển thành tín hiệu rời rạc,
chất lượng hình ảnh thể hiện trên màn hình phụ thuộc vào khả năng biểu diễn mầu,
bộ nhớ RAM dành cho màn hình, khoảng cách giữa các điểm ảnh, tốc độ quét trong
quá trình tạo lưu ảnh.
Điểm ảnh: Ảnh là một tập hợp các phần tử và mỗi phần tử đó gọi là phần tử
ảnh, phần tử ảnh đó gọi là điểm ảnh, mỗi điểm ảnh gồm một cặp tọa độ x, y và mầu.

Hình 1.4 Biểu diễn ảnh với độ phân giải khác nhau
Nhận dạng ảnh: là quá trình phân loại các đối tượng ảnh theo một mô hình nào
đó và gán chúng vào một lớp dựa theo những quy luật và các mẫu chuẩn. Ta có ba
cách tiếp cận nhận dạng như sau:

Nhận dạng dựa trên phân hoạch không gian

Nhận dạng dựa trên cấu trúc


Nhận dạng dựa vào kỹ thuật mạng Noron
- 14 -
Nén ảnh (mã hóa ảnh): là quá trình làm giảm lượng thông tin dư thừa trong
ảnh gốc, ảnh thu được sau khi nén nhỏ hơn nhiều so với ảnh gốc. Có nhiều phương
pháp nén ảnh khác nhau, mỗi phương pháp cho ảnh thu được sau khi nén là khác
nhau. Nếu phân loại theo phương pháp nén dựa trên nguyên lý nén ta chia thành hai
phương pháp nén chính sau:

Nén chính xác hay nén không mất mát thông tin: bao gồm các phương pháp
nén mà sau khi giải nén ta thu được chính xác dữ liệu ảnh gốc.

Nén có mất mát thông tin: Các phương pháp nén này sau khi giải nén ta
không thu được dữ liệu như bản gốc.
1.1.3. Dữ liệu hình động
Dữ liệu hình động: là một tập hợp các tệp hình động, hình động có thể do phần
mềm động tạo ra.
Hình động: là tập hợp các hình tĩnh tạo ra, có liên quan tới nội dung của nó
trong một khoảng thời gian, khi xem nhanh các khung hình tĩnh thì ta thấy sự
chuyển động. Tập các khung hình tĩnh gắn vào một sự kiện thì ta thấy sự chuyển
động và tạo thành một cảnh, nhiều cảnh được gọi là một đoạn, một đoạn gọi là một
Video Clip. Hình động thường được sử dụng trong quảng cáo, thương mại, giáo
dục…
Video: là sự tập hợp của các hình ảnh khác nhau, nhưng cảnh và trình tự sắp
xếp theo một cơ cấu hợp lý. Người ta có thể tạo ra video bằng phần mềm tạo hình
động từ các hình tĩnh, có thể thu được nhờ máy video.

Hình 1.5 Giao diện phần mềm tạo hình động Blender
- 15 -
1.2. Vai trò của dữ liêu đa phương tiện trong quá trình nhân
thức của con người

Con người có nhiều hình thức để thể hiện nhu cầu trạng thái tâm lý của mình
và nhận thức của con người được thông qua các loại hình thể hiện như: chữ viết
(văn bản), hình vẽ tĩnh (chụp, vẽ), hoạt hình (hình ảnh động), âm thanh và gọi là dữ
liệu đa phương tiện. Như vậy hành động, trạng thái tâm lý đã và đang diễn ra được
lưu trữ ở các dạng dữ liệu này, nhờ vào dữ liệu lưu lại ta có thể liên kết, so sánh,
những sự kiện, hiện tượng sảy ra trước và sau của nhận thức của con người, đó là
thể hiện của quá trình nhận thức của con người.
1.2.1. Phương pháp học tập cổ điển
Quá trình dạy: là một quá trình trong đó chứa đựng các yếu tố cơ bản như mục
tiêu dạy học, nội dung dạy học, phương pháp dạy học, phương tiện dạy học, hình
thức tổ chức dạy học và đánh giá kết quả, mỗi một yếu tố trong quá trình dạy có
một vai trò nhất định, tạo nên mối liên kết cơ bản mang tính nhân quả của cả hệ
thống dạy học.
Học: là một quá trình trong đó người học tiếp nhận kiến thức của thầy, trong
sách vở để trở thành kiến thức của mình, đáp ứng nhu cầu của quá trình đòi hỏi cụ
thể, học tập phải có phương pháp học cụ thể.
Dạy và học bằng phương pháp cổ điển là một hệ thống các hành động của
người dạy nhằm tổ chức hoạt động nhận thức và thực hành của người học đảm bảo
người học lĩnh hội được những nội dung học vấn. Dạy học bằng phương pháp
truyền thống là hoạt động là lấy người dạy làm trung tâm, Theo Frire-nhà xã hội
học nhà giáo dục nổi tiếng người Brazin đã gọi phương pháp dạy học này là một
“hệ thống ban phát kiến thức”, là một quá trình truyền tải thông tin từ người dạy
sang người học. Thực hiện cách dạy này người dạy thuyết trình, diễn giảng, là “kho
tri thức” sống, người học là người nghe, ghi chép và suy nghĩ, người dạy là chủ thể,
là tâm điểm và người học là khách thể, là quỹ đạo.
Đặc điểm về nội dung: Nội dung được quy định bởi chương trình giảng dạy và
tất cả người học cùng lĩnh hội nội dung tại cùng một thời điểm. Người học sẽ được
quyền sử dụng nội dung thông tin trong giới hạn do người dạy hoặc thư viện trường
.Các chủ đề được học thường không liên quan tới nhau, đến các lĩnh vực chủ thể và
đến thế giới thực. Người học, học thuộc lòng các sự kiện và đôi khi phân tích thông

- 16 -
tin một cách độc lập, người học làm việc để tìm ra câu trả lời đúng, người dạy lựa
chọn các hoạt động và cung cấp các tài liệu ở cấp độ thích hợp.
Đặc điểm về phương pháp: Người dạy cung cấp thông tin trên bục giảng, giúp
người học đạt được kỹ năng và kiến thức, Người học hoàn thành những hoạt động
và những bài học ngắn, tách rời nhau dựa trên những mảng và những kỹ năng cụ
thể, giáo viên là những chuyên gia, dạy học là một quá trình truyền đạt thông tin.
Để đánh giá người học, người dạy yêu cầu người học làm bài thi bằng bút, giấy, yên
lặng và riêng rẽ và kết quả là điểm của những bài kiểm tra hay bài thi.
Công nghệ giảng dạy: người dạy sử dụng nhiều loại công nghệ khác nhau để
giải thích chứng minh và minh họa cho các chủ đề khác nhau.
Như vậy cách dạy học theo phương pháp truyền thống sẽ rất hiệu quả nếu như
việc chia sẻ thông tin không dễ dàng tìm thấy ở nơi khác, việc trình bày thông tin
một cách nhanh chóng, tạo ra sự quan tâm của người học vào thông tin, tạo ra kỹ
năng lắng nghe tốt trong quá trình học của người học. Tuy nhiên ở phương pháp
dạy học truyền thống này có những mặt hạn chế nhất định của nó bởi không phải
người học nào cũng có khả năng học tốt về lắng nghe, thường không duy trì lâu sự
chú ý của người học, hạn hẹp trong việc tiếp thu thông tin, chưa phát huy hết năng
lực vốn có của người học.
1.2.2. Học tập tương tác, tích cực.
Phương pháp dạy học tích cực: là dạy học bằng hướng phát huy tính tích cực,
chủ động, sáng tạo của người học.
"Tích cực" trong phương pháp dạy học tích cực được dùng với nghĩa là hoạt
động, chủ động, trái nghĩa với không hoạt động, thụ động chứ không dùng theo
nghĩa trái với tiêu cực.
Phương pháp dạy học tích cực hướng tới việc hoạt động hóa, tích cực hóa hoạt
động nhận thức của người học, nghĩa là tập trung vào phát huy tính tích cực của
người học chứ không phải là tập trung vào phát huy tính tích cực của người dạy, tuy
nhiên để dạy học theo phương pháp tích cực thì người dạy phải nỗ lực nhiều so với
dạy theo phương pháp thụ động.

Đổi mới cách học: là phải đổi mới cách dạy, cách dạy chỉ đạo cách học, nhưng
ngược lại thói quen học tập người học cũng ảnh hưởng tới cách dạy của người dạy.
Chẳng hạn, có trường hợp người học đòi hỏi cách dạy tích cực hoạt động nhưng
người dạy chưa đáp ứng được, hoặc có trường hợp người dạy hăng hái áp dụng
- 17 -
phương pháp dạy học tích cực nhưng không thành công vì người học chưa thích
ứng, vẫn quen với lối học tập thụ động.
Học tập tích cực là tích cực nhận thức, ham hiểu biết, có ý chí cố gắng trong
quá trình lĩnh hội kiến thức, học tập tích cực tạo ra hứng thú, sinh ra tính tư duy độc
lập và từ đó hình thành nên khả năng sáng tạo của người học. Tính tích cực là một
phẩm chất vốn có của con người, bởi vì để tồn tại và phát triển con người luôn phải
chủ động, tích cực cải biến môi trường tự nhiên, cải tạo xã hội, vì vậy, hình thành
và phát triển tính tích cực xã hội là một trong những nhiệm vụ chủ yếu của giáo
dục.
Tính tích cực học tập về thực chất là tính tích cực nhận thức, đặc trưng bởi sự
ham hiểu biết, cố gắng trí lực và có nghị lực cao trong quá trình chiếm lĩnh tri thức,
tính tích cực nhận thức trong hoạt động học tập liên quan trước hết với động cơ học
tập. Động cơ đúng tạo ra hứng thú, hứng thú là tiền đề của tự giác, hứng thú và tự
giác là hai yếu tố tạo nên tính tích cực, tính tích cực sản sinh nếp tư duy độc lập,
suy nghĩ độc lập là mầm mống của sáng tạo. Ngược lại, phong cách học tập tích cực
độc lập sáng tạo sẽ phát triển tự giác, hứng thú, bồi dưỡng động cơ học tập. Tính
tích cực học tập biểu hiện ở những dấu hiệu như:

Hăng hái trả lời các câu hỏi của giáo viên, bổ sung các câu trả lời của bạn,
thích phát biểu ý kiến của mình trước vấn đề nêu ra;

Nêu lên thắc mắc, đòi hỏi giải thích cặn kẽ những vấn đề chưa đủ rõ;

Chủ động vận dụng kiến thức, kĩ năng đã học để nhận thức vấn đề mới; tập
trung chú ý vào vấn đề đang học;


Kiên trì hoàn thành các bài tập, không nản trước những tình huống khó
khăn…
Tính tích cực học tập thể hiện qua các cấp độ từ thấp lên cao như:

Bắt chước: gắng sức làm theo mẫu hành động của thầy, của bạn…

Tìm tòi: độc lập giải quyết vấn đề nêu ra, tìm kiếm cách giải quyết khác nhau
về một số vấn đề…

Sáng tạo: tìm ra cách giải quyết mới, độc đáo, hữu hiệu.
1.2.3. Vai trò của dữ liệu đa phương tiện trong công tác học tích cực.
Công nghê thông tin nói chung, dữ liệu đa phương tiện nói riêng ngày càng trở
nên hết sức quan trong công tác dạy và học, đặc biệt là trong công tác học tích cực.
- 18 -
Nâng cao được chất lượng dạy và học: thì trong đó phải có sử dụng hình ảnh,
âm thanh, video để trích dẫn, làm dẫn chứng hay minh họa cụ thể của một vấn đề
cho một bài giảng làm cho bài giảng thêm sinh động và tăng tính thuyết phục, lôi
cuốn người học. Tuy nhiên cung không quá lạm dụng việc sử dụng dữ liệu đa
phương tiện trong quá trình giảng dạy, điều đó sẽ làm phá vỡ đi cấu trúc trọng tâm
chính của vấn đề cần truyền đạt và người học khó nắm được vấn đề.
Như vậy, việc sử dụng dữ liệu đa phương tiện trong công tác học tích cực là
rất cần thiết, nhưng chèn hình ảnh, âm thanh và video ra sao là do người dạy lựa
chọn tùy thuộc vào nội dung bài giảng, tùy thuộc vào thời gian giảng và đối tượng
người học.
1.3. Kho học liệu tại Học viện Báo chí và Tuyên truyền
Kho học liệu của Học viện Báo chí và Tuyên truyền là một kho dữ liệu chứa
dữ liệu khoa học của Học viện, kho học liệu của Học viện có đội ngũ cán bộ chuyên
môn cao, trang thiết bị hiện đại, dữ liệu phong phú, đa dạng.
Học viện không ngừng tuyển dụng, đào tạo, nâng cao trình độ khoa học cho

các cán bộ, không ngừng sửa chữa, nâng cấp trang thiết bị máy móc hiện đại phục
phụ cho việc tra cứu, tìm hiểu, lấy tư liệu của đội ngũ Cán bộ, Giảng viên, Học viên
của Học viện.
Dữ liệu trong kho học liệu luôn được cập nhật, bổ sung, để đảm bảo tính mới,
tính đầy đủ, tính phong phú và đa dạng, từ đó đáp ứng kịp thời cho công tác dạy và
học tại Học viện.
1.3.1. Kho dữ liệu bài giảng
Hiện nay, có nhiều các hiểu khác nhau về kho dữ liệu, nhưng ta có thể định
nghĩa kho dữ liệu như sau: Kho dữ là tập hợp các dữ liệu định hướng theo chủ đề,
được tích hợp lại có tính phiên bản theo thời gian và kiên định được dùng cho việc
hỗ trợ việc tạo quyết định quản lý.
Tên gọi của bốn thuộc tính “định hướng theo chủ đề”, “được tích hợp lại”, “có
tính phiên bản theo thời gian” và “kiên định” ở trên đã cung cấp một số nét cơ bản
nhất về đặc trưng của kho dữ liệu.
Kho dữ liệu bài giảng: là tập hợp các bài giảng có cấu trúc, thường sử dụng
với mục đích dạy học, nghiên cứu khoa học…Ta có thể chia thành hai loại kho dữ
liệu như sau:
- 19 -

Kho dữ liệu đơn ngôn ngữ: là một kho dữ liệu lưu trữ bài giảng trong một
ngôn ngữ.

Kho dữ liệu đa ngôn ngữ: là một kho dữ liệu lưu trư các bài giảng, các bài
giảng có thể được viết bằng các ngôn ngữ khác nhau. Các kho dữ liệu đa
ngôn ngữ được định dạng bằng cách so sánh các thành phần tương ứng giữa
các ngôn ngữ này.
Các kho dữ liệu bài giảng có ý nghĩa hết sức quan trọng trong vấn đề giảng
dạy, học thống kê, tuy nhiên việc xây dựng một kho dữ liệu tốt không hề đơn giản,
trong đó làm sao đảm được tính nhất quán cho dữ liệu gán nhãn trên toàn bộ kho dữ
liệu.

1.3.2. Năng lực truy cập thông tin trên Intrernet của Học viện
Chiến lược phát triển kinh tế xã hội nói chung, chiến lược phát triển khoa học
công nghệ nói riêng là việc tiếp cận và áp dụng những thành tựu khoa học tiên tiến
trên thế giới để bắt kịp với trình độ phát triển chung của các nước trong khu vực và
trên thế giới. Để làm được điều này chúng ta phải sẵn sàng tiếp cận được công nghệ
mới, tri thức mới.
Ngày nay, Internet là một kho dữ liệu khổng lồ, giàu tài nguyên, Thông tin
trên các trang Web rất đa dạng, phong phú về nội dung và hình thức. Một thách
thức đặt ra là khả năng khai thác và sử dụng thông tin trong kho dữ liệu khổng lồ ấy
làm sao có hiệu quả cao nhất, để làm được điều này chúng ta phải đào tạo học sinh,
sinh viên, học viên, người học khi tốt nghiệp ra trường có những kỹ năng và kiến
thức để làm chủ thế giới thông tin. Vậy, năng lực truy cập thông tin trên Internet của
người dạy và người học là một trong những vấn đề cấp thiết cần được quan hàng
đầu, cần được đào tạo, bồi dưỡng, tuyển dụng đội ngũ Giảng viên có trình độ công
nghệ thông tin cao.
Những năm về trước, khi ngành công nghệ thông tin bắt đầu có ở Việt Nam,
hạ tầng cơ sở thấp, năng lực sử dụng công nghệ thông tin còn rất hạn chế. Tuy
nhiên những năm gần đây khi ngành công nghệ thông tin bắt đầu phát triển và mở
rộng tại Việt Nam, hạ tầng cơ sở bắt đầu lớn mạnh, nhờ có những lớp bồi dưỡng,
tình thần tự tìm tòi, học hỏi của các thầy cô và cán bộ trong trường mà khả năng sử
dụng công nghệ thông tin và năng lực truy cập Internet của thầy cô ngày càng tốt
hơn.
- 20 -
1.3.3. Nguồn thông tin của Gốm sứ cổ truyền trong công tác đào tạo
của Học viện
Hiện nay, nguồn thông tin của Gốm sứ cổ truyền trong công tác đào tạo của
Học viện chủ yếu lấy từ kho học liệu của Học viện, Ngoài ra nguồn thông tin còn
được thu thập và trích lọc từ kho dữ liệu các bài báo, kho dữ liệu các Video về gốm
sứ mà là sản phẩm bài tập, bài kiểm tra thực tế của sinh viên, học viên của Học
viện.

1.3.4. Nhu cầu về cơ sở dữ liệu thông tin đa phương tiện
Nắm vững nhu cầu về CSDL thông tin đa phương tiện, đáp ứng kịp thời, chính
xác là một trong những nhiệm vụ quan trọng trong công tác đào tạo tại Học viện.
Ngày nay, khoa học xã hội ngày càng phát triển, các chuyên đào tạo trong Học viện
ngày càng nhiều thì nhu cầu về cơ sở dữ liệu thông tin đa phương tiện ngày càng đa
dạng và phong phú hơn.
1.4. Kết luận
Trong thời kỳ công nghiệp hóa, hiện đại hóa, ngành Công nghệ thông tin đang
trong đà phát triển mạnh, việc sử dụng dữ liệu đa phương tiện, áp dụng hình ảnh,
âm thanh, video vào trong công tác đào tạo tại Học viện Báo chí và Tuyên truyền
nói riêng, công tác giảng dạy và đào tạo nói chung là một nhu cầu cần thiết.





- 21 -
Chương 2: KHAI PHÁ DỮ LIỆU TRONG CƠ SỞ DỮ
LIỆU LIÊN QUAN TỚI GỐM SỨ CỔ TRUYỀN
2.1. Kiến trúc cơ sở dữ liệu văn bản
2.1.1. Kiến trúc chung
Kiến trúc: là một hệ thống xác định cấu trúc của nó, các thành phần được hệ
thống xác định, chức năng mỗi thành phần được mô tả, các mối quan hệ và tương
tác giữa các thành phần này được định nghĩa. Đặc tả về kiến trúc cho các hệ thống
phần mềm đò hỏi phải xác định rất nhiều đơn thể với các giao diện và mối quan hệ
qua lại giữa dòng điều khiển xuyên suốt hệ thống. Có 3 cách tiếp cận khác nhau:

Dựa trên các thành phần: các thành phần của chúng được định nghĩa cùng
với mối tương quan giữa chúng. Như vậy, DBMS gồm một số thành phần,
mỗi thành phần cung cấp một số chức năng vận hành nào đó. Tương tác có

trật tự và có hệ thống giữa chúng cung cấp toàn bộ chức năng của hệ thống.
Đây là tiếp cận mong muốn nếu mục tiêu đối tượng là thiết kế và cài đặt hệ
thống đang xem xét. Ngược lại sẽ rất khó khăn khi cần xác định chức năng
của hệ thống bằng cách xem các thành phần của nó.

Dựa trên chức năng: các nhóm người được sử dụng được xác định và các
chức năng mà hệ thống được thực hiện cho mỗi nhóm được định nghĩa. Đặc
tả hệ thống loại này điển hình là mô tả cấu trúc phân cấp của các nhóm người
sử dụng. Kết quả là tạo ra một kiến trúc hệ thống phân cấpvới các giao diện
được định nghĩa rõ ràng giữa các chức năng và các tầng khác nhau.

Dựa trên dữ liệu: các kiểu dữ liệu khác nhau sẽ được định nghĩa, và bộ
khung kiến trúc được đặc tả nhằm nhằm định nghĩa các đơn vị chức năng sẽ
tiếp nhận hoặc sử dụng dữ liệu trên những góc độ khác nhau. Bởi dữ liệu là
tài nguyên chính mà DBMS cần quản lý, cách tiếp cận này được ưa chuộng
đối với hoạt động tiêu chuẩn hoá. Ưu điểm của tiếp cận trên dữ liệu là tầm
quan trong chủ chốt đã được đặt vào tài nguyên dữ liệu. Trên quan điểm của
của hệ quản trị CSDL, điều này rất có ý nghĩa bởi vì tài nguyên căn bản mà
DBMS quản lý là dữ liệu. Tuy nhiên chúng ta không thể đặc tả đầy đủ một
kiến trúc trừ khi mô đun chức năng cũng được mô tả.
Cả ba cách tiếp cận trên điều phải được sử dụng khi ta định nghĩa một mô hình
kiến trúc, trong đó mỗi góc độ ta sẽ tập trung vào các khía cạnh khác nhau của mô
- 22 -
hình kiến trúc, kiến trúc ANSI/SPARC thuộc vào nhóm phương pháp dựa vào tổ
chức dữ liệu, nó cho phép ba hình ảnh về dữ liệu:

Khung nhìn ngoài: là cách nhìn của người sử dụng, kể cả lập trình viên;

Khung nhìn trong: là cách nhìn của hệ thống;


Khung nhìn khái niệm: là cách nhìn của công ty hay xí nghiệp.

Hình 2.1 Kiến trúc ANSI/SPARC

Lược đồ trong: là lược đồ ở mức thấp nhất của kiến trúc, là mức xử lý phần
định nghĩa và tổ chức vật lý của dữ liệu. Vị trí của dữ liệu trong thiết bị lưu
trữ, cơ chế truy nhập được sử dụng là những vấn đề được cập nhật ở mức
này.

Lược đồ ngoài: là tập khung nhìn của từng người sử dụng biểu thị cho phần
CSDL mà người dùng có thể truy cập cũng như mối liên hệ giữa các dữ liệu
người dùng có thể thấy được. Nhiều người sử dụng có thể dùng chung một
khung nhìn.

Lược đồ khái niệm: là lược đồ nằm giữa lược đồ ngoài và lược đồ trong, là ý
nghĩa khái niệm của CSDL.
2.1.2. Các chức năng trong cơ sở dữ liệu văn bản
CSDL văn bản cũng có một số chức năng chính như: Lưu trữ, truy câp, tổ
chức và xử lý.

Lưu trữ trên đĩa và có thể chuyển đổi từ CSDL này sang CSDL khác, ta có
thể sử dụng các hệ quản trị CSDL nhỏ như Excel, Access, MySQL,
ProrgraSQL, hay SQL Server, Oracle.
- 23 -

Truy cập dữ liệu phụ thuộc vào yêu cầu và mục đích của người sử dụng. Ở
mức cục bộ dữ liệu được truy cập ngay chính trong CSDL nhằm xử lý dữ
liệu bên trong của chính nó. Khi mục đích yêu cầu vượt ra ngoài CSDL ta
cần có sự cập nhật giữa các CSDL với nhau.


Tổ chức CSDL văn bản phụ thuộc vào mô hình cơ sở dữ liệu, phụ thuộc vào
đặc điểm riêng của từng ứng dụng cụ thể.

Trong nhiều trường hợp cần xử lý, truy vấn dữ liệu theo yêu cầu và mục đích
khác nhau, ta phải truy vấn cùng với các phép toán, phát biểu CSDL để kết
xuất ra yêu cầu của việc xử lý.
2.2. Kiến trúc cơ sở dữ liệu văn bản liên quan tới Gốm sứ cổ
truyền Việt Nam
2.2.1. Nội dung liên quan tới gốm sứ cổ truyền
Gốm sứ bát tràng: là tên gọi cho các loại đồ gốm được sản xuất tại làng Bát
tràng thuộc xã Bát tràng, huyện Gia lâm, Hà nội. Theo nghĩa Hán Việt, chữ Bát
nghĩa là Bát ăn của nhà sư, chữ tràng có nghĩa là “cái sân lớn” là mảng đất dành
riêng cho chuyên môn. Để làm gốm sứ người chọn phải qua các khâu xử lý và pha
chế đất, tạo dáng, tạo hoa văn, phủ men và cuối cùng là nung sản phẩm.

Chọn đất: điều quan trong đầu tiên để hình thành nên các lo gốm là nguồn
đất sét làm gốm

Xử lý, pha chế đất: trong đất nguyên liệu thường có tạp chất, ngoài ra tùy
thuộc vào yêu cầu của từng loại gốm khác nhau mà có những cách pha chế
khác nhau để tạo ra sản phẩm phù hợp.

Tạo dáng: phương pháp tạo dáng cổ truyền của người làng Bát tràng là làm
bằng tay trên bàn xoay. Trong khâu tạo dáng, người thợ gốm Bát tràng, sử
dụng phổ biến lối “vuốt tay, be chạch” trên bàn xoay. Ngày nay, theo yêu cầu
sản xuất gốm công nghệ hay mĩ nghệ, nghệ nhân gốm có thể đắp nặn một sản
phẩm mẫu để đổ khuôn thạch cao phục phụ cho việc sản xuất hàng loạt.

Phơi sấy và sửa hàng mộc: tiến hành phơi hàng mộc sao cho khô, không bị
nứt nẻ, không làm thay đổi hình dạng của sản phẩm. Biện pháp tối ưu mà lâu

nay người dân Bát trang vẫn sử dụng là hong khô hiện vật trên giá và để nơi
thoáng mát. Ngày nay nhiều người đã sử dụng sấy hiện vật trong lò sấy, tăng
- 24 -
nhiệt độ từ từ để nước bốc hơi dần. Sau khi sản phẩm đã định hình cần đem
“ủ vóc” và sửa lại cho hoàn chỉnh.

Quá trang trí hoa văn và phủ men: Để trang trí hoa văn người thợ gốm Bát
tràng vẽ trực tiếp lên nền mộc các văn họa tiết, thợ vẽ gốm phải có tay nghề
cao, hoa văn học tiết phải hài hòa với giáng gốm

Tráng men: khi sản phẩm mộc đã hoàn chỉnh, người thợ gốm có thể nung sơ
bộ sản phẩm ở nhiệt độ thấp, rồi sau đó mới đem tráng men hoặc dùng ngay
sản phẩm mộc hoàn chỉnh đó trực tiếp tráng men lên trên rồi mới nung. Kỹ
thuật tráng men có nhiều hình thức như phun men, dội men lên bề mặt cốt
gốm cỡ lớn, nhúng men đối với loại gốm nhỏ, nhưng thông dụng nhất là
tráng men ngoài sản phẩm, gọi là “kim men”, và khó hơn là hình thức “quay
men” và “đúc men”.

Quá trình nung: khi công việc chuẩn bị đã hoàn tất thì đốt lò trở thành khâu
quyết định thành cộng hay quyết định của một mẻ gốm, việc nung gốm theo
nguyên tác nâng cao dần nhiệt độ lò đến nhiệt độ cao nhất, khi gốm chin thì
hạ dần nhiệt độ lò.
Những đặc điểm của gốm Bát Tràng: Hầu hết, đồ gốm Bát Tràng được sản
xuất theo lối thủ công, thể hiện rõ rệt tài năng sáng tạo của người thợ lưu truyền qua
nhiều thế hệ. Do tính chất của các nguồn nguyên liệu tạo cốt gốm và việc tạo dáng
đều làm bằng tay trên bàn xoay, cùng với việc sử dụng các loại men khai thác trong
nước theo kinh nghiệm nên đồ gốm Bát Tràng có nét riêng là cốt đầy, chắc và khá
nặng, lớp men trắng thường ngả mầu ngà, đục.
Dựa vào ý nghĩa sử dụng, có thể phân chia loại hình của đồ gốm Bát Tràng
như sau:


Đồ gốm gia dụng: Bao gồm các loại đĩa, chậu hoa, âu, thạp, ang, bát, chén,
khay trà, ấm, điếu, nậm rượu, bình vôi, bình, lọ, choé và hũ.

Đồ gốm dùng làm đồ thờ cúng: Bao gồm các loại chân đèn, chân nến, lư
hương, đỉnh, đài thờ, mâm gốm và kiếm. Trong đó, chân đèn, lư hương và
đỉnh là những sản phẩm có giá trị đối với các nhà sưu tầm đương đại vì lẽ
trên nhiều chiếc có minh văn cho biết rõ họ tên tác giả, quê quán và năm
tháng chế tạo, nhiều chiếc còn ghi khắc cả họ và tên của những người đặt
hàng. Đó là một nét đặc biệt trong đồ gốm Bát tràng.

×