Tải bản đầy đủ (.pdf) (88 trang)

Sắp xếp và dự trù thuốc bằng luật kết hợp cho kho dược ngoại trú bệnh viện Thống Nhất (Luận văn thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.27 MB, 88 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------

PHAN CẢNH THỊ CẨM DUNG

SẮP XẾP VÀ DỰ TRÙ THUỐC BẰNG LUẬT KẾT HỢP
CHO KHO DƯỢC NGOẠI TRÚ BỆNH VIỆN THỐNG NHẤT

LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)

TP. HỒ CHÍ MINH – NĂM 2018


HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------

PHAN CẢNH THỊ CẨM DUNG
SẮP XẾP VÀ DỰ TRÙ THUỐC BẰNG LUẬT KẾT HỢP
CHO KHO DƯỢC NGOẠI TRÚ BỆNH VIỆN THỐNG NHẤT
CHUYÊN NGÀNH:
MÃ SỐ:

HỆ THỐNG THÔNG TIN
8480104

LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)

NGƯỜI HƯỚNG DẪN KHOA HỌC
TS. TÂN HẠNH



TP. HỒ CHÍ MINH – NĂM 2018


i

LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác.

Tp. Hồ Chí Minh, ngày 10 tháng 4 năm 2018
Học viên thực hiện luận văn

Phan Cảnh Thị Cẩm Dung


ii

LỜI CẢM ƠN
Trong thời gian học tập dưới mái trường Học Viện Công Nghệ Bưu Chính
Viễn Thông, nhờ được sự chỉ dạy tận tình của quý Thầy Cô giáo trong khoa Đào tạo
Sau đại học cơ sở Tp. Hồ Chí Minh đã tạo mọi điều kiện thuận lợi và giúp cho tôi
có được những kiến thức nền tảng, quan trọng, cần thiết để tôi thực hiện luận văn
này. Đặc biệt tôi xin gửi lời cảm ơn chân thành và lòng biết ơn sâu sắc tới TS. Tân
Hạnh, Thầy đã tận tâm chỉ dẫn, truyền đạt những kiến thức và kinh nghiệm quý báu
cho tôi trong suốt quá trình thực hiện luận văn này.
Tôi xin chân thành cảm ơn Lãnh đạo bệnh viện Thống Nhất đã tạo mọi điều
kiện và cung cấp số liệu cho tôi hoàn thiện luận văn này.
Bên cạnh đó, tôi cũng đã nhận được rất nhiều sự giúp đỡ, những lời động

viên quý báu của gia đình, bạn bè và đồng nghiệp. Tôi xin hết lòng ghi ơn.
Mặc dù tôi đã cố gắng hoàn thành luận văn trong những phạm vi và khả năng
cho phép, nhưng luận văn cũng không thể tránh khỏi các thiếu sót. Tôi rất mong
nhận được sự cảm thông, cũng như những ý kiến đóng góp, chỉ dẫn của quý Thầy
Cô để tôi có thể hoàn thiện tốt hơn đề tài của mình.
Xin trân trọng cảm ơn.

Tp. Hồ Chí Minh, ngày 10 tháng 4 năm 2018
Học viên thực hiện luận văn

Phan Cảnh Thị Cẩm Dung


iii

MỤC LỤC
Trang
LỜI CAM ĐOAN ----------------------------------------------------------------------------- i
LỜI CẢM ƠN ----------------------------------------------------------------------------------ii
MỤC LỤC ------------------------------------------------------------------------------------- iii
DANH MỤC CÁC TỪ VIẾT TẮT --------------------------------------------------------- v
DANH SÁCH BẢNG ------------------------------------------------------------------------ vi
DANH SÁCH HÌNH ------------------------------------------------------------------------ vii
MỞ ĐẦU --------------------------------------------------------------------------------------- 1
Chương 1 - GIỚI THIỆU TỔNG QUAN VÀ ĐẶT VẤN ĐỀ -------------------------- 2
1.1. Lý do chọn đề tài -----------------------------------------------------------------------2
1.2. Tổng quan về vấn đề nghiên cứu ----------------------------------------------------3
1.2.1. Tình hình nghiên cứu ngoài nước -----------------------------------------------3
1.2.2. Tình hình nghiên cứu trong nước -----------------------------------------------4
1.3. Mục tiêu, đối tượng và phạm vi nghiên cứu ---------------------------------------5

1.3.1. Mục tiêu ----------------------------------------------------------------------------5
1.3.2. Đối tượng nghiên cứu ------------------------------------------------------------6
1.3.3. Phạm vi nghiên cứu ---------------------------------------------------------------6
1.4. Bố cục luận văn ------------------------------------------------------------------------6
Chương 2 - CƠ SỞ LÝ THUYẾT----------------------------------------------------------- 7
2.1. Tổng quan về phương pháp dự báo --------------------------------------------------7
2.1.1. Phân loại phương pháp dự báo --------------------------------------------------8
2.1.2. Quy trình thực hiện dự báo ---------------------------------------------------- 10
2.2. Dự báo dữ liệu chuỗi thời gian ----------------------------------------------------- 14
2.2.1. Định nghĩa dữ liệu chuỗi thời gian ------------------------------------------- 14
2.2.2. Các thành phần của chuỗi thời gian ------------------------------------------ 15
2.2.3. Bài toàn dự báo chuỗi thời gian ----------------------------------------------- 17
2.2.4. Các phương pháp dự báo chuỗi thời gian ------------------------------------ 19
2.2.5. Đánh giá dự báo ----------------------------------------------------------------- 28
2.3. Tổng quan về khai phá dữ liệu ----------------------------------------------------- 30


iv

2.3.1. Giới thiệu về khai phá dữ liệu ------------------------------------------------- 30
2.3.2. Các kỹ thuật khai phá dữ liệu phổ biến -------------------------------------- 32
2.3.3. Ứng dụng khai phá dữ liệu ----------------------------------------------------- 33
2.4. Khai phá luật kết hợp ---------------------------------------------------------------- 34
2.4.1. Thuật toán Apriori -------------------------------------------------------------- 36
2.4.2. Thuật toán FP–Growth --------------------------------------------------------- 38
2.5. Dự báo dựa vào luật kết hợp ------------------------------------------------------- 39
Chương 3 - THỰC NGHIỆM -------------------------------------------------------------- 41
3.1. Khảo sát ------------------------------------------------------------------------------- 41
3.1.1. Tổng quan về bệnh viện Thống Nhất ----------------------------------------- 41
3.1.2. Tổng quan về Khoa Dược - Bệnh viện Thống Nhất ------------------------ 42

3.1.3. Các khái niệm, quy định liên quan đến sắp xếp thuốc và dự trù thuốc cho
kho Dược ngoại trú --------------------------------------------------------------------- 44
3.1.4. Thực trạng sắp xếp thuốc tại kho Dược ngoại trú bệnh viện Thống Nhất
-------------------------------------------------------------------------------------------- 46
3.1.5. Nhận xét và đánh giá ----------------------------------------------------------- 47
3.1.6. Thực trạng dự trù thuốc cho hoạt động cấp phát thuốc ngoại trú tại bệnh
viện Thống Nhất ------------------------------------------------------------------------ 48
3.1.7. Nhận xét và đánh giá ----------------------------------------------------------- 50
3.2. Phân tích, thiết kế và xây dựng hệ thống dự báo dựa trên luật kết hợp ------ 51
3.2.1. Giới thiệu về quá trình thu thập và xử lý, chuyển đổi dữ liệu------------- 51
3.2.2. Áp dụng Luật kết hợp trong sắp xếp và dự trù thuốc cho kho Dược ngoại
trú tại bệnh viện Thống Nhất ---------------------------------------------------------- 53
3.3. Thực nghiệm và đánh giá ----------------------------------------------------------- 55
3.3.1. Khai phá luật kết hợp ----------------------------------------------------------- 55
3.3.2. Sắp xếp thuốc bằng luật kết hợp cho kho Dược ngoại trú bệnh viện
Thống Nhất ------------------------------------------------------------------------------ 61
3.3.3. Đánh giá độ tin cậy của các luật kết hợp tìm được để sắp xếp thuốc ---- 66
3.3.4. Dự trù thuốc bằng luật kết hợp cho kho Dược ngoại trú bệnh viện Thống
Nhất --------------------------------------------------------------------------------------- 66
3.3.5. So sánh giữa 2 phương pháp dự báo------------------------------------------ 70
3.3.6. Giao diện chương trình thực nghiệm ----------------------------------------- 70
KẾT LUẬN ---------------------------------------------------------------------------------- 76
DANH MỤC TÀI LIỆU THAM KHẢO ------------------------------------------------- 78


v

DANH MỤC CÁC TỪ VIẾT TẮT

Viết tắt


Tiếng Anh

Tiếng Việt

BHYT

Bảo hiểm y tế

CSDL

Cơ sở dữ liệu

DB

Dự báo

TB

Trung bình

SL

Số lượng

ME

Mean Error

Sai số trung bình


MSE

Mean Squared Error

Sai số trung bình tổng bình
phương

MPE

Mean Percentage Error

Phần trăm sai số trung bình

RMSE

Root Mean Squared Error

Sai số căn bậc hai trung bình
tổng bình phương

MAD

Mean Absolute Deviation

Sai số trung bình tuyệt đối

MAPE

Mean Absolute Percentage Error


Phần trăm sai số trung bình
tuyệt đối


vi

DANH SÁCH BẢNG
Trang
Bảng 2.1: Bảng số liệu về tình hình sử dụng kháng sinh Augmentin BD trong điều
trị ngoại trú trong 2 năm 2016 – 2017 ---------------------------------------------------- 15
Bảng 3.1: Bảng dữ liệu sau khi làm sạch và qua tiền xử lý dữ liệu ------------------ 52
Bảng 3.2: Chuyển đổi dữ liệu: Từ dữ liệu hàng dọc sang dữ liệu hàng ngang ------ 52
Bảng 3.3: Kết quả tổng hợp các luật tìm được------------------------------------------- 55
Bảng 3.4: Phát đồ điều trị phối hợp giữa các bệnh hoặc triệu chứng ----------------- 62
Bảng 3.5: Danh sách 10 hoạt chất phổ biến và số lượng sử dụng từng hoạt chất theo
năm (thống kê 3 năm 2014, năm 2015 và năm 2017) ---------------------------------- 67
Bảng 3.6: Bảng dự trù thuốc năm 2017 (áp dụng cho 10 hoạt chất phổ biến) theo
công thức hiện tại đang áp dụng tại bệnh viện Thống Nhất --------------------------- 68
Bảng 3.7: Tỉ lệ % tăng giảm của từng hoạt chất và số lượng trung bình của từng
hoạt chất phổ biến đã sử dụng trong 2 năm (2014 và 2015) --------------------------- 69
Bảng 3.8: Bảng dự trù thuốc năm 2017 (áp dụng cho 10 hoạt chất phổ biến) theo
phương pháp trung bình trượt có trọng số ------------------------------------------------ 69
Bảng 3.9: So sánh MAD, MAPE giữa 2 phương pháp dự báo dự trù số lượng thuốc
năm 2017 (áp dụng cho 10 hoạt chất phổ biến) ----------------------------------------- 70


vii

DANH SÁCH HÌNH

Trang
Hình 2.1: Quy trình thực hiện dự báo ----------------------------------------------------- 11
Hình 2.2: Xu hướng tăng theo thời gian [12] -------------------------------------------- 16
Hình 2.3: Đồ thị chuỗi thời gian và các giá trị dự báo ---------------------------------- 18
Hình 2.4: Quá trình khai phá dữ liệu [7]-------------------------------------------------- 31
Hình 3.1: Giao diện chính của chương trình thực nghiệm ----------------------------- 70
Hình 3.2: Dữ liệu gốc được hiển thị trong form luật kết hợp -------------------------- 71
Hình 3.3: Danh sách tổng số lượng và tổng số lượt của từng thuốc được sắp xếp
theo thứ tự giảm dần của tổng số lượt ---------------------------------------------------- 71
Hình 3.4: Giao diện tạo dữ liệu ------------------------------------------------------------ 72
Hình 3.5: Giao diện chọn thuốc đưa vào danh sách thuốc muốn tìm luật kết hợp -- 72
Hình 3.6: Giao diện dữ liệu đã chuyển đổi ----------------------------------------------- 72
Hình 3.7: Nhập chỉ số Min support và Min metric -------------------------------------- 73
Hình 3.8: Kết quả các luật kết hợp tìm được bằng thuật toán Apriori ---------------- 73
Hình 3.9: Kết quả các luật kết hợp tìm được bằng thuật toán FP-Growth ---------- 73
Hình 3.10: Số lượng từng hoạt chất đã sử dụng qua 4 năm ---------------------------- 74
Hình 3.11: Thống kê biểu đồ thuốc theo số lượng hoặc số lượt ----------------------- 74
Hình 3.12: Giao diện dự trù thuốc --------------------------------------------------------- 75


1

MỞ ĐẦU
Bệnh viện Thống Nhất là cơ sở khám chữa bệnh trực thuộc Bộ Y Tế với
nhiệm vụ chăm sóc sức khoẻ toàn diện cho người bệnh, là đơn vị y tế có trình độ
khoa học kỹ thuật, chuyên môn nghiệp vụ cao.
Mỗi ngày bệnh viện tiếp nhận khám và chữa bệnh ngoại trú cho đối tượng có
thẻ BHYT là gần 2000 bệnh nhân với số lượt gần 2500 và số toa thuốc được phát
khoảng 2000 toa thuốc điều trị ngoại trú mỗi ngày. Với số lượng mặt hàng thuốc
được sử dụng để cấp đơn thuốc ngoại trú là hơn 800 loại thuốc.

Một trong những nhiệm vụ quan trọng để nâng cao chất lượng khám chữa
bệnh của bệnh viện, nâng cao sự hài lòng của người bệnh đối với bệnh viện đó
chính là vấn đề cấp phát thuốc kịp thời, nhanh chóng, đầy đủ và chính xác, đảm bảo
chất lượng của khoa Dược.
Nhiệm vụ đó đòi hỏi tổ chức và hoạt động công tác dược bệnh viện phải
được đổi mới, khoa học, trong đó việc ứng dụng tiến bộ của công nghệ thông tin
vào lĩnh vực tổ chức, quản lý và điều hành, triển khai hoạt động sẽ đem lại những
hiệu quả cao.
Xuất phát từ yêu cầu thực tế trên, tôi lựa chọn đề tài nghiên cứu cho luận văn
là: “Sắp xếp và dự trù thuốc bằ ng luâ ̣t kế t hơ ̣p cho kho Dược ngoại trú bệnh viện
Thống Nhất”.
Ngoài lời nói đầu, kết luận và danh mục tài liệu tham khảo, nội dung chính
của luận văn bao gồm 3 chương:
Chương 1 – Giới thiệu tổng quan và đặt vấn đề.
Chương 2 – Cơ sở lý thuyết.
Chương 3 – Thực nghiệm.


2

Chương 1 - GIỚI THIỆU TỔNG QUAN VÀ ĐẶT VẤN ĐỀ
1.1. Lý do chọn đề tài
Hiện tại, thuốc tại kho Dược ngoại trú – Bệnh viện Thống Nhất được sắp xếp
dựa theo tên thuốc theo thứ tự Alphabet. Với cách sắp xếp như hiện tại, luận văn rút
ra những ưu, nhược điểm sau:
Ưu điểm:
- Dễ tìm thấy thuốc.
Nhược điểm:
- Dễ nhầm lẫn (các thuốc có tên gần giống nhau được xếp gần nhau).
- Thời gian lấy thuốc lâu (trong đơn có nhiều thuốc, mỗi thuốc là 1 chữ cái

đầu tiên khác nhau và khoảng cách giữa các chữ cái này là cách xa nhau theo thứ tự
Alphabet).
Dự trù thuốc cho năm sau dựa trên số lượng thầu của năm trước kèm thêm
tình hình thực phát của năm trước, lấy số liệu đó làm cơ sở và tất cả các thuốc đều
có chung một hệ số dự trù. Công tác lên số lượng thầu thuốc như hiện tại của khoa
Dược bệnh viện cũng đã đáp ứng phần lớn nhu cầu thuốc của bệnh viện. Tuy nhiên,
vẫn còn tình trạng thiếu hụt một số thuốc hay tình trạng tồn thuốc hết hạn dùng phải
hủy bỏ một vài thuốc. Với tình trạng thiếu hụt thì hàng năm khoa Dược phải tổ chức
thầu bổ sung (nếu được) hoặc phải mua thêm thuốc ngoài thầu. Và nó ảnh hưởng
đến quá trình bác sĩ cấp đơn cho bệnh nhân (phải đổi sang dùng thuốc tương đương
thay thế thuốc đã hết, trong thời gian chờ nhập thêm thuốc hết đó). Với tình trạng
tồn thuốc hết hạn dùng thì khoa Dược phải thu hồi và tiến hành các thủ tục để xử lý
hủy bỏ. Cả hai tình trạng này đều làm tăng thêm khối lượng công việc cho nhân
viên khoa Dược và làm phát sinh thêm chi phí của bệnh viện.
Sau khi khảo sát tình hình thực tế về công tác tổ chức, sắp xếp thuốc tại kho
Dươ ̣c ngoại trú, cũng như tìm hiểu về công tác lên số lượng thầu thuốc tại khoa


3

Dược bệnh viện Thống Nhất, luận văn muốn đề xuất một cách sắp xếp thuốc khoa
học hơn nhầm khắc phục được những nhược điểm đã nêu trên. Đồng thời, luận văn
cũng xây dựng hê ̣ thố ng để xử lý số liệu, đưa ra những thống kê, đưa ra các so sánh
cụ thể về số lượng thuốc sử dụng theo thời gian (tháng, quý, năm), làm cơ sở để
khoa Dược có thể nhanh chóng lên được số lượng thuốc cầ n thầ u xác với thực tế
nhu cầu thuốc trong tương lai nhất. Có thể hạn chế tối đa tình trạng thiếu thuốc hay
tình trạng tồn thuốc hết hạn dùng phải hủy bỏ.

1.2. Tổng quan về vấn đề nghiên cứu
Hiện nay, công nghệ thông tin phát triển mạnh mẽ vượt bậc và được ứng

dụng vào tất cả các lĩnh vực của đời sống. Bên cạnh đó các kỹ thuật khai phá dữ
liệu được áp dụng trong nhiều lĩnh vực khác nhau như: marketing, tài chính, ngân
hàng và bảo hiểm, khoa học, y tế, giáo dục, internet… và đạt được những hiệu quả
đáng kể.

1.2.1. Tình hình nghiên cứu ngoài nước
Tại các nước có nền kinh tế phát triển, các chuyên gia của các nước này cũng
đã có những công trình nghiên cứu về áp dụng luật kết hợp trong các đề tài liên
quan tới lĩnh vực Y tế và Dược (Thuốc). Đề tài xin giới thiệu một số công trình
nghiên cứu sau đây:
Đề tài nghiên cứu “Application of the Apriori algorithm for adverse drug
reaction detection” (của các tác giả: Kuo MH, Kushniruk AW,Boyrycki EM, Greig
D. Trường School of Health Information Science, University of Victoria, BC,
Canada, năm 2009). Thuật toán Apriori được sử dụng để thực hiện phân tích kết
hợp về đặc điểm của bệnh nhân, các loại thuốc họ đang dùng, chẩn đoán chính của
họ, các điều kiện đồng bệnh, và các phản ứng phụ (ADRs) hoặc các tác dụng ngoại
ý (AE) mà họ gặp. Phân tích này tạo ra các quy tắc liên kết chỉ ra những kết hợp của
thuốc và đặc điểm bệnh nhân dẫn đến các phản ứng phụ. Một tập dữ liệu đơn giản
được sử dụng để chứng minh tính khả thi và hiệu quả của thuật toán.


4

Đề tài Nghiên cứu “Identifying Association Rules among Drugs in
Prescription of a Single Drugstore Using Apriori Method” (của các tác giả: Ahmad
Yoosofan, Fatemeh Ghovanlooy Ghajar, Sima Ayat, Somayeh Hamidi, Farshad
Mahini. Tạp chí Intelligent Information Management, năm 2015, 7, 253-259).
Trong nghiên cứu này, thuật toán Apriori đã được áp dụng để thực hiện khai thác dữ
liệu bằng cách sử dụng dữ liệu thu được từ các đơn đặt hàng được đặt hàng trong
một hiệu thuốc. Mười quy tắc kết hợp thuốc đã đạt được trong các đơn thuốc sử

dụng thuật toán Apriori đã đề cập ở trên. Kết quả của nghiên cứu này cung cấp
thông tin phản hồi hữu ích về sự liên kết giữa các loại thuốc.
Đề tài Nghiên cứu “Applying the Apriori and FP-Growth Association
Algorithms to Liver Cancer Data” (của tác giả: Fabiola M. R. Pinheiro. Trường
B.Comp.Sc., Concordia University, năm 2007). Nghiên cứu này đã kiểm tra tính
khả thi của dữ liệu kết nối Apriori và FP-Growth. Thuật toán khai thác dữ liệu bệnh
nhân ung thư gan, thu được từ British Columbia - cơ quan lưu trữ dữ liệu ung thư.
Dữ liệu được sử dụng để phát triển các quy tắc liên kết cho biết sự kết hợp của các
yếu tố được quan sát thấy nhiều nhất với tỉ lệ ung thư gan cũng như tăng hoặc giảm
tỷ lệ tử vong. Ý tưởng liên kết sẽ được áp dụng trong các nghiên cứu trong tương lai
sử dụng các dữ liệu về ung thư gan được chiết xuất từ các hệ thống EHR khác. Mục
tiêu chính của việc đưa ra các quy tắc này là nhằm tạo điều kiện cho hướng dẫn phát
hiện sớm ung thư gan và đánh giá các lựa chọn điều trị hiện tại.

1.2.2. Tình hình nghiên cứu trong nước
Trong nước đã có các công trình nghiên cứu sử dụng luật kết hợp trong khai
phá dữ liệu đã được thực hiện ở một số lĩnh vực:
Luận văn: “Áp dụng thuật toán Apriori để hỗ trợ sinh viên chọn môn học”
(luận văn thạc sĩ chuyên ngành Khoa học máy tính, của tác giả: Lê Thị Kiều Ngân,
Học viện Công nghệ Bưu chính viễn thông, năm 2013). Trong luận văn này, tác giả
áp dụng thuật toán Apriori để hỗ trợ sinh viên chọn môn học tại trường Cao đẳng


5

nghề Bách khoa Hà Nội. Công cụ sử dụng trong chương trình là phần mềm mã
nguồn mở Weka.
Luận văn: “Phương pháp luận kết hợp và ứng dụng” (luận văn thạc sĩ chuyên
ngành Khoa học máy tính, của tác giả: Lê Thu Hà, Đại học Thái Nguyên, năm
2009). Tác giả đã cài đặt chương trình tìm luật kết hợp, ứng dụng trong quản lý

trang thiết bị, đồ dùng của trường THPT Chu Văn An – Thái Nguyên.
Bài báo: “Ứng dụng luật kết hợp trong khai phá dữ liệu trợ giúp nhà đầu tư
ra quyết định đầu tư trong thị trường chứng khoán Việt Nam” (Nghiên cứu khoa
học, của ThS. Huỳnh Đức Thuận, Đại học Đông Á, năm 2011). Tác giả bài báo đã
nêu rõ các thuật toán sinh luật kết hợp. Đồng thời, tác giả đã xây dựng và minh họa
một số thuật toán, luật kết hợp để phát hiện tập chỉ mục phổ biến và quy luật trong
giao dịch cổ phiếu.
Tuy nhiên, đến nay theo tìm hiểu thì chưa có đề tài nào áp dụng luật kết hợp
trong sắp xếp thuốc và dự trù thuốc trong bệnh viện tại Việt Nam.

1.3. Mục tiêu, đối tượng và phạm vi nghiên cứu
1.3.1. Mục tiêu
Xây dựng một hê ̣ thố ng sắ p xế p và dự trù thuố c bằ ng luâ ̣t kế t hơ ̣p cho phép:
- Tìm ra được các luật kết hợp giữa các thuốc đã đươ ̣c cấ p phát.
- Sắp xếp thứ tự vị trí các thuốc trong kho phù hợp hơn theo các luâ ̣t kế t hơ ̣p
tìm đươ ̣c.
- Dự trù thuố c theo từng mốc thời gian (tháng, quý, năm…).
- Thống kê thuốc sử dụng theo từng mốc thời gian (tháng, quý, năm…).
Hê ̣ thố ng đươ ̣c áp du ̣ng để :
- Hỗ trợ việc đấ u thầ u thuố c hơ ̣p lý, kip̣ thời, đầ y đủ.
- Sắ p xế p thuố c đáp ứng viê ̣c cấ p phát thuố c thuâ ̣n tiê ̣n.


6

1.3.2. Đối tượng nghiên cứu
- Data mining, luật kết hợp.
- Các phương pháp dự báo.
- Quy trình quản lý thuốc tại Kho Dược ngoại trú – Bệnh viện Thống Nhất.
- Quy trình cấp phát thuốc ngoại trú tại bệnh viện Thống Nhất.


1.3.3. Phạm vi nghiên cứu
- Luật kết hợp và các thuật toán liên quan đến luật kết hợp.
- Các phương pháp dự báo chuỗi thời gian.
- Nguồ n dữ liê ̣u: các đơn thuốc ngoại trú của bệnh nhân (bê ̣nh nhân có bảo
hiể m y tế đúng tuyế n) đã được cấp phát từ kho Dược ngoại trú – Bệnh viện Thống
Nhất trong suốt 4 năm (từ năm 2014 đến năm 2017).
- Áp dụng luật kết hợp trong công tác quản lý thuốc tại kho Dược ngoại trú –
Bệnh viện Thống Nhất.

1.4. Bố cục luận văn
Ngoài lời mở đầu, kết luận và danh mục tài liệu tham khảo, nội dung chính
của luận văn bao gồm 3 chương:
Chương 1 – Giới thiệu tổng quan và đặt vấn đề.
Chương 2 – Cơ sở lý thuyết.
Chương 3 – Thực nghiệm.


7

Chương 2 - CƠ SỞ LÝ THUYẾT
Trong quá trình thực hiện luận văn này, cần phải nghiên cứu tìm hiểu các sơ
sở lý thuyết nền tảng liên quan đến hướng nghiên cứu của luận văn nhằm lựa chọn,
tìm ra các phương pháp phù hợp với bài toán thực tế mà luận văn đang đặt ra.
Những kiến thức quan trọng luận văn cần tìm hiểu rõ về các phương pháp dự báo,
dự báo dữ liệu chuỗi thời gian, khai phá dữ liệu, khai phá luật kết hợp, dự báo dựa
vào luật kết hợp.

2.1. Tổng quan về phương pháp dự báo
Dự báo là sự tiên đoán, nói trước – đó là sự tiên đoán về tương lai bằng các

phương pháp khoa học hoặc bằng chính các kết quả dự đoán. Dự báo là mô hình
khoa học về các sự kiện, hiện tượng tương lai. Việc lập dự báo, xây dựng dự báo
điều đó có nghĩa là thực hiện việc nghiên cứu khoa học về triển vọng phát triển của
đối tượng được dự báo.
Khi tiến hành dự báo cần căn cứ vào việc thu thập, xử lý số liệu trong quá
khứ và hiện tại để xác định xu hướng vận động của các hiện tượng trong tương lai
nhờ vào một số mô hình toán học (định lượng). Tuy nhiên dự báo cũng có thể là
một dự đoán chủ quan hoặc trực giác về tương lai (định tính) và để dự báo định tính
được chính xác hơn, người ta cố loại trừ những tính chủ quan của người dự báo [1],
[10], [11].
Dù định nghĩa có sự khác biệt nào đó, nhưng đều thống nhất về cơ bản là dự
báo bàn về tương lai, nói về tương lai. Dự báo trước hết là một thuộc tính không thể
thiếu của tư duy của con người, con người luôn luôn nghĩ đến ngày mai, hướng về
tương lai. Trong thời đại công nghệ thông tin và toàn cầu hóa, dự báo lại đóng vai
trò quan trọng hơn khi nhu cầu về thông tin thị trường, tình hình phát triển tại thời
điểm nào đó trong tương lai càng cao. Dự báo được sử dụng trong nhiều lĩnh vực
khác nhau, mỗi lĩnh vực có một yêu cầu về dự báo riêng nên phương pháp dự báo
được sử dụng cũng khác nhau.


8

2.1.1. Phân loại phương pháp dự báo
Có nhiều cách phân loại phương pháp dự báo, và mỗi cách phân loại chỉ
mang tính tương đối vì giữa các phương pháp có thể có các phần tương đối trùng
nhau. Tuy vậy, vẫn có thể căn cứ vào đặc trưng riêng biệt của các phương pháp để
đặt tên chung cho từng nhóm phương pháp.
Có thể phân loại dự báo bằng phương pháp theo 2 nhóm chính: Phương pháp
định tính và phương pháp định lượng.
➢ Phương pháp định tính [1], [10], [11]

Các phương pháp dự báo định tính là các phương pháp dự báo bằng cách
phân tích định tính dựa vào suy đoán, cảm nhận. Các phương pháp này phụ thuộc
nhiều vào trực giác, kinh nghiệm và sự nhạy cảm của nhà chuyên gia trong quá
trình dự báo, chỉ mang tính phỏng đoán, không định lượng... Tuy nhiên, chúng có
ưu điểm là đơn giản, dễ thực hiện thời gian nghiên cứu dự báo nhanh, chi phí dự
báo thấp và kết quả dự báo trong nhiều trường hợp cũng rất tốt.
Phương pháp chuyên gia là phương pháp thu thập và xử lý những đánh giá
dự báo bằng cách tập hợp và hỏi ý kiến các chuyên gia giỏi thuộc một lĩnh vực hẹp
của khoa học - kỹ thuật hoặc sản xuất.
Phương pháp chuyên gia dựa trên cơ sở đánh giá tổng kết kinh nghiệm, khả
năng phản ánh tương lai một cách tự nhiên của các chuyên gia giỏi và xử lý thống
kê các câu trả lời một cách khoa học. Nhiệm vụ của phương pháp là đưa ra những
dự báo khách quan về tương lai phát triển của khoa học kỹ thuật hoặc sản xuất dựa
trên việc xử lý có hệ thống các đánh giá dự báo của các chuyên gia.
Phương pháp chuyên gia được áp dụng đặc biệt có hiệu quả trong các trường
hợp sau đây:
- Khi đối tượng dự báo có tầm bao quát lớn phụ thuộc nhiều yếu tố mà hiện
tại còn chưa có hoặc thiếu những cơ sở lý luận chắc chắn để xác định.


9

- Trong điều kiện còn thiếu thông tin và những thống kê đầy đủ, đáng tin cậy
về đặc tính của đối tượng dự báo.
- Trong điều kiện có độ bất định lớn của đối tượng dự báo, độ tin cậy thấp về
hình thức thể hiện, về chiều hướng biến thiên về phạm vi cũng như quy mô và cơ
cấu.
- Khi dự báo trung hạn và dài hạn đối tượng dự báo chịu ảnh hưởng của
nhiều nhân tố, phần lớn là các nhân tố rất khó lượng hoá đặc biệt là các nhân tố
thuộc về tâm lý xã hội (thị hiếu, thói quen, lối sống, đặc điểm dân cư...) hoặc tiến bộ

khoa học kỹ thuật. Vì vậy trong quá trình phát triển của mình đối tượng dự báo có
nhiều đột biến về quy mô và cơ cấu mà nếu không nhờ đến tài nghệ của chuyên gia
thì mọi sự dự báo trở nên vô nghĩa.
- Trong điều kiện thiếu thời gian, hoàn cảnh cấp bách phương pháp chuyên
gia cũng được áp dụng để đưa ra các dự báo kịp thời.
Quá trình áp dụng phương pháp chuyên gia có thể chia làm ba giai đoạn lớn:
- Lựa chọn chuyên gia.
- Trưng cầu ý kiến chuyên gia.
- Thu thập và xử lý các đánh giá dự báo.
Chuyên gia giỏi là người thấy rõ nhất những mâu thuẫn và những vấn đề tồn
tại trong lĩnh vực hoạt động của mình, đồng thời về mặt tâm lý họ luôn luôn hướng
về tương lai để giải quyết những vấn đề đó dựa trên những hiểu biết sâu sắc, kinh
nghiệm sản xuất phong phú và linh cảm nghề nghiệp nhạy bén.
Ưu và nhược điểm của phương pháp chuyên gia:
- Ưu điểm: Phương pháp chuyên gia đặc biệt thích hợp trong việc dự báo
những vấn đề mang tính định tính và số liệu chưa được đầy đủ, đặc biệt khi kinh tế xã hội có nhiều biến động, không tuân theo các quy luật trong quá khứ.


10

- Hạn chế: Phương pháp chuyên gia phụ thuộc vào khả năng tìm kiếm, lựa
chọn được nhiều chuyên gia giỏi trong lĩnh vực dự báo, đặc biệt dự báo thị trường
lao động; khó khăn thu thập và xử lý ý kiến của chuyên gia đặc biệt khi các ý kiến
tản mạn trái ngược nhau hay chưa lượng hóa được mức tác động tới các chỉ tiêu cần
quan sát.
➢ Phương pháp định lượng [1], [10], [11]
Các phương pháp dự báo định lượng dựa vào các số liệu thống kê và thông
qua các công thức toán học được thiết lập để dự báo nhu cầu cho tương lai. Khi dự
báo nhu cầu tương lai, nếu không xét đến các nhân tố ảnh hưởng khác có thể dùng
các phương pháp dự báo theo dãy số thời gian. Nếu cần ảnh hưởng của các nhân tố

khác đến nhu cầu có thể dùng các mô hình hồi quy tương quan...
- Dự báo theo dãy số thời gian
Dữ liệu luôn biến động theo thời gian và trong nhiều điều kiện nhất định nó
thường biến động theo một xu hướng nào đó. Để phát hiện xu hướng phát triển của
dữ liệu ta cần thu thập các số liệu trong quá khứ để có được một dãy số thời gian.
Khi đã có dãy số thời gian ta có thể xác định được xu hướng phát triển của dữ liệu.
Từ đó ta có thể dự báo cho các thời kỳ trong tương lai.
- Dự báo theo mô hình hồi quy tương quan
Các phương pháp dự báo dữ liệu theo đường khuynh hướng cũng dựa vào
dãy số thời gian. Dãy số này cho ta xác định đường khuynh hướng lý thuyết trên cơ
sở kỹ thuật bình phương bé nhất, tức là tổng khoảng cách từ các điểm thể hiện dữ
liệu thực tế trong quá khứ đến đường khuynh hướng lấy theo trục tung là nhỏ nhất.
Sau đó dựa vào đường khuynh hướng lý thuyết ta tiến hành dự báo cho tương lai.

2.1.2. Quy trình thực hiện dự báo
Quy trình dự báo được chia thành 9 bước như Hình 2.1. Các bước này bắt
đầu và kết thúc với sự trao đổi (communication), hợp tác (cooperation) và cộng tác


11

(collaboration) giữa những người sử dụng và những người làm dự báo [1], [10],
[11].

Hình 2.1: Quy trình thực hiện dự báo

➢ Bước 1: Xác định mục tiêu
Các mục tiêu liên quan đến các quyết định cần đến dự báo phải được nói rõ.
Nếu quyết định vẫn không thay đổi bất kể có dự báo hay không thì mọi nỗ lực thực
hiện dự báo cũng vô ích.

Nếu người sử dụng và người làm dự báo có cơ hội thảo luận các mục tiêu và
kết quả dự báo sẽ được sử dụng như thế nào, thì kết quả dự báo sẽ có ý nghĩa quan
trọng.
➢ Bước 2: Xác định dự báo cái gì
Khi các mục tiêu tổng quát đã rõ ta phải xác định chính xác là dự báo cái gì
(cần có sự trao đổi).


12

Ví dụ: Chỉ nói dự báo nhu cầu tuyển dụng không thì chưa đủ, mà cần phải
hỏi rõ hơn là: Dự báo nhu cầu tuyển dụng cho những ngành nghề nào. Dự báo theo
năm, quý, tháng hay tuần.
➢ Bước 3: Xác định khía cạnh thời gian
Có 2 loại khía cạnh thời gian cần xem xét:
- Thứ nhất: Độ dài dự báo, cần lưu ý:
+ Đối với dự báo theo năm: từ 1 đến 5 năm.
+ Đối với dự báo quý: từ 1 hoặc 2 năm.
+ Đối với dự báo tháng: từ 12 đến 18 tháng.
- Thứ hai: Người sử dụng và người làm dự báo phải thống nhất tính cấp thiết
của dự báo.
➢ Bước 4: Xem xét dữ liệu
Dữ liệu cần để dự báo có thể từ 2 nguồn: bên trong và bên ngoài.
Cần phải lưu ý dạng dữ liệu sẵn có (thời gian, đơn vị tính,…).
Dữ liệu thường được tổng hợp theo cả biến và thời gian, nhưng tốt nhất là
thu thập dữ liệu chưa được tổng hợp.
Cần trao đổi giữa người sử dụng và người làm dự báo.
➢ Bước 5: Lựa chọn mô hình
Làm sao để quyết định được phương pháp thích hợp nhất cho một tình huống
nhất định?

- Loại và lượng dữ liệu sẵn có.
- Mô hình (bản chất) dữ liệu quá khứ.
- Tính cấp thiết của dự báo.


13

- Độ dài dự báo.
- Kiến thức chuyên môn của người làm dự báo.
➢ Bước 6: Đánh giá mô hình
Đối với các phương pháp định tính thì bước này ít phù hợp hơn so với
phương pháp định lượng.
Đối với các phương pháp định lượng, cần phải đánh giá mức độ phù hợp của
mô hình (trong phạm vi mẫu dữ liệu).
Đánh giá mức độ chính xác của dự báo (ngoài phạm vi mẫu dữ liệu).
Nếu mô hình không phù hợp, quay lại bước 5.
➢ Bước 7: Chuẩn bị dự báo
Nếu có thể nên sử dụng hơn một phương pháp dự báo, và nên là những loại
phương pháp khác nhau.
Các phương pháp được chọn nên được sử dụng để chuẩn bị cho một số các
dự báo (ví vụ trường hợp xấu nhất, tốt nhất và có thể nhất).
➢ Bước 8: Trình bày kết quả dự báo
Kết quả dự báo phải được trình bày rõ ràng cho ban quản lý sao cho họ hiểu
các con số được tính toán như thế nào và chỉ ra sự tin cậy trong kết quả dự báo.
Người dự báo phải có khả năng trao đổi các kết quả dự báo theo ngôn ngữ
mà các nhà quản lý hiểu được.
Trình bày cả ở dạng viết và dạng nói.
Bảng biểu phải ngắn gọn, rõ ràng.
Chỉ cần trình bày các quan sát và dự báo gần đây thôi.



14

Chuỗi dữ liệu dài có thể được trình bày dưới dạng đồ thị (cả giá trị thực và
dự báo).
Trình bày thuyết trình nên theo cùng hình thức và cùng mức độ với phần
trình bày viết.
➢ Bước 9: Theo dõi kết quả dự báo
Lệch giữa giá trị dự báo và giá trị thực phải được thảo luận một cách tích
cực, khách quan và cởi mở.
Mục tiêu của việc thảo luận là để hiểu tại sao có các sai số, để xác định độ
lớn của sai số.
Trao đổi và hợp tác giữa người sử dụng và người làm dự báo có vai trò rất
quan trọng trong việc xây dựng và duy trì quy trình dự báo thành công.

2.2. Dự báo dữ liệu chuỗi thời gian
2.2.1. Định nghĩa dữ liệu chuỗi thời gian
➢ Định nghĩa
Dữ liệu chuỗi thời gian là một tập hợp dữ liệu quan sát đo được một cách
tuần tự theo thời gian, đó là dãy số các trị số của chỉ tiêu thống kê được sắp xếp
theo thứ tự thời gian. Các quan sát này có thể đo được một cách liên tục theo thời
gian hoặc là có thể được lấy theo tập rời rạc các thời điểm khác nhau [12].
Giá trị của chuỗi tuần tự theo thời gian của đại lượng
với

là giá trị quan sát của

được ký hiệu

ở thời điểm và


được gọi

là chiều dài của chuỗi quan sát. Sự chuyển tiếp từ thời gian này sang thời gian khác
được gọi là bước.
Các giá trị quan sát có thể được ghi nhận ở những khoảng thời gian không
bằng nhau. Tuy nhiên ta chỉ quan tâm tới chuỗi thời gian là chuỗi mà các giá trị là
rời rạc và được ghi nhận ở những khoảng thời gian cố định bằng nhau và trong hầu


15

hết các ứng dụng thực tế, dữ liệu được đo cách nhau trong một khoảng thời gian cố
định để đơn giản hóa quá trình lưu trữ cũng như độ phức tạp của dữ liệu.
Ví dụ: Bảng số liệu báo cáo của bệnh viện Thống Nhất về tình hình sử dụng
kháng sinh Augmentin BD trong điều trị ngoại trú tại bệnh viện Thống Nhất trong 2
năm 2016 – 2017.
Bảng 2.1: Bảng số liệu về tình hình sử dụng kháng sinh Augmentin BD trong điều trị
ngoại trú trong 2 năm 2016 – 2017

Tháng 1

2

3

4

5


6

7

8

2016

316

49

510

921

630

776

705

2017

463

294

637


443

218

255

326

9

11

12

679 1026 497

567

469

397

313

397

408

10


272

Ví dụ trong Bảng 2.1 là dữ liệu về dãy số thời gian về số lượng sử dụng
thuốc kháng sinh Augmentin BD trong điều trị ngoại trú tại bệnh viện Thống Nhất.
Qua dãy số thời gian có thể nghiên cứu tìm hiều các đặc điểm về sự biến động của
hiện tượng, vạch rõ xu hướng và tính quy luật, đồng thời để dự đoán các mức độ
của hiện tượng trong tương lai.
➢ Phân loại dữ liệu chuỗi thời gian
Căn cứ vào tính chất thời gian của dữ liệu chuỗi thời gian, có thể phân biệt
thành 2 loại như sau:
- Dãy số thời kỳ: là dãy số biểu hiện mặt lượng của hiện tượng qua từng thời
kỳ nhất định.
- Dãy số thời điểm: là dãy số biểu hiện mặt lượng của hiện tượng qua các
thời điểm nhất định.

2.2.2. Các thành phần của chuỗi thời gian
Dữ liệu chuỗi thời gian bao gồm 4 thành phần [1], [10], [11]: Thành phần xu
hướng dài hạn (long – tern trend component), Thành phần mùa (seasional


16

component), Thành phần chu kỳ (cyclical component), Thành phần bất thường
(irregular component).
➢ Thành phần xu hướng dài hạn
Thành phần này dùng để chỉ xu hướng tăng hay giảm của đại lượng X trong
thời gian dài. Về mặt đồ thị thì thành phần này có thể biểu diễn theo đường thẳng
hay là đường cong.

Hình 2.2: Xu hướng tăng theo thời gian [12]


➢ Thành phần mùa
Thành phần này dùng để chỉ xu hướng tăng hay giảm của đại lượng X tính
theo mùa trong năm (có thể tính theo tháng, quý trong năm).
Ví dụ: Theo Viện vệ sinh dịch tễ trung ương, vào mùa mưa, dịch sốt xuất
huyết có xu hướng gia tăng mạnh vào các tháng 5, 6, 7, 8, 9, 10,11. Dẫn đến nhu
cầu sử dụng các thuốc liên quan đến quá trình theo dõi và điều trị bệnh sốt xuất
huyết tăng cao so với các tháng còn lại trong năm.
➢ Thành phần chu kỳ
Thành phần chu kỳ chỉ sự thay đổi của đại lương X theo chu kỳ. Thành phần
này khác thành phần mùa là chu kỳ của đại lượng X có thể kéo dài hơn 1 năm.


×