Tải bản đầy đủ (.pdf) (15 trang)

Tư vấn trong thương mại điện tử dựa trên phân tích mẫu phổ biến từ dữ liệu nhật ký truy cập của khách hàng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (447.13 KB, 15 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

TRƯƠNG THỊ MINH NGỌC

TƯ VẤN TRONG THƯƠNG MẠI ĐIỆN TỬ DỰA TRÊN PHÂN
TÍCH MẪU PHỔ BIẾN TỪ DỮ LIỆU NHẬT KÝ TRUY CẬP
CỦA KHÁCH HÀNG

LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN

Hà Nội – 2015


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

TRƯƠNG THỊ MINH NGỌC

TƯ VẤN TRONG THƯƠNG MẠI ĐIỆN TỬ DỰA TRÊN PHÂN
TÍCH MẪU PHỔ BIẾN TỪ DỮ LIỆU NHẬT KÝ TRUY CẬP
CỦA KHÁCH HÀNG

Ngành: Công nghệ thông tin
Chuyên ngành: Hệ thống thông tin
Mã số: 60 48 01 04
LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. PHAN XUÂN HIẾU

Hà Nội – 2015




LỜI CẢM ƠN
Để đi cả quãng đường này, lời đầu tiên tôi xin được gửi lời biết ơn chân thành
và sâu sắc tới thầy Ts. Phan Xuân Hiếu, một người thầy, người anh cả vô cùng nhiệt
thành đã dẫn dắt, truyền nhiệt huyết cho tôi trong toàn bộ quá trình, giúp tôi vững
vàng và trưởng thành trong con đường nghiên cứu và học tập.
Thời gian qua là một khoảng kỷ niệm cực kỳ sâu sắc với tôi, khi được học tập
tham gia nghiên cứu tại trường, phòng thí nghiệm công nghệ tri thức (KT Lab) và Trung
tâm Công nghệ tích hợp liên ngành Giám sát hiện trường (FIMO). Xin được gửi lời cảm
ơn tới tất cả các thầy cô và các bạn học đã luôn sẵn sàng hỗ trợ và giúp đỡ tôi.
Tôi xin bày tỏ lòng biết ơn chân thành tới Thầy, Cô giáo các anh chị và các bạn
trong bộ môn Hệ thống thông tin, Khoa Công nghệ thông tin, những người đã nhiệt
tình giúp tôi mở rộng kiến thức về Công nghệ thông tin nói chung và Hệ thống thông
tin nói riêng, đó là những kiến thức quý báu và sẽ rất có ích với tôi trong giai đoạn
hiện tại và tương lai.
Tôi xin gửi lời cảm ơn chân thành tới Ban Giám hiệu Nhà trường, Phòng Đào
tạo sau đại học, Đại học Công nghệ - Đại học Quốc gia Hà Nội đã tạo điều kiện tốt
nhất giúp tôi trong suốt quá trình học tập.
Qua tất cả tôi gửi đến gia đình thân yêu mọi tình cảm của mình, cảm ơn bố mẹ
đã luôn luôn tin tưởng, luôn luôn là chỗ dựa vững chắc, cảm ơn các anh chị em đã
dành mọi điều kiện để giúp tôi tập trung vào nghiên cứu.
Hà Nội, ngày 30 tháng 10 năm 2015
Học viên

Trƣơng Thị Minh Ngọc

1



LỜI CAM ĐOAN
Tôi xin cam đoan nội dung trình bày trong luận văn này là do tôi tự nghiên cứu
tìm hiểu dựa trên các tài liệu và tôi trình bày theo ý hiểu của bản thân dƣới sự hƣớng
dẫn trực tiếp của Thầy TS. Phan Xuân Hiếu. Các nội dung nghiên cứu, tìm hiểu và kết
quả thực nghiệm là hoàn toàn trung thực.
Luận văn này của tôi chƣa từng đƣợc ai công bố trong bất cứ công trình nào.
Trong quá trình thực hiện luận văn này tôi đã tham khảo đến các tài liệu của
một số tác giả, tôi đã ghi rõ tên tài liệu, nguồn gốc tài liệu, tên tác giả và tôi đã liệt kê
trong mục “DANH MỤC TÀI LIỆU THAM KHẢO” ở cuối luận văn.
Học viên

Trƣơng Thị Minh Ngọc

2


MỤC LỤC
CHƢƠNG 1. KHÁI QUÁT BÀI TOÁN TƢ VẤN SẢN PHẨM THƢƠNG MẠI
Error! Bookmark not defined.
1.1. Tổng quan bài toán tƣ vấn trong thƣơng mại điện tửError! Bookmark not
defined.
1.2. Các hƣớng tiếp cận và các mô hình trong hệ gợi ýError!
Bookmark
not
defined.
1.3. Thách thức của hệ gợi ý ...................................... Error! Bookmark not defined.
1.4. Đánh giá và ứng dụng hệ gợi ý ........................... Error! Bookmark not defined.
1.4.1. Đánh giá một hệ gợi ý .................................. Error! Bookmark not defined.
1.4.2. Thiết kế ứng dụng cho một hệ thống gợi ý thựcError! Bookmark not
defined.

CHƢƠNG 2. LÝ THUYẾT KHAI PHÁ MẪU PHỔ BIẾN VÀ LUẬT KẾT HỢP
Error! Bookmark not defined.
2.1. Những định nghĩa chung trong bài toán tìm mẫu phổ biến và luật kết hợp Error!
Bookmark not defined.
2.2. Những hƣớng tiếp cận trong khai phá mẫu phổ biến, luật kết hợp ............ Error!
Bookmark not defined.
2.2.1. Những hƣớng tiếp cận luật kết hợp .............. Error! Bookmark not defined.
2.2.2. Những thuật toán cơ bản .............................. Error! Bookmark not defined.
2.3. Luật kết hợp trong hệ gợi ý ................................ Error! Bookmark not defined.
2.4. Thuật toán tìm kiếm tập phổ biến và luật kết hợpError!
Bookmark
not
defined.
2.4.1. Thuật toán FP-Growth ................................. Error! Bookmark not defined.
2.4.2. Thuật toán FPClose ...................................... Error! Bookmark not defined.
2.4.3. Thuật toán FIN ............................................. Error! Bookmark not defined.
CHƢƠNG 3. ỨNG DỤNG MẪU PHỔ BIẾN VÀ LUẬT KẾT HỢP ĐỂ GỢI Ý SẢN
PHẨM TRONG THƢƠNG MẠI ĐIỆN TỬ Ở VIỆT NAMError! Bookmark not
defined.
3.1. Bài toán gợi ý sản phẩm bằng tìm kiếm mẫu phổ biến và luật kết hợp ..... Error!
Bookmark not defined.
3.2. Gợi ý sản phẩm dựa trên mẫu phổ biến .............. Error! Bookmark not defined.
3.3. Gợi ý sản phẩm dựa trên luật kết hợp ................. Error! Bookmark not defined.
3.4. Mô tả dữ liệu ....................................................... Error! Bookmark not defined.
3.5. Mô tả hệ thống gợi ý cho ngƣời dùng ................ Error! Bookmark not defined.
CHƢƠNG 4. THỰC NGHIỆM, PHÂN TÍCH VÀ ĐÁNH GIÁError!
Bookmark
not defined.
4.1. Kết quả chạy các thuật toán tìm kiếm tập phổ biến.Error!
Bookmark

not
defined.
3


4.2. Kết quả của gợi ý sản phẩm cho từng ngƣời dùngError!
Bookmark
not
defined.
CHƢƠNG 5. KẾT LUẬN ........................................... Error! Bookmark not defined.
5.1. Những vấn đề đƣợc giải quyết trong luận văn này.Error!
Bookmark
not
defined.
5.2. Hƣớng đi hay hƣớng áp dụng cho đề tài luận văn.Error!
Bookmark
not
defined.
CÁC CÔNG TRÌNH KHOA HỌC VÀ SẢN PHẨM ĐÃ CÔNG BỐ ............. Error!
Bookmark not defined.
TÀI LIỆU THAM KHẢO ...............................................................................................9

4


DANH MỤC HÌNH VẼ
Hình 3.1 Gợi ý tại Amazon ........................................... Error! Bookmark not defined.
Hình 3.2 Phân bố dữ liệu sản phẩm thu thập đƣợc........ Error! Bookmark not defined.
Hình 3.3 Ví dụ về thông tin sản phẩm item ................... Error! Bookmark not defined.
Hình 3.4 Ví dụ về các transaction – các lƣợt truy cập từng ngƣời dùng ............. Error!

Bookmark not defined.
Hình 3.5 Quy trình giải quyết bài toán .......................... Error! Bookmark not defined.
Hình 3.6 Mô hình bƣớc tiền xử lý ................................. Error! Bookmark not defined.
Hình 3.7 Mô hình bƣớc tìm mẫu phổ biến và luật kết hợpError!
Bookmark
not
defined.
Hình 3.8 Định dạng những tập phổ biến tìm đƣợc ........ Error! Bookmark not defined.
Hình 3.9 Định dạng luật kết hợp tìm đƣợc .................... Error! Bookmark not defined.
Hình 3.10 Định dạng đầu ra các tập phổ biến đƣợc đánh chỉ mụcError!
Bookmark
not defined.
Hình 3.11 Định dạng đầu ra phần Y của luật đƣợc đánh chỉ mụcError! Bookmark not
defined.
Hình 3.12 Mô hình bƣớc gợi ý cho ngƣời dùng ............ Error! Bookmark not defined.
Hình 4.1 So sánh thời gian chạy các thuật toán ............ Error! Bookmark not defined.
Hình 4.2 Thống kê thời gian trung bình chạy các thuật toánError! Bookmark not
defined.
Hình 4.3 So sánh bộ nhớ tối đa sử dụng ........................ Error! Bookmark not defined.
Hình 4.4 Thống kê bộ nhớ tối đa sử dụng của các thuật toánError! Bookmark not
defined.
Hình 4.5 Thống kê số tập phổ biến tìm đƣợc ................ Error! Bookmark not defined.
Hình 4.6 Giao diện gợi ý cho ngƣời dùng ..................... Error! Bookmark not defined.
Hình 4.7 Gợi ý cho ngƣời dùng theo một sản phẩm mẹ và béError! Bookmark not
defined.
Hình 4.8 Gợi ý cho mặt hàng phụ kiện công nghệ ........ Error! Bookmark not defined.
Hình 4.9 Gợi ý cho mặt hàng đồ gia dụng..................... Error! Bookmark not defined.
Hình 4.10 Gợi ý cho mặt hàng đồng hồ ........................ Error! Bookmark not defined.

5



DANH MỤC TỪ VIẾT TẮT
Từ viết tắt
CSDL (DB)
RS
AR
FP

Giải nghĩa
Cơ sở dữ liệu (database)
Recommender system
Association rule
Frequent pattern

DANH MỤC TỪ KHÓA
Từ khóa
Recommender system
Association rule
Frequent pattern

Ngữ nghĩa
Hệ gợi ý
Luật kết hợp
Mẫu phổ biến

6


MỞ ĐẦU

Những tác giả đầu ngành mở đầu cho bài toán tìm mẫu phổ biến [1] từ năm
1993 là Jiawei Han và Charu C. Aggarwal đã tổng hợp những vấn đề về các hƣớng
tiếp cận, phƣơng pháp các thuật toán, dành cho nhiều loại dữ liệu của rất nhiều công
trình nghiên cứu tại “Frequent pattern mining” [2] xuất bản năm 2014. Cho thấy sức
hấp dẫn của đề tài này xong suốt hơn 20 năm qua.
Ứng dụng cho bài toán maketing tìm kiếm mẫu phổ biến trên tập dữ liệu mua
hàng của khách, tìm ra những sản phẩm hay đƣợc mua cùng nhau nhất, hay gợi ý nếu
xem sản phẩm này sẽ xem sản phẩm nào tiếp theo. Thử đặt ra giả thiết nếu nhƣ khi
một ngƣời xem đang nhấp chuột tìm kiếm hoặc xem một sản phẩm về thời trang nhƣ
„đầm xòe nơ‟ mà họ đang quan tâm trên một website, thì website đó sẽ gợi ý „đầm kim
sa nhũ‟ hoặc/và „đầm dự tiệc sang trọng‟ hoặc/và „giầy cao gót dây thanh lịch‟
hoặc/và „ví xách trang nhã‟ với giải thích là những sản phẩm này thƣờng đƣợc nhiều
ngƣời dùng khác xem với nhau rất nhiều lần, có thể nhận thấy ngữ cảnh xem hàng này
ngƣời dùng đang muốn tìm kiếm trang phục dự tiệc, những gợi ý về sản phẩm đồng bộ
theo loại sản phẩm này rất phù hợp, và gợi ra đƣợc nhiều liên quan giữa các sản phẩm
này không chỉ tính đến chúng thuộc cùng chủng loại, cùng nội dung.
Đặc biệt khi gợi ý trong thƣơng mại điện tử tại Việt Nam, lý do để chọn hƣớng
tiếp cận tìm tập phổ biến là vì phụ thuộc vào tập dữ liệu thu thập đƣợc từ khách hàng.
Dữ liệu mà luận văn thu thập đƣợc từ một website thƣơng mại tại Việt Nam, với số
lƣợng các mặt hàng lên tới hơn 238.000 sản phẩm chủ yếu về các mặt hàng thời trang,
gia dụng, thực phẩm, phụ kiện công nghệ …
Hƣớng tiếp cận cũ nhƣ hƣớng lọc nội dung (content-based) dù cũng có kết quả
tốt nhƣng không đủ tinh tế để hiểu ngƣời dùng, thƣờng gợi ý ra đƣợc rất nhiều sản
phẩm nếu số lƣợng sản phẩm liên quan với nhau lớn, mà theo tâm lý ngƣời dùng việc
gợi ý ra nhiều sẽ không gây đƣợc kết quả tốt [3], xem xét những gợi ý phù hợp và thú
vị cho ngƣời dùng mới là vấn đề cần nghiên cứu. Những công trình đƣợc nghiên cứu
cho thế hệ gợi ý mới đã có nhiều bƣớc tiến vƣợt trội, nhiều phƣơng pháp mang lại hiệu
quả cao và đang là xu hƣớng hiện nay nhƣ là hƣớng lọc cộng tác (collaborative
filtering) dựa vào cộng đồng ngƣời dùng sử dụng dữ liệu đánh giá (rating) của họ về
sản phẩm. Nhƣng quay trở về áp dụng cho ngƣời dùng tại Việt Nam với sản phẩm

thƣơng mại thì rất khó khăn trong việc thu thập dữ liệu, lý do là ngƣời dùng tại Việt
Nam thƣờng rất ít có thói quen đánh giá (rating) hay bình luận (comment) về sản
phẩm, đây là kết quả thực tế khi thu thập dữ liệu đƣợc từ website thƣơng mại mà luận
văn làm thực nghiệm. Hơn nữa hành vi chủ yếu của ngƣời dùng là tìm kiếm thông tin
của sản phẩm, hành vi mua trực tuyến là khá ít dẫn đến khó khăn khi thu thập và khai
phá trên dữ liệu của kiểu hành vi này, theo khảo sát của Google vào năm 2015 [4]
trong số 73% ngƣời dùng xem hàng chỉ có 17% quyết định mua hàng trực tuyến còn
7


lại là thực hiện mua bán ngoại tuyến. Ngoài ra theo trang alexa.com1 trang chuyên
thống kê các website khắp thế giới về các mức độ ngƣời truy cập, số lƣợng tìm kiếm,
đánh giá... năm 2015 đã thống kê những website thƣơng mại điện tử đứng đầu ở Việt
Nam nhƣ vatgia.com, 5giay.vn, lazada.vn, chotot.vn…có rất ít đánh giá rating cho
những sản phẩm đƣợc mua và dùng bởi ngƣời dùng. Với hƣớng tìm kiếm tập phổ biến
để gợi ý, luận văn có tham khảo một trong những trang web về thƣơng mại điện tử
thành công nhất trên thế giới là Amazon2 (theo alexa3), dựa trên tìm những luật kết
hợp và xếp chúng theo độ tin cậy, tìm những biến thể khác nhƣ đo độ không thích
hoặc quan hệ của ngƣời dùng. Điều này tùy thuộc vào các dữ liệu lấy đƣợc, có thể hay
không thu đƣợc mức độ xem hoặc quan tâm từ những rating, hành vi hoặc những phản
hồi ẩn của khách hàng, những dữ liệu này đều thu thập đƣợc tại website làm thực
nghiệm.
Với hƣớng đi ứng dụng tập phổ biến và luật kết hợp vào trong bài toán gợi ý
sản phẩm thƣơng mại, luận văn đã tìm hiểu và nghiên cứu những vấn đề liên quan đến
khâu xây dựng và ứng dụng nhƣ là xác định đối tƣợng gợi ý, đối tƣợng dữ liệu có thể
thu thập đƣợc từ nhật ký phiên truy cập ngƣời dùng trong một trang thƣơng mại điện
tử ở Việt Nam; khảo sát các phƣơng pháp để khai phá mẫu phổ biến và luật kết hợp,
tìm hiểu vấn đề độ đo, chọn ngƣỡng, những khó khăn thách thức khi triển khai; đến
vấn đề đánh giá dữ liệu, chất lƣợng tập phổ biến và luật kết hợp, và hiển thị ra gợi ý,…
Luận văn cũng tập trung giải quyết các khâu trong thực nghiệm, nhận định vấn đề và

những khó khăn gặp phải nhƣ vấn đề bộ nhớ sử dụng, thời gian chạy, phân hoạch bộ
dữ liệu gốc, đánh chỉ mục ngƣợc cho tập phổ biến và tập luật tìm đƣợc, đƣa ra gợi ý
cho từng cá nhân ngƣời dùng, đƣa ra giải thích cho các gợi ý đó. Sau đó là tìm ra các
phƣơng hƣớng giải quyết, rút ra những bài học kinh nghiệm có đƣợc.
Hy vọng từ việc khai thác những dữ liệu thực tế và áp dụng các phƣơng pháp
kỹ thuật đƣợc công bố bởi những nhà nghiên cứu uy tín trên toàn thế giới sẽ đƣa lại kết
quả có ý nghĩa, có thể đóng góp một phần nào đó để triển khai ứng dụng thƣơng mại
điện tử Việt Nam nói riêng và ứng dụng công nghệ thông tin vào đời sống nói chung.
Luận văn sẽ chia nội dung ra làm năm chƣơng chính:
Chƣơng 1: Khái quát bài toán tƣ vấn sản phẩm thƣơng mại. Ở chƣơng đầu tiên
mở đầu này sẽ nêu tổng quan về bài toán gợi ý, những hƣớng tiếp cận, phƣơng pháp
giải quyết, thách thức và cả những đánh giá ứng dụng, đặc biệt là cho thƣơng mại điện
tử.
Chƣơng 2: Lý thuyết mẫu phổ biến và luật kết hợp. Có nội dung chính là nêu
những định nghĩa chung của bài toán tìm kiếm tập phổ biến, những hƣớng tiếp cận,

1

/>www.amazon.com
3
/>2

8


những ứng dụng phƣơng pháp khai phá tập phổ biến và luật kết hợp vào bài toán gợi ý
thƣơng mại. Trong đó còn nêu chi tiết 3 thuật toán sẽ đƣợc áp dụng trong luận văn.
Chƣơng 3: Ứng dụng khai phá mẫu phổ biến để gợi ý những sản phẩm đƣợc
xem cùng nhau trong thƣơng mại điện tử ở Việt Nam. Chƣơng này là chƣơng chính
của luận văn phát biểu bài toán cụ thể mà luận văn cần giải quyết, sau đó là đƣa ra mô

hình giải quyết bài toán.
Chƣơng 4: Thực nghiệm đánh giá. Đây là phần nêu lên kết quả đạt đƣợc trong
suốt quá trình thực hiện, ngoài ra còn đề cập đến những khó khăn vấn đề vƣớng mắc
phát sinh. Sau đó là đánh giá những kết quả đạt đƣợc chi tiết ở từng bƣớc thực hiện.
Chƣơng 5: Kết luận. Tổng kết lại những nội dung chính của luận văn, đƣa ra
hƣớng đi và hƣớng áp dụng thực tế.

9


TÀI LIỆU THAM KHẢO
[1]

[2]
[3]
[4]
[5]
[6]
[7]

[8]

[9]
[10]
[11]

[12]
[13]
[14]
[15]


[16]

[17]

R. Agrawal, T. Imieliński, and A. Swami, “Mining association rules between
sets of items in large databases,” ACM SIGMOD Record, vol. 22, no. 2. pp. 207–
216, 1993.
J. H. Charu C. Aggarwal, “Frequently partern mining.” Springer, New York, 2014.
M. G. D Bollen, BP Knijnenburg, MC Willemsen, “Understanding choice
overload in recommender systems.” RecSys ‟10, pp. 63–70, 2010.
“The consumer barometer survey 2015.” Google, 2015.
J. Leskovec, R. Anand, and J. Ullman, “Recommendation Systems,” Mining of
Massive Datasets. pp. 305–339, 2011.
F. Ricci, L. Rokach, B. Shapira, and P. B. Kantor, “Recommender Systems
Handbook.” Springer, New York, pp. 27–46, 2011.
J. L. Herlocker, J. a. Konstan, L. G. Terveen, and J. T. Riedl, “Evaluating
collaborative filtering recommender systems,” ACM Transactions on
Information Systems (TOIS), vol. 22, no. 1. pp. 5–53, 2004.
J. J. Sandvig, B. Mobasher, and R. Burke, “Robustness of collaborative
recommendation based on association rule mining,” RecSys ’07 Proc. 2007
ACM Conf. Recomm. Syst., no. October 2015, pp. 105–112, 2007.
B. Joseph, P. Ii, D. Peppers, M. Rogers, and N. M. Tichy, “Do you want to keep
your customers forever,” HarvardBusinessReview, no. June, 2012.
“Báo cáo thƣơng mại điện tử Việt Nam 2014,” Cục Thương mại điện tử và Công
nghệ thông tin - Bộ Công Thương, p. 53, 2014.
N. Tintarev and J. Masthoff., “Effective explanations of recommendations: usercentered design.” Proceedings of the 2007 ACM conference on Recommender
systems, pp. 153–156, 2007.
P. Pu and L. Chen, “Trust Building with Explanation Interfaces,” Proc. 11th Int.
Conf. Intell. user interfaces - IUI ’06, pp. 93–100, 2006.

L. Chen and P. Pu, “A cross-cultural user evaluation of product recommender
interfaces,” Proc. 2008 ACM Conf. Recomm. Syst. - RecSys ’08, p. 75, 2008.
P. Melville and V. Sindhwani, “Recommender Systems,” Encyclopedia of
Machine Learning, vol. 1. pp. 1–21, 2010.
T. Di Noia, R. Mirizzi, V. C. Ostuni, D. Romito, and M. Zanker, “Linked open
data to support content-based recommender systems,” Proc. 8th Int. Conf.
Semant. Syst. - I-SEMANTICS ’12, no. December 2015, p. 1, 2012.
G. Adomavicius and a Tuzhilin, “Toward the Next Generation of Recommender
Systems: a Survey of the State of the Art and Possible Extensions,” IEEE Trans.
Knowl. Data Eng., vol. 17, no. 6, pp. 734–749, 2005.
A. M. Rashid, I. Albert, D. Cosley, S. K. Lam, S. M. McNee, J. a Konstan, and
J. Riedl, “Getting to Know You: Learning New User Preferences in
10


[18]

[19]
[20]

[21]
[22]

[23]

[24]

[25]
[26]
[27]


[28]

[29]
[30]
[31]
[32]

Recommender Systems,” Int. Conf. Intell. User Interfaces, IUI 2002, pp. 127–
134, 2002.
Y. Hijikata, “Offline Evaluation for Recommender Systems.” Journal of the
Japanese Society for Artificial Intelligence, p. Vol. 29, No. 6, pp. 658–689,
2014.
K. Garg and D. Kumar, “Comparing the Performance of Frequent Pattern
Mining Algorithms,” Int. J. Comput. Appl., vol. 69, no. 25, pp. 21–28, 2013.
A. M. Said, P. D. D. Dominic, and A. B. Abdullah, “A comparative study of FPgrowth variations,” International Journal of Computer Science and Network
Security, vol. 9, no. 5. pp. 266–272, 2009.
P. J. Azevedo and A. M. Jorge, “Comparing Rule Measures for Predictive
Association Rules,” Ecml, vol. 4701, pp. 510–517, 2007.
A. Geyer-schulz and M. Hahsler, “Evaluation of Recommender Algorithms for
an Internet Information Broker based on Simple Association Rules and on the
Repeat-Buying Theory,” In Pract., no. July, pp. 100–114, 2002.
M. J. Zaki and C. Hsiao, “CHARM: An efficient algorithm for closed
association rule mining,” 2nd SIAM International Conf. on Data Mining. pp.
457–473, 1999.
T. Burdick, D., Calimlim, M., Flannick, J., Gehrke, J., & Yiu, “Mafia: a
maximal frequent itemset algorithm.” IEEE TKDE Journal, 17(11), pp. 1490–
1504., 2005.
B. Liu, W. Hsu, and Y. Ma, “Mining Association Rules with Multiple,” Kdd-99.
pp. 337–341, 1999.

J. Han, “Data Mining : Concepts and Techniques,” Lect. Notes Comput. Sci.
Dep. Univ. Illinois Urbana-Champaign, 2014.
J. Han, H. Cheng, D. Xin, and X. Yan, “Frequent pattern mining: current status
and future directions,” Data Mining and Knowledge Discovery, vol. 15. pp. 55–
86, 2007.
W. Wang, J. Yang, and P. S. Yu, “Efficient mining of weighted association rules
(WAR),” Proceedings of the sixth ACM SIGKDD international conference on
Knowledge discovery and data mining - KDD ’00. pp. 270–274, 2000.
G. Grahne and J. Zhu, “Fast algorithms for frequent itemset mining using FPtrees,” IEEE Trans. Knowl. Data Eng., vol. 17, no. 10, pp. 1347–1362, 2005.
G. Liu, H. Lu, J. Yu, W. Wang, and X. Xiao, “AFOPT: An Efficient
Implementation of Pattern Growth Approach.,” Fimi. 2003.
B. Goethals and M. Zaki, “Workshop on frequent itemset mining
implementations,” Data Min. Work. Freq. Itemset Min., 2003.
J. Li, X. Zhang, G. Dong, K. Ramamohanarao, and Q. Sun, “Efficient Mining of
High Confidence Association Rules without Support Thresholds,” Principles of
Data Mining and Knowledge Discovery PKDD’99, LNAI 1704, Prague, Czech
11


[33]

[34]

[35]
[36]
[37]

[38]
[39]
[40]

[41]

[42]
[43]
[44]
[45]

Republic. pp. 406–411, 1999.
J. Li and N. Cercone, “A rough set based model to rank the importance of
association rules,” Rough Sets, Fuzzy Sets, Data Mining, Granul. Comput., pp.
109–118, 2005.
R. Agrawal and R. Srikant, “Fast algorithms for mining association rules,”
Proceeding VLDB ’94 Proc. 20th Int. Conf. Very Large Data Bases, vol. 1215,
pp. 487–499, 1994.
M. J. Zaki, “Scalable algorithms for association mining.” Knowledge and Data
Engineering, IEEE Transactions on 12.3, pp. 372–390, 2000.
M. Holsheimer, “a Perspective on databases and data mining,” KDD-95 Proc.,
no. October, pp. 150–156, 2005.
Y. H. Cho, J. K. Kim, and S. H. Kim, “A personalized recommender system
based on web usage mining and decision tree induction,” Expert Syst. Appl., vol.
23, no. 3, pp. 329–342, 2002.
P.-N. Tan, M. Steinbach, and V. Kumar, “Association Analysis: Basic Concepts
and Algorithms,” Introd. to Data Min., pp. 327–414, 2005.
J. Han and J. Pei, “Mining frequent patterns by pattern-growth,” ACM SIGKDD
Explorations Newsletter, vol. 2, no. 2. pp. 14–20, 2000.
J. Han, J. Pei, and Y. Yin, “Mining frequent patterns without candidate
generation,” ACM SIGMOD Record, vol. 29, no. 2. pp. 1–12, 2000.
J. Han, J. Pei, and Y. Yin, “Mining frequent patterns without candicate
generation.” Data Mining and Knowledge Discovery, Kluwer Academic
Publishers., pp. 53–87, 2004.

Z. H. Deng and S. L. Lv, “Fast mining frequent itemsets using Nodesets,”
Expert Syst. Appl., vol. 41, no. 10, pp. 4505–4512, 2014.
Z. Deng, Z. Wang, and J. Jiang, “A new algorithm for fast mining frequent
itemsets using N-lists,” Sci. China Inf. Sci., vol. 55, no. 9, pp. 2008–2030, 2012.
B. Sarwar, G. Karypis, J. Konstan, and J. Riedl, “Analysis of recommendation
algorithms for e-commerce,” Organization, vol. 5, no. 1/2, pp. 158–167, 2000.
“Www.Philippe-Fournier-Viger.Com.” .

12


13



×