Tải bản đầy đủ (.doc) (57 trang)

Phân tích dữ liệu nuôi cá bằng phương pháp trực quan để kiểm soát chi phí và nâng cao hiệu quả - Áp dụng dữ liệu của một công ty nuôi cá tra (Luận văn thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.76 MB, 57 trang )

BỘ GIÁO DỤC

VIỆN HÀN LÂM KHOA HỌC

VÀ ĐÀO TẠO

VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CƠNG NGHỆ
-----------------------------

ĐỖ HỒNG NAM

PHÂN TÍCH DỮ LIỆU NI CÁ BẰNG PHƯƠNG PHÁP TRỰC QUAN
ĐỂ KIỂM SỐT CHI PHÍ VÀ NÂNG CAO HIỆU QUẢ ÁP DỤNG DỮ LIỆU CỦA MỘT CÔNG TY NUÔI CÁ TRA

LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH

Thành phố Hồ Chí Minh - 2020


BỘ GIÁO DỤC

VIỆN HÀN LÂM KHOA HỌC

VÀ ĐÀO TẠO

VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CƠNG NGHỆ
-----------------------------



ĐỖ HỒNG NAM

PHÂN TÍCH DỮ LIỆU NI CÁ BẰNG PHƯƠNG PHÁP TRỰC QUAN
ĐỂ KIỂM SỐT CHI PHÍ VÀ NÂNG CAO HIỆU QUẢ ÁP DỤNG DỮ LIỆU CỦA MỘT CÔNG TY NUÔI CÁ TRA

Chuyên ngành : Hệ Thống Thông Tin.
Mã số : 8480104

LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC : PGS.TS TRẦN VĨNH PHƯỚC

Thành phố Hồ Chí Minh – 2020


LỜI CAM KẾT
Tơi cam đoan đây là cơng trình nghiên cứu của cá nhân tôi, xuất phát từ
nhu cầu thực tế trong quá trình học tập cao học, cũng như nhu cầu phân tích dữ
liệu của cơng ty ni cá tra hiện nay. Dữ liệu sử dụng trong nghiên cứu được thu
thập tại cơng ty ni cá tra.
Trong q trình tìm hiểu có tham khảo từ các nghiên cứu liên quan đều
được dẫn nguồn cụ thể, nội dung trích dẫn. Tất cả nội dung, kết quả luận văn là
sự học hỏi, thực hiện của bản thân và chưa công bố trong các cơng trình nghiên
cứu khoa học, bài báo liên quan khác.
Tác giả luận văn

Đỗ Hoàng Nam


LỜI CẢM ƠN

Trong quá trình thực hiện luận văn “Phân tích dữ liệu ni cá bằng phương
pháp trực quan để kiểm sốt chi phí và nâng cao hiệu quả - Áp dụng dữ liệu của
một công ty nuôi cá tra”, tôi đã nhận được nhiều sự hỗ trợ, chỉ dẫn từ phía Thầy
Cơ, các cá nhân và tổ chức sau:
Tơi xin chân thành cảm ơn sâu sắc đến Thầy hướng dẫn chính PGS.TS.
Trần Vĩnh Phước đã tận tình dìu dắt, hướng dẫn, góp ý, chỉnh sửa, chỉ dạy các
kiến thức trực quan, khai phá dữ liệu, hệ thống thông tin để tơi hồn thành luận
văn này.
Tơi xin gởi lời cảm ơn đến Quý đồng nghiệp Viện Cơ Học và Tin Học
Ứng Dụng đã đóng góp ý kiến xây dựng dữ liệu ban đầu.
Tôi cũng xin được gửi lời cảm ơn đến Ban Giám đốc Học Viện, Phòng
đào tạo Sau Đại học, các Thầy, Cô trong Khoa Hệ thống thông tin và viễn thông,
Học Viện Khoa học và Công nghệ và Viện Cơ Học và Tin Học Ứng Dụng đã tạo
mọi điều kiện và môi trường nghiên cứu học tập tốt nhất.
Tác giả luận văn

Đỗ Hoàng Nam


DANH MỤC CHỮ VIẾT TẮT
TÊN VIẾT TẮT

KÍ HIỆU

TA

Fo

TYT


Me

DTA

Pa

SLC

Nf

CPTCG

Ef

CPVCTA

Ct

SLCTH

Yf

CPSXK

Epd

LNTT

Pt


LNST

Pat

GCBR

Cp

LNK

Po

TDN

TP

TNK
Thu nhập khác

IO

TÊN BIẾN
Thức ăn
Thuốc y tế
Diện tích ao ni
Cá giống
Chi phí thả cá giống
Chi phí vận chuyển thức
ăn
Sản lượng cá thu hoạch

Chi phí sản xuất khác
Lợi nhuận trước thuế
Lợi nhuận sau thuế
Giá bán
Lợi nhuận khác
Thuế thu nhập doanh
nghiệp
Thu nhập khác


DANH MỤC CÁC BẢNG BIỂU


DANH SÁCH CÁC HÌNH

MỤC LỤC


8

CHƯƠNG 1: GIỚI THIỆU
Trong chương giới thiệu, sẽ trình bày tổng quan về tình hình ni cá tra ở
Đồng bằng Sơng Cửu Long nói chung, tình hình quản lý dữ liệu của cơng ty
ni cá nói riêng. Tổng quan về mục tiêu, phạm vi nghiên cứu ở một công ty và
phương pháp nghiên cứu.
1.1.

Tính cấp thiết của đề tài.

1.1.1. Tình hình quản lý và sử dụng dữ liệu

Sự tiến bộ phát triển không ngừng của ngành công nghệ thông tin nói
chung, ngành lưu trữ dữ liệu ngày càng đa dạng hình thức và nhu cầu khai phá
dữ liệu để tìm thế mạnh của cơng ty, tăng tính cạnh tranh trong thị trường. Vì
vậy quản lý nguồn dữ liệu cơng ty, truy vấn dữ liệu là vấn đề quan tâm hàng
đầu. Để sử dụng các nguồn dữ liệu đó hiệu quả, công ty cần phải quản lý, lưu trữ
dữ liệu một cách khoa học. Song song đó, áp dụng khoa học công nghệ phát
triển và các công cụ hỗ trợ quản lý dữ liệu cũng góp phần giúp cơng ty chủ động
hơn trong việc sử dụng dữ liệu một cách hiệu quả, chính xác trên cơ sở tơn trọng
các ngun tắc về sử dụng, lưu trữ dữ liệu và chấp hành đúng luật pháp nhà
nước Việt Nam.
Tình hình kinh doanh của mỗi công ty không những được quan tâm bởi các
nhà quản lý mà còn của rất nhiều đối tượng khác nhau đặc biệt là các nhà đầu tư,
đối thủ cạnh tranh. Họ quan tâm đến tình hình kinh doanh, chi phí sản xuất, lợi
nhuận trên các góc độ khác nhau: đối với giám đốc cơng ty thì mục đích quan
tâm đến tình hình kinh doanh để biết chính xác đến thực trạng kinh doanh của
cơng ty mình, từ đó đưa ra các chiến lược kinh doanh phù hợp, đối với các chủ
đầu tư là để quyết định có nên đầu tư hay khơng? Nhưng mục đích chung muốn
biết hiệu quả sản xuất kinh doanh, tình hình phát triển cơng ty. Để đáp ứng nhu
cầu và nắm bắt tình hình kinh doanh của công ty, các nhà quản lý điều hành, chủ
đầu tư cần tham chiếu lại dữ liệu lưu trữ sản xuất kinh doanh các năm trước đó,
qua các dữ liệu cụ thể tiến hành phân tích đánh giá tình hình sản xuất kinh doanh
để đưa ra quyết định cho các năm sau.


9

Dữ liệu lưu trữ qua các năm là các con số nên việc so sánh khi nhìn các
bảng dữ liệu sẽ gây khó khăn cho người quản lý. Theo các nghiên cứu thì bộ não
con người xử lý hình ảnh nhanh hơn từ ngữ nên phương pháp trực quan hóa dữ
liệu hỗ trợ xử lý thông tin thành biểu đồ, dùng tri thức quản lý để đưa ra các

quyết định kinh doanh, thời gian đầu tư, từ đó phát triển những lợi thế doanh
nghiệp và tìm ra những khó khăn để kịp thời khắc phục nhằm nâng cao hiệu quả
sản xuất kinh doanh, phát triển bền vững, hạn chế những rủi ro tiềm ẩn có thể
xảy ra trong thời gian đầu tư.
Vì thấy được các ưu điểm phương pháp trực quan nên quyết định chọn đề
tài: “Phân tích dữ liệu ni cá bằng phương pháp trực quan để kiểm sốt
chi phí và nâng cao hiệu quả - Áp dụng dữ liệu của một công ty nuôi cá tra”
làm đề tài luận văn tốt nghiệp.
1.1.2. Tổng quan tình ni cá tra ở Đồng bằng Sông Cửu Long.
Với những lợi thế về điều kiện tự nhiên như: địa hình, địa chất, chế độ
thủy văn, nguồn nước ngọt, các thông số môi trường nước phù hợp…vùng
ĐBSCL dần đã khẳng định được thương hiệu sản phẩm cá tra trên thế giới. Dựa
trên cơ sở đó sắp xếp các vùng ni cá tra để làm tiêu chí cho việc đánh giá chất
lượng thịt cá thơng qua các yếu tố môi trường, nguồn nước và làm tiền đề cho
việc bố trí phân cấp vùng quy hoạch theo các cấp độ vùng đất tối ưu để phát
triển nuôi cá tra.
+ Thống kê của Tổng cục Thủy sản cho thấy, diện tích ni cá tra của cả
nước trong năm 2018 đạt 5.400 ha, tăng 3,3%; sản lượng thu được 1,42 triệu tấn,
tăng 8,4% so với năm 2017. Một số tỉnh nuôi cá tra trọng điểm đạt sản lượng lớn
như Đồng Tháp, đạt khoảng 452 nghìn tấn, tăng 3,7% so với cùng kỳ; An Giang
333.200 tấn, tăng 36%; Bến Tre 182 nghìn tấn, tăng 3,1%.
+ Cùng với sự gia tăng về diện tích, sản lượng, giá cá tra nguyên liệu tại
khu vực đồng bằng sông Cửu Long năm 2018 cũng đạt mức cao trong nhiều thời
điểm. Tính trung bình giá thành sản xuất cá tra vào khoảng 21 nghìn đồng/kg,
trong khi giá bán cá thương phẩm có thời điểm đạt đỉnh 35 đến 36 nghìn
đồng/kg, đem lại lợi nhuận lớn cho người nuôi. Nếu như vài năm trước, người


10


ni ln phải lận đận với cảnh “treo ao” vì thua lỗ thì năm 2018, nhiều hộ gia
đình đã vực dậy được nghề nuôi cũng như nâng cao thu nhập nhờ sản lượng tốt
và giá cá tăng cao [1].
Những vấn đề tồn tại trong nghề nuôi cá tra:
+ Công ty đầu tư tận dụng tối đa quỹ đất, sử dụng lượng thức ăn lớn, mật
độ thả cá quá dày so với tiêu chuẩn dẫn đến dịch bệnh dễ bùng phát, lây lan
nhanh.
+ Sản xuất chưa theo quy hoạch, theo biến động của thị trường dẫn đến
thừa thiếu nguyên liệu cục bộ cho chế biến xuất khẩu, tính ổn định, dài lâu chưa
cao.
+ Chi phí sản xuất ngày càng tăng làm cho người nuôi (công ty) thua lỗ
hoặc lợi nhuận thấp.
+ Tốc độ phát triển vùng nuôi cá tăng quá nhanh nhưng thiếu quy hoạch
chung dẫn đến công tác đưa ra dự báo sản lượng, giải pháp kiểm sốt diện tích
ao ni cá cịn nhiều điểm yếu.
1.2.

Đặt vấn đề.
Những thách thức mà cơng ty đang gặp phải như: Tình hình giá nguyên liệu

thức ăn tăng, nguồn cá giống chất lượng chưa nhiều, nước mặn xâm nhập, dịch
bệnh COVID-19 ảnh hưởng đến xuất khẩu cá tra. Với mong muốn luận văn này
có thể hỗ trợ cho ban quản lý công ty đánh giá được thực trạng, tình hình kinh
doanh tồn diện qua các năm. Từ đó, đưa ra chiến lược quản lý, kiểm sốt chi
phí, để góp phần tăng năng suất tăng khả năng cạnh tranh tăng sản lượng thu
hoạch để đưa doanh nghiệp phát triển.
1.3.

Mục tiêu nghiên cứu.
Sử dụng phương pháp trực quan vào phân tích tập dữ liệu và biểu diễn dữ


liệu chi phí, kinh doanh của cơng ty ni cá tra qua 03 năm 2016, 2017, 2018.
Sản phẩm hỗ trợ ra quyết định cho những nhà quản lý kinh doanh nuôi cá tra.


11

1.4.

Phạm vi nghiên cứu.

1.4.1. Phạm vi dữ liệu.
Dữ liệu nghiên cứu được thu thập tại một công ty nuôi cá tra. Dữ liệu thu
thập bao gồm: Các file excel là dữ liệu trong 3 năm (2016-2018) về hoạt động
kinh doanh, chi phí ni cá trong các vùng ao ni của công ty.
1.4.2. Phạm vi thời gian.
Dữ liệu nghiên cứu được trích trong khoảng thời gian từ năm 2016 đến
năm 2018.
1.5.

Phương pháp nghiên cứu.

Ứng dụng ngơn ngữ lập trình Python và sử dụng các thư viện Matplotlib,
Plotly, Numpy, Pandas, Tkinter của Python vào làm giao diện, vẽ biểu đồ cột
trong hệ tọa độ 3 chiều để biểu diễn trực quan hóa các biến dữ liệu và sự tương
quan của các biến dữ liệu với nhau.
Qua hình ảnh các dữ liệu được biểu diễn dưới dạng biểu đồ, bằng tri thức của
nhà quản lý tóm tắt, rút ra những thơng tin có giá trị trong bộ dữ liệu lưu trữ một
cách nhanh chóng, đưa ra các quyết định đúng, tăng cơ hội đầu tư thành công
trong cạnh tranh.



12

CHƯƠNG 2: TỔNG QUAN PHƯƠNG PHÁP TRỰC QUAN HÓA
DỮ LIỆU
2.1.

Tổng quan về trực quan hóa.
Trực quan hóa thường được sử dụng sau khi có kết quả phân tích dữ liệu

cụ thể, có nghĩa là thơng tin trích xuất từ dữ liệu để trình bày cho người xem,
người đọc quan tâm. Bên cạnh đó phương pháp trực quan hóa có thể được sử
dụng trước khi dữ liệu được đưa vào giai đoạn phân tích, nghiên cứu. Các
chuyên gia phân tích dữ liệu muốn tìm hiểu trước về các biến dữ liệu, mối quan
hệ tương quan qua lại giữa chúng là gì? Để suy nghĩ, phác họa về các mơ hình
dự báo, xem xét bằng tri thức của nhà quản lý hoạch định chiến lược. Đây gọi là
bước khai phá dữ liệu hoặc phương pháp tóm tắt trình bày dữ liệu trong thống
kê.
2.2.

Lý thuyết về trực quan hóa.
Trực quan hóa dữ liệu là biến các dữ liệu lưu trữ thành những thông tin

thể hiện bằng hình ảnh, biểu đồ được thể hiện một cách trực quan, dễ hiểu, dễ
quan sát để truyền đạt rõ ràng những con số thành hình ảnh đầy đủ từ dữ liệu
đến người quan tâm, khai thác. Bằng tri thức của nhà quản lý áp dụng phương
pháp trực quan hóa để phân tích khai thác dữ liệu một cách tối ưu. Mô tả các dữ
liệu trong phương pháp thống kê được chia làm 2 dạng phụ thuộc vào tính chất
của dữ liệu phân tích, đó chính là dữ liệu định tính và dữ liệu định lượng. [2]

Các dạng biểu đồ, đồ thị biểu diễn dữ liệu thường dùng trong phương
pháp trực quan hóa.




Biểu đồ cột/ cột chồng.
- Là loại biểu đồ đơn giản nhất và trực quan nhất, người xem sẽ thấy
nhanh giá trị lớn nhất, bé nhất, so sánh dễ dàng các yếu tố liên quan.
Biểu đồ đường.
- Được dùng để mô tả xu hướng biến động của dữ liệu phân tích và so
sánh các yếu tố theo mốc thời gian.


13



Biểu đồ Pareto chart
- Là biểu đồ cột mà các cột được sắp xếp từ thấp đến cao theo tần số,



cịn các giá trị chỉ tuần suất tích lũy được biểu diễn bằng đường thẳng.
Biểu đồ trịn.
- Biểu đồ hình trịn, trên đó chia ra thành từng phần, thể hiện % giá trị



được biểu diễn.

Biểu đồ phân tán (Scatter plot).
- Là biểu đồ thể hiện mối quan hệ hai biến giữa 2 biến định lượng khác
nhau hoặc thể hiện hướng phân phối dữ liệu phân tích, tìm tính tương



đồng dữ liệu.
Biểu đồ Bubble.
- Là biểu đồ giống như biểu đồ Scatter plot nhưng có thêm biến thứ ba
thể hiện các dấu chấm tròn. Biến thêm vào biến dữ liệu định tính hoặc



biến dữ liệu định lượng.
Biểu đồ Area.
- Giống như biểu đồ đường thể hiện sự biến động đối tượng dữ liệu theo



xu hướng thời gian.
Biểu đồ thác nước (Waterfall).
- Là biểu đồ trực quan thông tin được sử dụng để người xem thấy được
giá trị ban đầu bị ảnh hưởng bởi các giá trị trung gian để dẫn đến giá



trị cuối cùng.
Biểu đồ phễu (Funnel).
- Là biểu đồ dạng phễu dùng trong marketing để bắt đầu từ bước tiếp




cận khách hàng bằng các chiến dịch quảng cáo.
Biểu đồ nhiệt (Heat).
- Là biểu đồ cho thể hiện, biểu diễn 2 mối quan hệ giữa 2 thước đo và 2



biến nghiên cứu, cung cấp thông tin thể hiện sự sắp xếp.
Biểu đồ hộp và râu (Box-plot).
- Để thể hiện sự đo lường phân tán và xác định các biến dữ liệu ngoại lệ.
Các dạng biểu đồ tham khảo tài liệu [3]

2.3.

Các tài liệu nghiên cứu phương pháp trực quan.
Bài báo khoa học nghiên cứu [4] trình bày những đặc điểm nhận thức

bằng giác quan thị giác, quan trọng trong 5 giác quan của con người, xây dựng
mối quan hệ giữa các biến dữ liệu trong tập dữ liệu để tạo thành các mơ hình


14

khối đại diện cho tập dữ liệu dưới dạng một biểu đồ trên khối lập phương 3
chiều. Bài báo đề xuất quy trình thiết kế đồ thị, biểu đồ đa chiều trên mơ hình
khối lập phương để biểu diễn dữ liệu phân tích đa biến. Dạng biểu đồ biểu diễn
dữ liệu được thiết kế theo mối quan hệ tương quan giữa các biến dữ liệu và nhận
thức thị giác của con người.
Bài báo khoa học [5] trình bày phương pháp phân tích trực quan là một

phần của cơng nghệ phân tích kinh doanh (BA), các báo cáo, trực quan hóa đóng
vai trị thiết yếu trong việc giảm tối thiểu hạn chế của người đọc: thiếu kinh
nghiệm phân tích, kiến thức hạn chế và thơng tin cần đơn giản hóa. Trực quan
hóa giúp nâng cao khả năng tiếp nhận thơng tin và cho phép người đọc tập trung
nhiều hơn vào dữ liệu cung cấp hơn là phân tích số. Để hiểu rõ hơn về vai trò
của bài nghiên cứu và trực quan hóa trong mơi trường được ngữ cảnh hóa, bài
viết nghiên cứu việc sử dụng tương tác trực quan hóa dữ liệu (IDV) trong kế
tốn. Nghiên cứu tìm hiểu liệu IDV có thể giúp các nhà đầu tư khơng chun
nghiệp nâng cao khả năng thực hiện các phân tích báo cáo tài chính cơ bản.
Nghiên cứu này đã tiến hành một thử nghiệm sử dụng mẫu gồm 324 nhà đầu tư
không chuyên nghiệp. Phát hiện rằng các nhà đầu tư khơng chun sử dụng IDV
có kinh nghiệm hơn những người không chuyên không sử dụng IDV. Những
phát hiện này bổ sung thêm lý thuyết về sử dụng phân tích kinh doanh trong việc
ra quyết định kế toán. Kết quả của nghiên cứu cũng đề xuất một số các khóa
học, chẳng hạn như thúc đẩy việc sử dụng và tạo ra IDV hợp lý rộng rãi hơn, đặc
biệt là cho các nhà đầu tư không chuyên nghiệp.
Bài báo khoa học [6] phân tích tính hiệu quả của biểu đồ hiển thị dữ liệu
đa biến đánh giá chủ quan bằng nhận thức thị giác của con người mà cịn được
ước tính một cách khách quan bằng các tính năng trực quan của đồ thị. Đồ thị
được thiết kế, cần cải thiện để trực quan con người đánh giá tốt hơn. Tích hợp
các biến võng mạc vào biểu đồ là một cách để tăng các tính năng trực quan của
đồ thị. Trong bài báo nghiên cứu này, tác giả chỉ các thành phần của đồ thị được
nhóm thành các lớp, đánh dấu bằng các đặc điểm định tính và định lượng. Các
biến võng mạc được nghiên cứu để tích hợp vào các lớp. Một q trình phân tích


15

gồm năm bước được đề xuất để tăng các tính năng thị giác bằng cách tích hợp
các biến võng mạc vào đồ thị. Quá trình này được thể hiện bằng hai nghiên cứu

cơ bản: Tăng đặc tính trực quan của bản đồ không gian-thời gian xe buýt với các
lớp định lượng; Tăng đặc tính trực quan của biểu đồ thể hiện dữ liệu dịch taychân-miệng ở Bình Dương với các lớp định tính và định lượng.
2.4.

Tổng quan mối quan hệ quản lý, dữ liệu lưu trữ, sản xuất.

Hình 2.1: Sơ đồ quan hệ dữ liệu và sản xuất
-

Dữ liệu nuôi cá, kinh doanh của công ty được lưu trữ hàng năm, tạo
nên kho dữ liệu phong phú đa dạng, nhưng mối liên kết dữ liệu giữa
các năm khó nhìn thấy khi dữ liệu lữu trữ nhiều năm là những con số.
Cơng tác làm dữ liệu là của nhiều phịng ban khơng phải riêng một cá

-

nhân làm liên tục nhiều năm.
Tình hình sản xuất gặp khó khăn khi thị trường tiêu thụ sản phẩm biến
động, chi phí sản xuất tăng, giá bán cá giảm, nguồn cung nguyên vật

-

liệu tăng, môi trường ô nhiễm, thời tiết thay đổi bất thường.
Ban quản lý làm cơng tác chính sách dự báo, quyết định dựa vào dữ
liệu để phân tích, nắm tình hình sản xuất qua nhiều năm, kết quả kinh
doanh, tìm thế mạnh của công ty để phát triển nhằm hạ giá thành sản
xuất, kiểm sốt chi phí tốt nhất có thể.


16


2.5. Ứng dụng ngơn ngữ lập trình Python để xây dựng trực quan hóa.
2.5.1 Thư viện Matplotlib trong Python.
a. Giới thiệu.
Matplotlib là một thư viện có các đặc điểm giống GNUplot. Thư viện này
vẽ đồ thị rất linh hoạt, đa dạng cho những người làm việc bằng Python và
Numpy. Hiện nay, Python là ngơn ngữ lập trình phổ biến dùng nhiều trong lĩnh
vực lưu trữ dữ liệu lớn (Big Data), khoa học dữ liệu (Data Science), phân tích dữ
liệu (data Analysis). Điểm hay của thư viện này có thể được kết hợp với bộ công
cụ GUI (giao diện người dùng) mục đích chung như GTK, wxPython, CaCao
[7].
Matplotlib có một số giao diện (interfaces) để tương tác như: ObjectOriented API, The Scripting Interface (module pyplot), The MATLAB Interface
(module pylab). Cả 2 module Pyplot và Pylab đều là giao diện dễ dùng
(lightweight interfaces). Tuy nhiên, Pyplot cung cấp một giao diện các thư viện
chuyên để vẽ và hướng đối tượng trong Matplotlib. Phương pháp thiết kế này đã
giúp cho việc sử dụng Pyplot dễ dàng và dễ ứng dụng vào thực tế. Matplotlib có
thể được sử dụng để tạo ra những figures đủ chất lượng cho một loạt các định
dạng cố định và môi trường tương tác trên nền tảng ứng dụng.
b. Module Pyplot
Pyplot là một module của Matplotlib (matplotlib.pylot) cung cấp các hàm
đơn giản như lines, images, text... vào các axes trong figure. Thư viện Matplotlib
figure được phân loại thành:


Figure: nơi chứa tất cả những hình vẽ.



Axes: thành phần chính của một figure là các axes (có các khung nhỏ hơn
để vẽ hình lên đó). Một figure có thể chứa một hoặc nhiều axes. Nói cách

khác, figure chỉ là khung chứa, chính các axes mới là nơi các hình vẽ
được vẽ lên.


17


Axis: là dòng số giống như các đối tượng, tạo giới hạn biểu đồ.



Artist: có thể nhìn thấy trên figure là một artist như Text object,
collection objects, line2D objects. Tất cả được gắn với Axes.

c. Các dạng biểu đồ trong thư viện Matplotlib.





Biểu đồ tròn.
Biểu đồ thanh.
Biểu đồ Histogram.
Sơ đồ phân tán và hệ tọa độ 3 chiều.

2.5.2. Thư viện Numpy.
Thư viện Numpy là một thư viện toán học hỗ trợ mạnh trong Python, cho
phép làm việc hiệu quả với ma trận, mảng, tốc độ xử lý nhanh với dữ liệu lớn.
Sở hữu kiểu dữ liệu lớn là Numpy Array và các hàm hỗ trợ xử lý dữ liệu. Thư
viện này được phát triển để thao tác xử lý dữ liệu nhanh hơn, tiêu hao ít bộ nhớ.

2.5.3. Các thành phần tạo nên biểu đồ
Để vẽ biểu đồ, chúng ta cần biết rõ các thành phần tạo nên biểu đồ:
 Trục: trục X, trục Y, trục thời gian.
 Dữ liệu: dữ liệu phân tích có thể được biểu diễn dưới dạng một

mảng.
 Chiều cao và chiều rộng của thanh: được xác định dựa trên phân

tích, chiều rộng của thanh được gọi là bin hay khoảng.
 Tiêu đề của biểu đồ.
 Màu của thanh.
 Màu viền của thanh.


18

CHƯƠNG 3: PHÂN TÍCH TẬP DỮ LIỆU VÀ XÂY DỰNG BIỂU ĐỒ
BIỂU DIỄN DỮ LIỆU
Trong chương quan trọng này trình bày chi tiết nội dung luận văn, các
bước thực hiện và phương pháp nghiên cứu.
3.1.

Nội dung nghiên cứu.
Sự phát triển của công ty nuôi cá phụ thuộc định hướng, quản lý điều

hành của ban giám đốc công ty. Người quản lý phải nắm được thế mạnh để phát
triển, cạnh tranh và mặt hạn chế để có biện pháp khắc phục nâng cao năng suất.
Biện pháp tốt nhất để hiểu rõ tình hình sản xuất, kinh doanh, thị trường tiêu thụ
sản phẩm, đưa ra những hoạch định chiến lược là phân tích dữ liệu sản xuất
bằng phương pháp trực quan hóa.

3.1.1. Các loại biến và mô tả.
3.1.1.1. Các loại biến thường dùng trong phương pháp trực quan hóa
- Biến định danh: áp dụng thuật toán = (bằng), # (khác), biểu diễn trên
trục vơ hướng.
- Biến thứ tự: áp dụng thuật tốn = (bằng), # (khác), > (lớn), < (nhỏ),
có hướng khi biểu diễn trên trục tọa độ.
- Biến khoảng cách: áp dụng thuật toán = (bằng), # (khác), > (lớn), <
(nhỏ), + (cộng), - (trừ).
- Biến tỷ lệ: biến số thực, các thuật toán.
3.1.1.2. Liệt kê các loại biến
Sau khi thu thập dữ liệu để phân tích từ các báo cáo qua các năm của công ty
nuôi cá tra, cần xác định các loại biến và phân tích thuộc tính từng biến:


19

a. Phân loại mối quan hệ và định dạng tên biến
Bảng 3.1: Bảng phân loại các biến.
Phụ thuộc

Độc lập

Quan hệ với biến thời gian

Phân loại biến

Thức ăn

Tăng theo thời gian


Biến tỷ lệ

Thuốc y tế

Tăng theo thời gian

Biến tỷ lệ

Diện tích ao nuôi

Cố định

Biến tỷ lệ

Cá giống

Thay đổi theo thời gian

Biến định danh

Chi phí bán cá

Thay đổi theo thời gian

Biến tỷ lệ

Vận chuyển thức ăn

Thay đổi theo thời gian


Biến tỷ lệ

Sản lượng cá thu
hoạch

Thay đổi theo thời gian

Biến tỷ lệ

Chi phí khác

Thay đổi theo thời gian

Biến tỷ lệ

Lợi nhuận trước thuế

Thay đổi theo thời gian

Biến tỷ lệ

Lợi nhuận sau thuế

Thay đổi theo thời gian

Biến tỷ lệ

Giá bán

Thay đổi theo thời gian


Biến tỷ lệ

Doanh thu khác

Thay đổi theo thời gian

Biến tỷ lệ

Chi phí quản lý doanh
nghiệp

Thay đổi theo thời gian

Biến tỷ lệ

Nhân cơng

Thay đổi theo thời gian

Biến tỷ lệ

Chi phí th ao

Thay đổi theo thời gian

Biến tỷ lệ

Tổng chi phí


Thay đổi theo thời gian

Biến tỷ lệ

Thiết bị đo-máy công
cụ

Thay đổi theo thời gian

Biến tỷ lệ

Thời gian



Xét mối quan hệ từng cặp biến


20


Tập hợp = (thức ăn-thuốc y tế và thời gian)
Thời gian
Thức ăn-thuốc y tế

(Biến dữ liệu “Thức ăn-thuốc y tế” phụ thuộc vào biến dữ liệu “thời
gian” được biểu diễn bằng mũi tên




















)

Tập hợp = (thức ăn-thuốc y tế và số lượng cá thả)
Số lượng cá thả
Thức ăn-thuốc y tế
Tập hợp = (thức ăn-thuốc y tế và diện tích ao ni)
Diện tích ao ni
Thức ăn-thuốc y tế
Tập hợp = (thức ăn-thuốc y tế và sản lượng cá)
Thức ăn-thuốc y tế
sản lượng cá
Tập hợp = (thức ăn-thuốc y tế và chi phí sản xuất)
Thức ăn-thuốc y tế
chi phí sản xuất

Tập hợp = (thức ăn-thuốc y tế và lợi nhuận)
Thức ăn-thuốc y tế
lợi nhuận
Tập hợp = (thời gian và sản lượng cá)
Thời gian
sản lượng cá
Tập hợp = (thời gian và chi phí sản xuất)
Thời gian
chi phí sản xuất
Tập hợp = (thời gian và lợi nhuận)
Thời gian
lợi nhuận
Tập hợp = (số lượng cá thả và diện tích ao ni)
Diện tích ao ni
Số lượng cá thả
Tập hợp = (số lượng cá thả và sản lượng cá)
Số lượng cá thả
Sản lượng cá
Tập hợp = (số lượng cá thả và chi phí sản xuất)
Số lượng cá thả
Chi phí sản xuất
Tập hợp = (Số lượng cá thả và lợi nhuận)
Số lượng cá thả
Lợi nhuận
Tập hợp = (diện tích ao ni và sản lượng cá)
Diện tích ao ni
Sản lượng cá
Tập hợp = (Diện tích ao ni và chi phí sản xuất)
Diện tích ao ni
Chi phí sản xuất

Tập hợp = (Diện tích ao ni và lợi nhuận)
Diện tích ao ni
lợi nhuận
Tập hợp = (Sản lượng cá và chi phí sản xuất)
Sản lượng cá
chi phí sản xuất
Tập hợp = (Sản lượng cá và lợi nhuận)
Sản lượng cá
lợi nhuận
Tập hợp = (chi phí sản xuất và lợi nhuận)
Chi phí sản xuất
lợi nhuận


21

b. Mô tả các biến dữ liệu.
 Thức ăn
Thức ăn là yếu tố quan trọng nuôi cá phát triển nhanh hay chậm, ảnh
-

hưởng đến kết quả kinh doanh.
Xét theo đơn vị thời gian: tháng, năm.
Đơn vị: kilogam.
Kiểu dữ liệu: số thực.

 Thuốc y tế
Thuốc y tế đóng vai trị đảm bảo cá khỏe mạnh để phát triển, môi trường
-


ao nuôi đảm bảo vệ sinh, an toàn.
Xét theo đơn vị thời gian: tháng, năm.
Đơn vị: phần.
Kiểu dữ liệu: số thực.

 Diện tích ao ni
Diện tích ao ni là diện tích mặt nước rộng lớn để đảm bảo số lượng,
-

mật độ cá phát triển đến khi thu hoạch.
Xét theo đơn vị thời gian: tháng, năm.
Đơn vị: m2.
Kiểu dữ liệu: số thực.

 Cá gống
Cá giống là loại cá chọn để nuôi, trong luận văn này chọn loại cá tra. Số
lượng cá giống ảnh hưởng đến mật độ môi trường phát triển, sản lượng
-

thu hoạch, lợi nhuận sau này.
Xét theo đơn vị thời gian: tháng, năm.
Đơn vị: tấn.
Kiểu dữ liệu: số thực.

 Chi phí thả cá giống
Chi phí thả cá giống là chi phí mua con giống, giá thành con giống, trọng
-

lượng và chất lượng con giống ảnh hưởng qua lại.
Xét theo đơn vị thời gian: tháng, năm.

Đơn vị: VNĐ.
Kiểu dữ liệu: số thực.


22

 Lợi nhuận trước thuế
Lợi nhuận trước thuế là lợi nhuận chưa trừ lãi vay và thuế thu nhập doanh
-

nghiệp.
Xét theo đơn vị thời gian: tháng, năm.
Đơn vị: VND.
Kiểu dữ liệu: số thực.

 Doanh thu khác
Lợi nhuận khác là các khoản doanh thu từ các phần khác biệt với hoạt
động thông thường bán cá như: lợi nhuận từ bán bao thức ăn, cá chết
ngộp…




Xét theo đơn vị thời gian: tháng, năm.
Đơn vị: VND.
Kiểu dữ liệu: số thực.

 Giá bán
Giá bán là giá cá bán ra thị trường, thời điểm cá đạt trọng lượng để thu
hoạch.





Xét theo đơn vị thời gian: tháng, năm.
Đơn vị: VND.
Kiểu dữ liệu: số thực.

 Chi phí quản lý doanh nghiệp
Chi phí quản lý doanh nghiệp là những khoản chi phí có liên quan chung đến
tồn bộ hoạt động sản xuất. Chi phí quản lý doanh nghiệp bao gồm: chi phí cán
bộ quản lý, chi phí nguyên vật liệu, công cụ, dụng cụ, khấu hao TSCĐ…




Xét theo đơn vị thời gian: tháng, năm.
Đơn vị: VND.
Kiểu dữ liệu: số thực.

3.1.2. Phân tích mối quan hệ giữa các biến.
 Lợi nhuận sau thuế:
Lợi nhuận sau thuế phụ thuộc vào lợi nhuận trước thuế và tiền thuế TNDN
tính theo cơng thức cơ bản sau:


23

Lợi nhuận sau thuế = Lợi nhuận trước thuế - Thuế TNDN.
 Lợi nhuận trước thuế:

Lợi nhuận trước thuế phụ thuộc vào lợi nhuận thuần từ hoạt động kinh doanh
và lợi nhuận khác theo công thức cơ bản sau:
Lợi nhuận trước thuế = Lợi nhuận thuần từ kinh doanh bán cá + Lợi nhuận
khác.
 Tiền thuế thu nhập doanh nghiệp:
Thuế thu nhập doanh nghiệp phụ thuộc vào lợi nhuận trước thuế và được tính
theo cơng thức cơ bản sau:
Thuế TNDN = Lợi nhuận trước thuế x Thuế suất thuế TNDN.
 Lợi nhuận khác:
Lợi nhuận khác phụ thuộc vào các chi phí khác và thu nhập khác theo cơng thức:
Lợi nhuận khác = Thu nhập khác – Chi phí khác.
 Chi phí quản lý cơng ty:
o

Tiền lương và tiền bảo hiểm: gồm tiền lương của các bộ phận quản

o

lý và văn phịng.
Nhân cơng: số lượng nhân cơng cũng ảnh hưởng đến chi phí cho

o

các quản lý, chi phí đồ dùng…
Tài sản cố định: gồm các khấu hao tài sản cố định dùng trong công
ty như máy bơm hút nước, máy trộn thức ăn…

 Thu nhập khác:
Số tiền thu được từ bán bao thức ăn, cá ngộp ngoài trừ bán cá thu hoạch
cuối vụ.

 Doanh thu:
Doanh thu phụ thuộc vào giá bán cá khi thu hoạch, sản lượng cá thu hoạch.
 Chi phí sản xuất khác:
Nhân cơng: trơng coi ni cá, vận chuyển thức ăn, giám sát dịch bệnh…


24

Tồn kho thức ăn, tồn kho nguyên vật liệu: Chi phí lưu kho, theo dõi tình
trạng thức ăn cho cá, thuốc y tế, vệ sinh ao nuôi.
Tài sản cố định: Chi phí khấu hao máy móc như máy bơm nước, máy tạo oxi,
máy trộn thức ăn.
 Chi phí nguyên vật liệu:
Chi phí nguyên vật liệu, thức ăn phụ thuộc vào số lượng ao, diện tích ao, số
lượng cá thả xuống ao nuôi.
3.1.3. Sơ đồ quan hệ giữa các biến.
Sơ đồ quan hệ biểu diễn mối quan hệ giữa các biến với nhau. Mối quan hệ
tương quan được biểu diễn bằng các mũi tên có hướng với biến ở mũi nhọn sẽ
chịu ảnh hưởng bởi các biến ở đầu mũi tên.


25

Hình 3.1: Sơ đồ quan hệ các biến.


×