Tải bản đầy đủ (.docx) (30 trang)

Dữ liệu lớn Big Data Phân Tích dữ liệu bán hàng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.78 MB, 30 trang )

TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG TP.HCM
KHOA: HỆ THỐNG THÔNG TIN VÀ VIẾN THÁM

BÁO CÁO ĐỒ ÁN MÔN HỌC: CÔNG NGHỆ DỮ LIỆU
LỚN

ĐỀ TÀI: DỮ LIỆU BÁN HÀNG CỦA MỘT

DOANH NGHIỆP Ở MỸ TRONG THÁNG
5/2019

Giảng viên hướng ThS. Lê Quang Thiện
dẫn:
Sinh

viên

hiện:
Lớp:
Khóa:
Các

thực Nhóm 6
09_ĐH_CNTT1
09

thành

nhóm 6:

viên Đỗ Thị Ngọc Bích


Nguyễn Văn Dùng
Võ Văn Khương
1


Tp. Hồ Chí Minh, tháng 1 năm 2023

2


Nhận xét của giảng viên
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
………………………………………………………………………………………………
……….., ngày….tháng…. năm 2023
Giảng viên


Lê Quang Thiện
1


MỤC LỤC
LỜI MỞ ĐẦU................................................................................................................................................4
CHƯƠNG I: TỔNG QUAN.............................................................................................................................5
1.TỔNG QUAN VỀ CÔNG NGHỆ DỮ LIỆU LỚN.........................................................................................5
1.1.SỰ PHÁT TRIỂN CỦA CÔNG NGHỆ DỮ LIỆU LỚN...............................................................................5
1.1.1.TÌM HIỂU VỀ NGUỒN GỐC CỦA BIGDATA..................................................................................5
1.1.2.ĐỊNH NGHĨA BIGDATA................................................................................................................6
1.1.3.CÁC ĐẶC TRƯNG CỦA BIGDATA.................................................................................................6
1.1.4.QUY TRÌNH LÀM VIỆC CỦA BIGDATA.........................................................................................7
1.1.5.LỢI ÍCH VÀ KHĨ KHĂN................................................................................................................7
1.2.MỘT SỐ ỨNG DỤNG TIÊU BIỂU CỦA CƠNG NGHỆ DỮ LIỆU LỚN......................................................8
2.TỔNG QUAN VỀ PYTHON VÀ PHẦN MỀM GOOGLE COLAB TRONG PHÂN TÍCH DỮ LIỆU.................14
2.1.TỔNG QUAN VỀ PYTHON.................................................................................................................14
2.1.1.LỊCH SỬ PYTHON.......................................................................................................................14
2.1.2.ĐỊNH NGHĨA PYTHON...............................................................................................................14
2.1.3.ĐẶC ĐIỂM PYTHON...................................................................................................................15
2.1.4.LỢI ÍCH PYTHON MANG LẠI......................................................................................................15
2.2.PHẦN MỀM GOOGLE COLAB TRONG PHÂN TÍCH DỮ LIỆU.............................................................16
2.2.1.GOOGLE COLAB LÀ GÌ?.............................................................................................................16
2.2.2.PYTHON & GOOGLE COLAB TRONG PHÂN TÍCH DỮ LIỆU........................................................16
3.GIỚI THIỆU ĐỀ TÀI...............................................................................................................................17
3.1.LÍ DO CHỌN ĐỀ TÀI..........................................................................................................................17
3.2.MỤC TIÊU NGIÊN CỨU.....................................................................................................................18
3.3.MƠ TẢ DỮ LIỆU................................................................................................................................19
3.3.1.NGUỒN GỐC DỮ LIỆU...............................................................................................................19

3.3.2.CẤU TRÚC CỦA DỮ LIỆU...........................................................................................................20
3.3.3.MÔ TẢ BÀI TỐN......................................................................................................................20
CHƯƠNG II: MƠ TẢ MƠ HÌNH PHÂN LỚP DỮ LIỆU...................................................................................21
2.1.PHƯƠNG PHÁP PHÂN LỚP DỮ LIỆU...............................................................................................21
2.2.CÁC MƠ HÌNH PHÂN LỚP DỮ LIỆU..................................................................................................21
2.3.Q TRÌNH PHÂN LỚP DỮ LIỆU......................................................................................................21
2.4.TÍNH HIỆU QUẢ CỦA MƠ HÌNH PHÂN LỚP DỮ LIỆU.......................................................................22
CHƯƠNG III: PHÂN TÍCH VÀ DỰ BÁO........................................................................................................22
2


3.1. MƠ TẢ BÀI TỐN............................................................................................................................22
3.2. MƠ TẢ DỮ LIỆU...............................................................................................................................22
3.3. PHÂN LỚP DỮ LIỆU.........................................................................................................................22
3.3.1 XỬ LÝ DỮ LIỆU..........................................................................................................................22
3.3.2. SỬ DỤNG MÔ HÌNH PHÂN LỚP DỮ LIỆU.................................................................................23
CHƯƠNG IV: KẾT LUẬN.............................................................................................................................24
4.1. NHỮNG CƠNG VIỆC ĐÃ THỰC HIỆN...............................................................................................24
4.1.1. TÓM TẮT......................................................................................................................................24
4.1.2. KẾT QUẢ ĐẠT ĐƯỢC....................................................................................................................24
4.2. HƯỚNG PHÁT TRIỂN VÀ KIẾN NGHỊ...............................................................................................24
TÀI LIỆU THAM KHẢO................................................................................................................................25

3


LỜI MỞ ĐẦU
Công nghệ thông tin là lĩnh vực đang phát triển mạnh mẽ, đặc biệt
là những ứng dụng của nó đã trở thành cơng cụ đắc lực phục vụ
cho các hoạt động của con người ở mọi lĩnh vực. Một trong những

hỗ trợ phổ biến nhất của máy tính là quản lý thông tin. Mọi thông
tin được quản lý trên máy tính đều phải thể hiện bằng các dữ liệu
được lưu trữ trong một cơ sở dữ liệu nhất định.
Ngày nay, sự phát triển của Internet đã làm thay đổi mạnh mẽ
cách thức hoạt động của các tổ chức. Các ứng dụng Web 2.0,
mạng xã hội, điện toán đám mây đã một phần mang lại cho các tổ
chức phương thức kinh doanh mới. Trong kỷ nguyên của IoT
(Internet of Things), các cảm biến được nhúng vào trong các thiết
bị di động như điện thoại di động, ô tô, và máy móc cơng nghiệp
góp phần vào việc tạo và chuyển dữ liệu, dẫn đến sự bùng nổ của
dữ liệu có thể thu thập được.
Theo một báo cáo của IDC, năm 2011, lượng dữ liệu được tạo ra
trên thế giới là 1.8ZB, tăng gần 9 lần chỉ trong 5 năm. Dưới sự
bùng nổ này, thuật ngữ Big Data được sử dụng để chỉ những bộ dữ
liệu khổng lồ, chủ yếu không có cấu trúc, được thu thập từ nhiều
nguồn khác nhau. Với những ưu điểm và tác động mạnh mẽ của
Dữ liệu lớn (Big Data) và các ứng dụng liên quan, Big Data đang
được xem như một yếu tố quyết định đến việc phát triển cũng như
mang lại lợi thế cạnh tranh của các tổ chức. Tuy nhiên, để đạt
được sự thành công trong việc xây dựng và thực hiện các dự án
Big Data, những vấn đề có liên quan cần được xác định, từ đó tìm
ra phương hướng để giải quyết.
Các kỹ thuật về Big Data đã được phát triển nhằm mục đích giải
quyết vấn đề về cách tổ chức và xử lý dữ liệu khi kho dữ liệu ngày
càng trở nên quá lớn. Tuy nhiên, chúng ta vẫn phải đối mặt với
vấn đề về lưu trữ và phân tích dữ liệu nhằm đáp ứng yêu cầu của
người sử dụng.

4



CHƯƠNG I: TỔNG QUAN
1.TỔNG QUAN VỀ CÔNG NGHỆ DỮ LIỆU LỚN
1.1.SỰ PHÁT TRIỂN CỦA CƠNG NGHỆ DỮ LIỆU LỚN
1.1.1.TÌM HIỂU VỀ NGUỒN GỐC CỦA BIGDATA
Big Data được xem là một trong những thuật ngữ được bắt đầu từ
năm 1960 và 1970. Đây là thời điểm mà thế giới dữ liệu chỉ bắt
đầu từ các trung tâm dữ liệu đầu tiên để kết hợp với đó chính là sự
phát triển của các cơ sở dữ liệu dạng SQL.
Vào năm 1984, hệ thống xử lý dữ liệu song song DBC 1012 ra đời
bởi tập đoàn Teradata. Đây là một trong những hệ thống có khả
năng phân tích và lưu trữ 1 terabyte dữ liệu đầu tiên. Đến năm
2017 thì đã có hàng chục cơ sở dữ liệu nằm trên hệ thống
Teradata sở hữu nguồn dung lượng cao lên đến hàng petabyte.
Trong số đó, thì lượng dữ liệu lớn nhất đều đã vượt qua ngưỡng
50 petabytes.Năm 2005, khi con người đã bắt đầu nhận ra số
lượng người dùng được tạo ra thông qua Youtube, Facebook và
những dịch vụ trực tuyến khác là vô cùng lớn.
Trong thời gian này thì NoSQL cũng được sử dụng ngày càng phổ
biến và hỗ trợ thúc đẩy sự phát triển cho các framework như
Hadoop bởi nó là cần thiết cho việc thúc đẩy sự phát triển của Big
Data. Theo người dùng, thì những framework này hỗ trợ cho Big
Data có thể dễ dàng thực hiện lưu trữ cũng như hoạt động dễ
hơn.
Trong thời điểm hiện tại, thì khối lượng của Big Data đang dần
tăng lên nhanh chóng hơn nên người sử dụng đang dần tạo ra một
lượng dữ liệu vơ cùng lớn. Tuy nhiên thì dữ liệu này khơng chỉ
dành cho con người mà cịn được tạo ra do máy móc. Ngồi ra, sự
ra đời của IoT với nhiều thiết bị khác giúp người dùng sử dụng dễ
hơn cũng như nâng cao hiệu suất cho sản phẩm.


5


Hình: BigData phát triển theo thời gian

1.1.2.ĐỊNH NGHĨA BIGDATA
Dữ liệu lớn (Tiếng Anh: Big data) là một thuật ngữ cho việc xử lý
một tập hợp dữ liệu rất lớn và phức tạp mà các ứng dụng xử lý dữ
liệu truyền thống không xử lý được. Dữ liệu lớn bao gồm các thách
thức như phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ,
lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư.
Thuật ngữ này thường chỉ đơn giản đề cập đến việc việc sử dụng
các phân tích dự báo, phân tích hành vi người dùng, hoặc một số
phương pháp phân tích dữ liệu tiên tiến khác trích xuất giá trị
từ dữ liệu mà ít khi đề cập đến kích thước của bộ dữ liệu.
"Vài nghi ngờ cho rằng số lượng của dữ liệu có sẵn hiện nay thực
sự lớn, nhưng đó khơng phải là đặc trưng phù hợp nhất của hệ
sinh thái dữ liệu mới này."

1.1.3.CÁC ĐẶC TRƯNG CỦA BIGDATA
Big Data gồm 5 đặc trưng sau đây:
- Volum: Khối lượng dữ liệu cực lớn.
- Variaty: Nhiều loại dữ liệu đa dạng.
6


- Velocity: Vận tốc mà dữ liệu cần phải được xử lý và phân tích
nhanh.
- Veracity: Tính xác thực ảnh hưởng đến sự phân tích chính xác.

- Value: Có giá trị.

7


1.1.4.QUY TRÌNH LÀM VIỆC CỦA BIGDATA
Thu thập dữ liệu > Sắp xếp dữ liệu > Phân tích dữ liệu > Phân
phát dữ liệu.

1.1.5.LỢI ÍCH VÀ KHĨ KHĂN
Lợi Ích

Khó Khăn

+ Bằng cách áp dụng phân tích
vào dữ liệu lớn, các cơng ty có thể
nhận thấy những lợi ích như tăng
doanh thu, dịch vụ khách hàng
được cải thiện, hiệu quả cao hơn
và tăng khả năng cạnh tranh.
+ Phân tích dữ liệu liên quan đến
việc kiểm tra bộ dữ liệu để thu
thập thông tin chi tiết hoặc rút ra
kết luận.
Từ đó có thể định ra các xu hướng
và dự đoán về hoạt động trong
tương lai.

+ Chất lượng dữ liệu không đảm
bảo

+ Thu thập dữ liệu u cầu phải
có nguồn vì thế khi tổng hợp
thông tin từ nhiều nguồn khác
nhau sẽ dẫn đến đôi lúc thông tin
không đồng bộ hoặc không thể
tiến hành phân tích sâu được. Vì
thế yếu tố thu thập thơng tin đầu
tiên rất quan trọng.
+ Kết quả triển khai không như ý

Từ những nguồn dữ liệu thu thập được sau quá trình phân tích
và đánh giá, rất có thể khơng cho chúng ta một kết quả như ý
muốn so với mục đích ban đầu. Vì vậy, khơng phải có Big Data
là thành cơng mà phải biết ứng dụng nó.

8


1.2.MỘT SỐ ỨNG DỤNG TIÊU BIỂU CỦA CÔNG
NGHỆ DỮ LIỆU LỚN
Trong thực tế, ứng dụng BigData (Dữ liệu lớn) vào nhiều lĩnh
vực, giúp doanh nghiệp ở mọi quy mô tạo nên biến chuyển ấn
tượng, gia tăng tính hiệu quả, năng suất và lợi thế cạnh tranh
so với đối thủ.

Ứng dụng big data lĩnh vực ngân hàng
Big Data đã và đang được ứng dụng hiệu quả với các hoạt
động: từ thu tiền mặt đến quản lý tài chính. Từ đó, giúp giảm
bớt rắc rối của khách hàng và gia tăng doanh thu cho các ngân
hàng.

 Sử dụng các kỹ thuật phân cụm giúp ngân hàng đưa ra
quyết định quan trọng. Hệ thống phân tích có thể xác định
các địa điểm chi nhánh nơi tập trung nhiều nhu cầu của
khách hàng, để đề xuất lập chi nhánh mới.
 Quy tắc kết hợp để dự đoán lượng tiền mặt cần thiết sẵn
sàng cung ứng ở một chi nhánh tại thời điểm cụ thể.
 Khoa học dữ liệu là nền tảng của hệ thống ngân hàng kĩ
thuật số.
 Học máy và AI được nhiều ngân hàng sử dụng để phát
hiện các hoạt động gian lận và báo cáo cho các chuyên
viên liên quan.
 Khoa học dữ liệu hỗ trợ xử lý, lưu trữ và phân tích lượng dữ
liệu khổng lồ từ các hoạt động hàng ngày và giúp đảm bảo
an ninh cho ngân hàng.

9


Ứng dụng của big data trong Y tế
Với Big Data, người dùng có thể xác định phương hướng điều
trị, cải thiện q trình chăm sóc sức khỏe, giảm lãng phí tiền
bạc và thời gian.
 Cho phép người quản lý ca dự đoán các bác sĩ cần thiết
vào những thời điểm cụ thể
 Theo dõi tình trạng bệnh nhân bằng hồ sơ sức khỏe điện
tử.
 Sử dụng các thiết bị kỹ thuật số có thể đeo, từ đó, hệ
thống Big Data có thể theo dõi tình trạng bệnh nhân, gửi
báo cáo cho các bác sĩ.
 Big Data có thể đánh giá các triệu chứng và xác định

nhiều bệnh ở giai đoạn đầu.
 Có thể lưu giữ các hồ sơ nhạy cảm được bảo mật và lưu trữ
lượng dữ liệu khổng lồ một cách hiệu quả.
 Ứng dụng Big Data có thể báo trước khu vực có nguy cơ
bùng phát dịch như: sốt xuất huyết hoặc sốt rét.

Ứng dụng của Big Data trong thương mại điện tử
Big Data có thể tạo lợi thế cạnh tranh cho doanh nghiệp bằng
cách cung cấp thông tin chuyên sâu và các bản báo cáo phân
tích xu hướng tiêu dùng.

10


 Có thể thu thập dữ liệu và yêu cầu của khách hàng
 Tạo ra một mơ hình tiếp thị hiệu suất cao.
 Nhà quản lý có thể xác định các sản phẩm được xem
nhiều nhất và tối ưu thời gian hiển thị của các trang sản
phẩm này.
 Đánh giá hành vi của khách hàng và đề xuất các sản
phẩm tương tự. Điều này làm tăng khả năng bán hàng, từ
đó tạo ra doanh thu cao hơn.
 Nếu bất kỳ sản phẩm nào được thêm vào giỏ hàng nhưng
khách hàng khơng mua, Big Data có thể tự động gửi code
khuyến mại cho khách hàng cụ thể đó.
 Các ứng dụng Big Data cịn có thể tạo một báo cáo theo
các tiêu chí: độ tuổi, giới tính, địa điểm của khách truy
cập, v.v.

Ứng dụng Big Data vào Giáo dục

Big Data tạo ra các phương pháp tiếp cận dựa trên dữ liệu để
dạy học sinh.
 Có thể lưu trữ, quản lý, phân tích các bộ dữ liệu lớn bao
gồm hồ sơ của sinh viên.
 Duy trì bảo mật bằng cách sử dụng hệ thống quản lý big
data có khả năng trích xuất phân cấp.
 Big Data giúp các bộ đề kiểm tra gần như không thể bị lộ
 Big Data cung cấp dữ liệu về các hoạt động trong lớp và
giúp đưa ra quyết định cho giáo viên hay người điều hành
tổ chức.
 Big Data có thể đánh giá biểu cảm khn mặt và di
chuyển của học sinh trong lớp từ đó giáo viên có thể đánh
giá được chất lượng giảng dạy bằng máy ảnh độ phân giải
cao, cảnh quay video và xử lý hình ảnh.

11


Big Data và Cloud (Điện toán đám mây)
Với cơ sở dữ liệu quá lớn thì đám mây là phương tiện được sử
dụng để cung cấp cơ sở hạ tầng cần thiết cho việc tính tốn dữ
liệu lớn. Trong cuộc sống thực, nhiều tổ chức đang kết hợp hai
công nghệ này để cải thiện hoạt động điều phối kinh doanh của
mình.
 Cloud cung cấp các cơng cụ để trích xuất dữ liệu. Từ đó,
bằng việc phân tích dữ liệu lớn, thì mục tiêu và các quyết
định của kinh doanh được xác định.
 Ứng dụng Big Data trong kinh doanh trên nền tảng Cloud
giúp các tổ chức quản lý hiệu quả nhiều công cụ phần
mềm và phần cứng.

 Cloud đã tăng tốc độ quản lý và truy cập cơ sở dữ liệu
chứa hàng lượng lớn hồ sơ.

Dịch vụ khách hàng sử dụng Big Data
Để thành cơng thì doanh nghiệp cần làm hài lòng khách hàng
và hiểu nhu cầu của họ. Trong giai đoạn mới gia nhập thị
trường và tìm lợi thế cạnh tranh, thì sẽ rất khó để bạn biết
khách hàng đang tìm kiếm điều gì. Big Data sẽ giúp chủ doanh
nghiệp tìm ra giải pháp và đưa ra đề xuất tốt nhất.
12


 Xác định các yêu cầu của khách hàng, tập trung thực hiện
nhu cầu của họ.
 Phân tích hành vi, sự quan tâm của khách hàng tạo ra các
sản phẩm hướng đến khách hàng.
 Có thể thu thập nhiều dữ liệu về hành vi khách hàng để
thiết kế mơ hình tiếp thị tối ưu
 Tìm ra sự tương đồng giữa khách hàng và nhu cầu của họ,
từ đó, việc nhắm mục tiêu các chiến dịch quảng cáo có thể
chính xác và đạt hiệu quả cao.

Big Data đối với ngành bán lẻ
Big Data mang lại cơ hội cho lĩnh vực bán lẻ bằng việc giúp xác
định hành trình trải nghiệm, xu hướng mua sắm và sự hài lòng
của khách hàng từ cách thu thập dữ liệu đa dạng. Từ những dữ
liệu thu thập được có thể cải thiện hiệu suất và hiệu quả bán
hàng.
 Big data giúp nhà quản lý xây dựng mơ hình chi tiêu của
từng khách hàng

 Với các phân tích dự đốn, ngành cơng nghiệp có thể so
sánh tỷ lệ cung – cầu và có thể tránh tung ra sản phẩm
khơng được đón nhận
 Ngành bán lẻ có thể xác định vị trí bố trí sản phẩm trên kệ
hàng tùy vào thói quen và nhu cầu mua hàng của khách
hàng và thiết lập chiến lược kinh doanh để cải thiện
 Kết hợp phân tích cùng lúc các dữ liệu về thời điểm, giao
dịch, truyền thông xã hội, dự báo thời tiết để xác định
chính xác sản phẩm phù hợp để cung ứng cho khách hàng.
13


Ứng dụng Big Data trong Digital Marketing
Digital Marketing là chìa khóa để doanh nghiệp tiếp cận gần
nhất với khách hàng. Quan trọng, với Digital Marketing, tất cả
các doanh nghiệp ở mọi quy mơ lớn nhỏ... đều có thể tiến hành
các hoạt động quảng cáo tiếp thị trên các nền tảng truyền
thơng xã hội..
 Phân tích thị trường, đối thủ cạnh tranh và đánh giá mục
tiêu kinh doanh. Điều này giúp xác định cơ hội tốt để tiếp
tục tiến hành các kế hoạch kinh doanh tiếp theo
 Có thể xác định người dùng trên các phương tiện truyền
thông xã hội và nhắm mục tiêu cho họ dựa trên nhân khẩu
học, giới tính, thu nhập, tuổi tác và sở thích
 Tạo báo cáo cho chiến dịch quảng cáo:hiệu suất, khách
hàng và giải pháp để tạo kết quả tốt hơn
 Khoa học dữ liệu được sử dụng cho các khách hàng nhắm
mục tiêu và ni dưỡng chu trình khách hàng.
 Tập trung vào các chủ đề được tìm kiếm cao và tư vấn
cách để nội dung để xếp hạng trang web doanh nghiệp

cao hơn trên google (SEO).
 Có thể tạo đối tượng tương tự bằng cách sử dụng cơ sở dữ
liệu đối tượng hiện có để nhắm mục tiêu các khách hàng
tương tự và kiếm được lợi nhuận.

14


Lĩnh vực truyền thơng & Giải trí
Các cơng ty truyền thông cần thúc ẩy chuyển đổi kỹ thuật số để
phân phối sản phẩm và nội dung của họ nhanh nhất có thể tại
thị trường hiện tại. Đối với những người ảnh hưởng trên các
phương tiện truyền thông đại chúng, Big Data có thể giúp tìm
ra quan điểm hoặc lượt thích của một nghệ sĩ để đo lường mức
độ phổ biến trong lĩnh vực truyền thông số.
 Giúp thu thập thông tin và nhu cầu của cá nhân
 Xác định thiết bị và thời gian tạo hiệu quả cao nhất thông
qua các dữ liệu để phân tích
 Có thể xác định lý do đăng ký và hủy đăng ký một nội
dung và đánh giá sự quan tâm của khán giả đối với một
kiểu nội dung cụ thể
 Ứng dụng Big Data cịn giúp đặt nhóm mục tiêu quảng cáo
cho các cơng ty truyền thơng
 Có thể tạo thêm các tính năng mới để phân tích nhu cầu
 Nhà quảng cáo (cơng ty truyền thông, người nổi tiếng,
người phụ trách truyền thông) có thể chọn địa điểm tần
xuất phân phối
 Tùy mức độ phổ biến, nghệ sĩ có thể chọn thiết bị, hệ điều
hành để phân phối bài hát hoặc video của mình


2.TỔNG QUAN VỀ PYTHON VÀ PHẦN MỀM
GOOGLE COLAB TRONG PHÂN TÍCH DỮ LIỆU
2.1.TỔNG QUAN VỀ PYTHON
2.1.1.LỊCH SỬ PYTHON
 Guido Van Rossum cho ra mắt phiên bản đầu tiên của
ngôn ngữ Python (phiên bản 0.9.0) vào năm 1991. Ngôn
ngữ này đã bao gồm các tính năng hữu ích như một số
kiểu dữ liệu và hàm để xử lý lỗi.
15


 Python 1.0 đã được ra mắt vào năm 1994 với các hàm mới
để dễ dàng xử lý danh sách dữ liệu, chẳng hạn như ánh
xạ, lọc và lược bỏ.
 Python 2.0 đã được ra mắt vào ngày 16 tháng 10 năm
2000, với các tính năng hữu ích mới cho lập trình viên,
chẳng hạn như hỗ trợ ký tự Unicode và cách xử lý chi tiết
một danh sách nhanh chóng hơn.
 Python 3.0 đã được ra mắt vào ngày 3 tháng 12 năm
2008. Phiên bản này bao gồm các tính năng như hàm in
và hỗ trợ nhiều hơn cho việc phân chia số và xử lý lỗi.
2.1.2.ĐỊNH NGHĨA PYTHON
Python là một trong những ngơn ngữ lập trình thiên hướng đối
tượng bậc cao. Loại ngôn ngữ này được sử dụng cho quá trình
phát triển ứng dụng và các website khác nhau. Ngôn ngữ này
được tạo ra bởi Guido van Rossum và đã được ơng phát triển nó
trong một dự án mở.Python là sự lựa chọn hoàn hảo của các
chuyên gia hàng đầu cho đến những người mới học lập trình
nhờ cấu trúc thanh lịch mà đơn giản. Ngôn ngữ này cũng được
đánh giá cao về sự chặt chẽ, mạnh mẽ, nhanh chóng nên đã có

mặt ở mọi hệ điều hành.Ngơn ngữ lập trình này đã được ứng
dụng trong các lập trình game đơn giản, những thuật toán phức
tạp.

2.1.3.ĐẶC ĐIỂM PYTHON
Python là một ngôn ngữ thông dịch
Python là một ngôn ngữ dễ sử dụng
Python là một ngôn ngữ linh hoạt
16


Python là một ngôn ngữ cấp cao
Python là một ngôn ngữ lập trình hướng đối tượng

2.1.4.LỢI ÍCH PYTHON MANG LẠI
 Các nhà phát triển có thể dễ dàng đọc và hiểu một chương
trình Python vì ngơn ngữ này có cú pháp cơ bản giống
tiếng Anh.
 Python giúp cải thiện năng suất làm việc của các nhà phát
triển vì so với những ngơn ngữ khác, họ có thể sử dụng ít
dịng mã hơn để viết một chương trình Python.
 Python có một thư viện tiêu chuẩn lớn, chứa nhiều dịng
mã có thể tái sử dụng cho hầu hết mọi tác vụ. Nhờ đó, các
nhà phát triển sẽ khơng cần phải viết mã từ đầu.
 Các nhà phát triển có thể dễ dàng sử dụng Python với các
ngơn ngữ lập trình phổ biến khác như Java, C và C++.
 Cộng đồng Python tích cực hoạt động bao gồm hàng triệu
nhà phát triển nhiệt tình hỗ trợ trên tồn thế giới. Nếu gặp
phải vấn đề, bạn sẽ có thể nhận được sự hỗ trợ nhanh
chóng từ cộng đồng.

 Trên Internet có rất nhiều tài nguyên hữu ích nếu bạn
muốn học Python. Ví dụ: bạn có thể dễ dàng tìm thấy
video, chỉ dẫn, tài liệu và hướng dẫn dành cho nhà phát
triển.
 Python có thể được sử dụng trên nhiều hệ điều hành máy
tính khác nhau, chẳng hạn như Windows, macOS, Linux và
Unix.

17


2.2.PHẦN MỀM GOOGLE COLAB TRONG PHÂN
TÍCH DỮ LIỆU
2.2.1.GOOGLE COLAB LÀ GÌ?
Colaboratory hay cịn gọi là Google Colab, là một sản phẩm từ
Google Research, nó cho phép thực thi Python trên nền tảng
đám mây, đặc biệt phù hợp với Data analysis, machine learning
và giáo dục.
Colab không cần yêu cầu cài đặt hay cấu hình máy tính, mọi
thứ có thể chạy thơng qua trình duyệt, bạn có thể sử dụng tài
ngun máy tính từ CPU tốc độ cao và cả GPUs và cả TPUs đều
được cung cấp cho bạn.
Sử dụng Google Colab có những lợi ích ưu việt như: sẵn sàng
chạy Python ở bất kỳ thiết bị nào có kết nối Internet mà khơng
cần cài đặt, chia sẻ và làm việc nhóm dễ dàng, sử dụng miễn
phí GPU cho các dự án về AI.

2.2.2.PYTHON & GOOGLE COLAB TRONG PHÂN TÍCH DỮ
LIỆU
Google Colab là một sản phẩm của Google Research cho phép

người dùng thực thi Python code thơng qua trình duyệt web mà
khơng cần trải qua các bước cài đặt phức tạp, đặc biệt là nó
hồn tồn miễn phí với tất cả người dùng. Google Colab phù
hợp cho mục đích phân tích dữ liệu, máy học (machine
learning) và giáo dục. Bạn chỉ cần sở hữu một tài khoản Google
là đã có thể bắt đầu thực hành Python thơng qua Colab. Bạn có
thể sử dụng kết hợp Colab với các ứng dụng đám mây của
Google như Google Drive, Google Sheets cực kỳ tiện lợi và được
đồng bộ qua Internet mà không cần 1 máy tính cục bộ.
Tuy thấy có những phàn nàn về việc giao diện của Colab đã bị
thay đổi nhiều so với trải nghiệm Jupyter Notebook thuần
18



×