Tải bản đầy đủ (.docx) (36 trang)

Báo cáo đồ án mxh (1)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.14 MB, 36 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA KHOA HỌC VÀ KỸ THUẬT THÔNG TIN

BÁO CÁO ĐỒ ÁN MẠNG XÃ HỘI
Đề tài: Phân tích dữ liệu tennis

Giảng viên hướng dẫn: Nguyễn Thị Kim Phụng
Lớp: IS353.N22.HTCL
Sinh viên thực hiện:
Nguyễn Thanh Hiếu

MSSV: 20521328

Hồ Nguyễn Gia Huy

MSSV: 20521386

TP. Hồ Chí Minh – 01/06/2023


MỤC LỤC

I. GIỚI THIỆU
II. XÁC ĐỊNH BÀI TOÁN
III. DỮ LIỆU
1. Giới thiệu nguồn dữ liệu
2. Xử lý và phân tích dữ liệu
2.1. Làm sạch dữ liệu
2.2. Chuyển đổi dataframe thành đồ thị
IV. THUẬT TỐN PHÁT HIỆN CỘNG ĐỒNG
1. Thuật tốn Louvain


1.1. Thực thi bằng Gephi
1.2. Thực thi bằng Python
2. Thuật toán K-means
V. XẾP HẠNG
1. Thuật toán Pagerank
1.1. Thực thi bằng Gephi
1.2. Thực thi bằng Python
2. Thuật toán Closeness centrality
2.1. Thực thi bằng Gephi
2.2. Thực thi bằng Python
VI. CÁC ĐỘ ĐO
1. Thuật toán Eigenvector và Eigenvalue
1.1. Thực thi bằng Gephi
1.2. Thực thi bằng Python
2. Thuật toán Betweenness Centrality (node - edge)
2.1. Thực thi bằng Gephi
2.2. Thực thi bằng Python

3
3
4
4
5
5
5
9
9
9
11
23

30
30
30
31
33
33
33
34
35
35
36
37
37
37

1


NHẬN XÉT CỦA GIẢNG VIÊN
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………

…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………

…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………

2


Số điện thoại: 0382279474
Mail:

I. GIỚI THIỆU
Quần vợt là một môn thể thao phổ biến và hấp dẫn được yêu thích trên
tồn thế giới. Nó là một trị chơi cá nhân nơi hai người chơi cố gắng ghi điểm
bằng cách đánh bóng qua mạng lưới và đặt bóng vào khu vực khơng gian của
đối thủ. Trị chơi này địi hỏi sự linh hoạt, kỹ thuật và tập trung từ các vận
động viên.
Mơn học mạng xã hội có thể áp dụng để phân tích mạng xã hội trong
các giải đấu quần vợt bằng cách sử dụng bộ dữ liệu thống kê. Chúng ta có thể
sử dụng các thuật tốn phân cụm đồ thị để nhóm các vận động viên dựa trên
kết quả và hiệu suất thi đấu. Đồng thời, chúng ta có thể tính tốn các độ đo
mạng xã hội như trọng số cạnh, trung tâm và mật độ mạng để đánh giá sự
tương tác và quan hệ giữa các vận động viên.
II. XÁC ĐỊNH BÀI TOÁN
Input: Tập dữ liệu ban đầu trên nguồn dữ liệu Kaggle đã qua tiền xử lý dữ
liệu.
Ouput: Đưa ra độ đo, đưa ra cộng đồng phục vụ cho việc phân tích mạng xã
hội “ATP Tennis 2013 - 2023”


Để hiểu rõ hơn về các yếu tố và hiệu suất trong quần vợt, chúng ta sử
dụng dataset "ATP Tennis 2013 - 2023". Trong dataset này, chúng ta có thể tìm
thấy các thơng tin như tên giải đấu, loại sân thi đấu, các chỉ số về kết quả thi
đấu và thành tích cá nhân của từng vận động viên.
Thơng qua việc phân tích dữ liệu, chúng ta có thể xác định được hiệu
suất của mỗi vận động viên trong suốt sự nghiệp, đồng thời so sánh và phân
tích sự phát triển của các vận động viên quần vợt qua các năm.
Bằng cách sử dụng dataset này, các nhà quản lý, huấn luyện viên và các
nhà nghiên cứu có thể tìm hiểu sâu về các đặc điểm và mơ hình của quần vợt.
Họ có thể phân tích sự tương quan giữa các chỉ số, nhóm các vận động viên
dựa trên thành tích và đặc điểm thi đấu, đồng thời đưa ra những quyết định

3


thông minh để nâng cao hiệu suất và đạt được thành công trong các trận đấu
quần vợt.
III. DỮ LIỆU
1. Giới thiệu nguồn dữ liệu
Link dataset: ATP Tennis 2013 - 2023
Dữ liệu ATP Tennis 2013 - 2023 được cung cấp trên nền tảng Kaggle chứa
thông tin về các trận đấu của các vận động viên chơi quần vợt bao gồm các chỉ số
về kết quả thi đấu, thành tích cá nhân và sự phát triển theo thời gian. từ năm 2013
đến năm 2023.
Dữ liệu gồm 25363 dịng với 17 thuộc tính bao gồm:
STT

Thuộc tính


Kiểu dữ liệu

Mơ tả

1

Tournament

String

Tên của giải đấu tennis

2

Date

Date/Time

Ngày diễn ra trận đấu

3

Series

String

Tên của loạt giải tennis

4


Court

String

Loại sân thi đấu

5

Surface

String

Loại bề mặt sân thi đấu

6

Round

String

Vòng đấu của trận đấu

7

Best of

Number

Số set tối đa trong một trận đấu


8

Player_1

String

Tên của người chơi 1

9
10
11

Player_2
Winner
Rank_1

String
String
Number

12

Rank_2

Number

13

Pts_1


Number

Tên của người chơi 2
Tên của người chiến thắng
Xếp hạng của người chơi 1 tại thời
điểm đó
Xếp hạng của người chơi 2 tại thời
điểm đó
Điểm người chơi 1

14

Pts_2

Number

Điểm người chơi 2

15

Odd_1

Float

Tỷ lệ cược cho người chơi 1

16

Odd_2


Float

Tỷ lệ cược cho người chơi 2

17

Score

String

Kết quả của trận đấu gồm các điểm số
trong từng set

4


2. Xử lý và phân tích dữ liệu
2.1. Làm sạch dữ liệu
Kiểm tra và loại bỏ những thuộc tính bị thiếu dữ liệu của dataset.

Hình 1: Đọc dữ liệu từ file csv và loại bỏ dữ liệu trùng và rỗng
Chương trình sẽ thực hiện quá trình đọc dữ liệu từ một file csv và tạo thành
một bảng dữ liệu (dataframe). Sau đó, chương trình sẽ tiến hành làm sạch dữ liệu
bằng cách loại bỏ các dòng dữ liệu trùng lặp và dòng dữ liệu rỗng. Mục tiêu cuối
cùng là thu được một bộ dữ liệu hoàn chỉnh, chứa tổng cộng 25362 dịng và 2 cột.
Qua q trình này, chúng ta sẽ có một tập dữ liệu sạch và tiện lợi để thực hiện các
phân tích và xử lý dữ liệu tiếp theo.

5



2.2. Chuyển đổi dataframe thành đồ thị
● ĐỒ THỊ 2 PHÍA
Node: là Tên của người chơi 1 (Player_1) và Vịng đấu của từng trận đấu
(Round).
Edge: "Player_1 to Round": Biểu diễn mối quan hệ giữa việc người chơi
tham gia một vòng đấu trong giải đấu

Hình 2: Đưa dữ liệu từ dataframe vào đồ thị vô hướng
Đoạn code trên cho ta thấy rằng:
+ Có tổng cộng 668 người chơi 1
+ Có tổng cộng 8 vòng
+ Số cạnh là 25362
Code hiển thị đồ thị 2 phía

Hình 3: Code hiển thị đồ thị 2 phía

6


Hình 4: Đồ thị 2 phía
Đồ thị hai phía thể hiện mối quan hệ giữa các vòng đấu và người chơi tennis
thứ 1 thông qua các cạnh và đỉnh. Đỉnh bên trái của đồ thị sẽ đại diện cho một vòng
còn mỗi đỉnh bên phải trong đồ thị sẽ đại diện cho một người chơi thứ 1. Các cạnh
sẽ kết nối người chơi với vòng đấu mà họ tham gia.
Mối quan hệ này cho ta phân tích sự phụ thuộc giữa các người chơi và các
vòng đấu. Nếu một người chơi chiến thắng nhiều trận đấu, họ sẽ tiến xa trong giải
đấu và tham gia vào các vòng đấu cao hơn. Ngược lại, nếu người chơi thua, họ sẽ bị
loại khỏi giải đấu hoặc chỉ tham gia vào các vòng đấu thấp hơn. Phân tích đồ thị ta
có thể nhận biết những người chơi mạnh, những người chơi đi được nhiều vòng

nhất, những vòng đấu quan trọng và những mối tương quan phức tạp giữa chúng.

7


● ĐỒ THỊ 1 PHÍA
Node: Là tên của người chơi tennis (Player_1).
Edge: Những người chơi cùng tham gia các vòng đấu cùng nhau sẽ được nối
với nhau để tạo thành cạnh, ý nghĩa nói lên sự cạnh tranh giữa các vận động viên
với nhau khi tham gia vào vòng đấu.
Weight: Trọng số của cạnh là số lần mà các người chơi cùng tham gia vòng
đấu. Nếu người chơi tham gia nhiều vòng đấu, trọng số của cạnh tương ứng sẽ cao
hơn.

Hình 5: Code hiển thị đồ thị 1 phía

8


Hình 6: Đồ thị 1 phía
Như hình 6 ta có thể thấy rằng những node càng chụm lại thì có nghĩa những
node đó là những người chơi tham gia được nhiều vịng đấu nhất.

Hình 7: In dữ liệu đồ thị 1 phía sang file csv

9


Hình 8: Đồ thị 1 phía trên Gephi


IV. THUẬT TỐN PHÁT HIỆN CỘNG ĐỒNG
1. Thuật toán Louvain
1.1. Thực thi bằng Gephi
Ta có thể thấy được đồ thị chia ra làm 2 cụm tương đương với 2 màu.

10


Hình 9: Đồ thị bằng Louvain

Hình 10: Màu của các cụm

11


1.2. Thực thi bằng Python

Hình 11: Code chạy thuật tốn Louvain

Hình 12: Đồ thị phân cụm sử dụng thuật tốn Louvain

12


Hình 13: Danh sách các cụm và in từng cụm ra file excel
Số cụm: 2

Cụm thứ 1: ['Kotov P.', 'Nikles J.', 'Altamirano C.', 'Stebe C.M.', 'Zhang Ze.',
'Pecotic M.', 'Kuhn N.', 'Kudryavtsev A.', 'Tearney F.', 'Celikbilek A.', 'Saville L.',
'Andreozzi G.', 'Lestienne C.', 'Nedovyesov O.', 'Satral J.', 'Zayid M. S.', 'Blake J.',

'Kavcic B.', 'Arnaboldi A.', 'Diaz Acosta F.', 'Polmans M.', 'Fish M.', 'Malisse X.',
'Bossel A.', 'Nedovyesov A.', 'Meligeni Rodrigues F', 'Chappell N.', 'Krueger M.',
'Hoang A.', 'Sakharov G.', 'Zemlja G.', 'Krajicek A.', 'Gonzalez M.', 'Holt B.', 'Guez
D.', 'Levine J.', 'Statham J.', 'Alvarez Varona N.', 'Kirkin E.', 'Kuznetsov Al.',
'Korolev E.', 'Barrios M.', 'Guinard M.', 'Baker B.', 'Donski A.', 'Escobedo E.',
'Etcheverry T.', 'Shang J.', 'Pavic M.', 'Andreev A.', 'Hernych J.', 'Sidorenko A.',
'Cacic N.', 'Ginepri R.', 'Barrios Vera M.T.', 'Lazarov A.', 'Struff J-L.', 'Przysiezny
M.', 'Wu D.', 'Hossam K.', 'Kolar Z.', 'Huta Galung J.', 'Novikov D.', 'Naso G.',
'Fonseca J.', 'Machado R.', 'Rola B.', 'Blumberg W.', 'Villanueva G.', 'Harrison C.',
'Maden Y.', 'Ghem A.', 'Vilella Martinez M.', 'Soeda G.', 'Zayed M. S.', 'Gomez L.',
'Rodionov J.', 'Luz O.', 'Ymer E.', 'Safwat M.', 'Jasika O.', 'Ehrat S.', 'Marti Y.',
'Bailly G.', 'Ward A.', 'Kubler J.', 'Aragone J.', 'Riedi L.', 'Kern R.', 'Martin F.',
'Milojevic N.', 'Benchetrit E.', 'Eriksson M.', 'Peliwo F.', 'Lopez Villasenor G.',
'Mecir M.', 'Gicquel M.', 'Ojeda Lara R.', 'Beck A.', 'Uchiyama Y.', 'Reid M.', 'Bryde
T.', 'Mott B.', 'Mochizuki S.', 'De Greef A.', 'Jones G.', 'Klahn B.', 'Harris A.', 'Rubin
N.', 'Uchida K.', 'Ilhan M.', 'Petzschner P.', 'Williams R.', 'Khaddari H.', 'Gaio F.',
'Olaso G.', 'Bai Y.', 'Bozoljac I.', 'Sarmiento R.', 'Dancevic F.', 'Fils A.', 'Zeppieri G.',
'Ramanathan R.', 'Galovic V.', 'Lee D.H.', 'Galan D.', 'Wang J.', 'Clezar G.', 'Nam
13


J.S.', 'Smith J.P.', 'Pucinelli de Almeida M.', 'Ward J.', 'Agamenone F.', 'Sweeting
R.', 'Jubb P.', 'Tseng C.H.', 'Garanganga T.', 'Smethurst D.', 'Ouanna J.', 'Ramirez
C.', 'Amritraj P.', 'Mena F.', 'Mina G.', 'Phau B.', 'King E.', 'Volandri F.', 'Willis M.',
'Giannessi A.', 'Lapentti G.', 'Kwiatkowski T.S.', 'Gao X.', 'Svrcina D.', 'Gojo B.',
'Rufin G.', 'Oliel Y.', 'Mitchell B.', 'Pospisil J.', 'Mejia N.', 'Dubrivnyy A.', 'Zekic
M.', 'Sweeny D.', 'Setkic A.', 'Torebko P.', 'Schnur B.', 'Hemery C.', 'Roca Batalla
O.', 'Blancaneaux G.', 'Baldi F.', 'Zhang Ze', 'Munoz-De La Nava D.', 'Erler A.',
'Kadhe A.', 'Sarkissian A.', 'Miedler L.', 'Vavassori A.', 'Nedunchezhiyan J.',
'Kosakowski D.', 'Zhang Z.', 'Dellien H.', 'Torpegaard M.', 'Molleker R.', 'Cox D.',

'Gray A.', 'Kovacevic A.', 'King K.', 'Stebe C-M.', "O'Connell C.", 'Odesnik W.',
'Sorensen L.', 'Hsu Y.', 'Reister J.', 'Collarini A.', 'Ahouda A.', 'Quinzi G.', 'Biryukov
M.', 'Michon A.', 'Pavlasek A.', 'Reynolds B.', 'Arguello F.', 'Ciorcila P.', 'LopezPerez E.', 'Ficovich J.P.', 'Nielsen F.', 'Chidekh C.', 'Starace P.', 'Krstin P.', 'Moraing
M.', 'Devvarman S.', 'Brugues-Davi A.', 'Russell M.', 'Skugor F.', 'Corrie E.', 'Nagal
S.', 'Desein N.', 'Forejtek J.', 'Pavic A.', 'Ugo Carabelli C.', 'Venus M.', 'Furness E.',
'Bergs Z.', 'Takahashi Y.', 'Bemelmans R.', 'Gigounon G.', 'Garza D.', 'Whittington
A.', 'Holmgren A.', 'Kuzmanov D.', 'Hank T.', 'Ito T.', 'Quiroz R.', 'MenendezMaceiras A.', 'Tseng C. H.', 'Hajek J.', 'Linzer M.', 'Poljicak M.', 'Peniston R.',
'Gomez E.', 'Coppejans K.', 'De Jong J.', 'Skatov T.', 'Leshem E.', 'Rachidi Y.',
'Munoz De La Nava D.', 'Basso A.', 'Rehberg M.', 'Prizmic D.', 'Soderlund C.',
'Viola M.', 'Lokoli L.', 'Kozlov S.', 'Popko D.', 'Tien L.', 'King D.', 'Giustino L.',
'Nava E.', 'Samper-Montana J.', 'Wu T.L.', 'Inglot D.', 'Bellotti R.', 'Melzer G.',
'Kopriva V.', 'Misolic F.', 'Veic A.', 'Svajda Z.', 'Alund M.', 'Struvay E.', 'Roumane
R.', 'Ritschard A.', 'Kravchuk K.', 'Johansson J.', 'Serdarusic N.', 'Takeuchi K.',
'Dutra Da Silva D.', 'Rochus O.', 'Golubev A.', 'Safiullin R.', 'Capdeville P.', 'Hong
S.', 'Passaro F.', 'Ramirez-Hidalgo R.', 'Dustov F.', 'Bogomolov A.', 'Marcora R.',
'Baluda V.', 'Taberner C.', 'Shane R.', 'Li Z.', 'Cipolla F.', 'Escobar G.', 'Domingues
J.', 'Shimizu Y.', 'Sachko V.', 'Olivetti A.', 'Ouyang B.', 'Myneni S.', 'Gimeno Valero
C.', 'King-Turner D.', 'Ungur A.', 'Nardi L.', 'Sekulic M.', 'Berrettini J.', 'Rodriguez
Taverna S.', 'Authom M.', 'Horansky F.', 'Demoliner M.', 'Millot V.', 'Fratangelo B.',
'Mello R.', 'Gunneswaran P.', 'Cachin P.', 'Brouwer G.', 'Shelbayh A.', 'Delic M.',
'Hamou M.', 'Kohlschreiber P..', 'Vega Hernandez D.', 'Bourgue M.', 'Klein B.',
'Kachmazov A.', 'Stricker D.', 'Serra F.', 'Avidzba A.', 'Westerhof B.', 'Santillan A.',
'Teixeira M.', 'Klein L.', 'Lu Y.', 'Fischer M.', 'Aguilar J.', 'Masur D.', 'Souza J.',
'Watanuki Y.', 'Balleret B.', 'Tepavac M.', 'Napolitano S.', 'Zapata Miralles B.',
'Squire H.', 'Kunitsyn I.', 'Ilkel C.', 'Polansky P.', 'Fancutt T.', 'Gonzalez A.',

14


'Burquier G.', 'Machac T.', 'Riba P.', 'Mertl J.', 'Krawietz K.', 'Mcgee J.', 'Varillas

J.P.', 'Zuk K.', 'Piros Z.', 'Vukic A.', 'Silva F.F.', 'Hernandez A.', 'Moriya H.', 'Halys
Q.', 'Lindell C.', 'Buchanan C.', 'Eubanks C.', 'Topo M.', 'Menezes J.', 'Cazaux A.',
'Clarke J.', 'Bangoura S.', 'Shevchenko A.', 'Dutra Silva R.', 'Mektic N.', 'Vinciguerra
A.', 'Zhang Zh.', 'Grenier H.', 'Donati M.', 'Borges N.', 'Tirante T.A.', 'Vatutin A.',
'Arnaldi M.', 'Mukund S.', 'Couacaud E.', 'Ajdukovic D.', 'Wang C.', 'Rybakov A.',
'Eysseric J.', 'Chiudinelli M.', 'Muller A.', 'Darderi L.', 'Krutykh O.', 'Ferreira Silva
F.', 'Velotti A.', 'Diez S.', 'Lamasine T.', 'Prashanth V.', 'Mager G.', 'Zopp J.',
'Noguchi R.', 'Reyes-Varela M.A.', 'Borg L.', 'Medjedovic H.', 'Tyurnev E.',
'Pacheco Mendez R.', 'Hijikata R.', 'Bellier A.', 'Barton M.', 'Janvier M.', 'Rosenholm
P.', 'Reinberg E.', 'Catarina L.', 'Weintraub A.', 'Ouahab L.']
● Ý nghĩa cụm thứ 1: Số lượng tay vợt trong cụm này ở trong vòng 1
lớn bởi vì tất cả người chơi đều tham gia vịng 1, và sau đó lượng tay
vợt giảm dần khi vào đến chung kết và những vịng đấu phụ.
● Pivot:

Hình 14: Pivotchart cụm 1
Cụm thứ 2: ['Kokkinakis T.', 'Becker B.', 'Ofner S.', 'Groth S.', 'Giron M.',
'Stepanek R.', 'Basic M.', 'Tursunov D.', 'Gojowczyk P.', 'Hurkacz H.', 'Sousa P.',

15


'Carreno-Busta P.', 'Pospisil V.', 'Gasquet R.', 'Londero J.I.', 'Varillas J. P.', 'Estrella
Burgos V.', 'Alcaraz C.', 'Zverev A. ', 'Murray A.', 'Thiem D. ', 'Seppi A.',
'Hanfmann Y.', 'Lehecka J.', 'Kicker N.', 'Tsonga J.W.', 'Sugita Y.', 'Dolgopolov O.',
'Garin C.', 'Istomin D.', 'Cerundolo J.M.', 'Dodig I.', 'Benneteau J.', 'Lacko L.',
'Kamke T.', 'Korda S.', 'Ramos-Vinolas A.', 'Troicki V.', 'Wawrinka S.', 'Nishioka
Y.', 'Evans D.', 'Haase R.', 'Kudla D.', 'Herbert P.H', 'Carreno Busta P.', 'Gulbis E.',
'Marterer M.', 'Cressy M.', 'Medvedev D.', 'Kwon S.W.', 'Coria F.', 'Sock J.',
'Harrison R.', 'Bhambri Y.', 'Olivo R.', 'Kubot L.', 'Bedene A.', 'Baez S.', 'Davydenko

N.', 'Balazs A.', 'Popyrin A.', 'Federer R.', 'Pella G.', 'Shapovalov D.', 'Delbonis F.',
'Galan D.E.', 'Matosevic M.', 'Bautista R.', 'Khachanov K.', 'Auger-Aliassime F.',
'Kukushkin M.', 'Molcan A.', 'Rune H.', 'Broady L.', 'Stakhovsky S.', 'Klizan M.',
'Ebden M.', 'Musetti L.', 'Mathieu P.H.', 'Brands D.', 'Anderson K.', 'Shelton B.',
'Draper J.', 'Purcell M.', 'Berrettini M.', 'Sinner J.', 'Nishikori K.', 'Querrey S.',
'Berdych T.', 'Bolelli S.', 'Mcdonald M.', 'Wolf J.J.', 'Norrie C.', 'Sonego L.',
'Youzhny M.', 'Van De Zandschulp B.', 'Kovalik J.', 'Cerundolo F.', 'Melzer J.',
'Cuevas P.', 'Robredo T.', 'Altmaier D.', 'Paul T.', 'Roger-Vasselin E.', 'Marchenko
I.', 'Coric B.', 'Wu Y.', 'Jung J.', 'Mayer L.', 'De Minaur A.', 'Kuznetsov An.', 'Raonic
M.', 'Ramos A.', 'Falla A.', 'De Schepper K.', 'Majchrzak K.', 'Basilashvili N.',
'Griekspoor T.', 'Del Potro J.M.', 'Rosol L.', 'Lorenzi P.', 'Monteiro T.', 'Djokovic N.',
'Cervantes I.', 'Ruud C.', 'Gerasimov E.', 'Ferrer D.', 'Carballes Baena R.', 'Bellucci
T.', 'Baghdatis M.', 'Brown D.', 'De Bakker T.', 'Nadal R.', 'Mayer F.', 'Ruusuvuori
E.', 'Otte O.', 'Martinez P.', 'Verdasco F.', 'Berankis R.', 'Lajovic D.', 'Davidovich
Fokina A.', 'Van Rijthoven T.', 'Lu Y.H.', 'Bolt A.', 'Montanes A.', 'Vanni L.',
'Tsitsipas S. ', 'Gaston H.', 'Sousa J.', 'Harris L.', 'Fucsovics M.', 'Martin A.', 'Mmoh
M.', 'Chardy J.', 'Koepfer D.', 'Munar J.', 'Djere L.', 'Ivashka I.', 'Fognini F.',
'Gabashvili T.', 'Monaco J.', 'Granollers M.', 'Thiem D.', 'Ram R.', 'Sijsling I.', 'Haas
T.', 'Thompson J.', 'Bautista Agut R.', 'Haider-Maurer A.', 'Laaksonen H.', 'Dimitrov
G.', 'Struff J.L.', 'Mannarino A.', 'Federer R. ', 'Chung H.', 'Gombos N.', 'Herbert
P.H.', 'Smyczek T.', 'Darcis S.', 'Petrovic D.', 'Nalbandian D.', 'Nieminen J.',
'Nakashima B.', 'Goffin D.', 'Kecmanovic M.', 'O Connell C.', 'Trungelliti M.',
'Robert S.', 'Seyboth Wild T.', 'Monfils G.', 'Jarry N.', 'Almagro N.', 'Daniel T.',
'Gimeno-Traver D.', 'Jaziri M.', 'Bachinger M.', 'Lopez F.', 'Zverev A.', 'Karatsev A.',
'Kohlschreiber P.', 'Schwartzman D.', 'Medvedev D. ', 'Garcia-Lopez G.', 'Ymer M.',
'Caruso S.', 'Albot R.', 'Janowicz J.', 'Donaldson J.', 'Bagnis F.', 'Tabilo A.', 'Copil
M.', 'Simon G.', 'Duckworth J.', 'Berlocq C.', 'Zverev M.', 'Johnson S.', 'Paire B.',
'Elias G.', 'Sandgren T.', 'Donskoy E.', 'Novak D.', 'Hewitt L.', 'Sela D.', 'Travaglia

16



S.', 'Fabbiano T.', 'Vesely J.', 'Tomic B.', 'Cilic M.', 'Bonzi B.', 'Barrere G.', 'Rublev
A.', 'Moutet C.', 'Hanescu V.', 'Zeballos H.', 'Bublik A.', 'Brooksby J.', 'Berrer M.',
'Cecchinato M.', 'Giraldo S.', 'Tiafoe F.', 'Humbert U.', 'Rinderknech A.', 'Pouille L.',
'Krajinovic F.', 'Muller G.', 'Dzumhur D.', 'Berrettini M. ', 'Kyrgios N.', 'Millman J.',
'Fritz T.', 'Andujar P.', 'Huesler M.A.', 'Tipsarevic J.', 'Opelka R.', 'Mahut N.',
'Young D.', 'Edmund K.', 'Karlovic I.', 'Tsitsipas S.', 'Llodra M.', 'Isner J.']
● Ý nghĩa cụm thứ 2: Số lượng tay vợt trong cụm này ở trong vịng 1
lớn bởi vì tất cả người chơi đều tham gia vòng 1, và sau đó lượng tay
vợt giảm dần khi vào đến chung kết và những vịng đấu phụ. Ở đây
khơng có tay vợt nào tham gia Round Robin
● Pivot:

Hình 15: Pivotchart cụm 2
2. Thuật tốn K-means
2.1. Thực thi bằng Gephi
Ta có thể thấy được đồ thị chia ra làm 3 cụm tương đương với 3 màu.

17


Hình 16: Đồ thị bằng K-means

Hình 16: Màu của các cụm

18


2.2. Thực thi bằng Python


Hình 17: Code chạy thuật tốn K-means và xuất ra file excel từng cụm

Hình 18: Đồ thị K-means
Nhóm 1: ['Kotov P.', 'Kokkinakis T.', 'Becker B.', 'Nikles J.', 'Altamirano C.',
'Ofner S.', 'Groth S.', 'Giron M.', 'Stebe C.M.', 'Zhang Ze.', 'Stepanek R.', 'Pecotic
M.', 'Kuhn N.', 'Basic M.', 'Tursunov D.', 'Gojowczyk P.', 'Kudryavtsev A.', 'Tearney
F.', 'Celikbilek A.', 'Hurkacz H.', 'Saville L.', 'Sousa P.', 'Andreozzi G.', 'Lestienne
C.', 'Nedovyesov O.', 'Satral J.', 'Carreno-Busta P.', 'Zayid M. S.', 'Blake J.', 'Kavcic

19



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×