Tải bản đầy đủ (.pdf) (34 trang)

Môn học XÁC SUẤT VÀ THỐNG KÊ ĐỀ TÀI DỰ ĐOÁN ĐỘ NHÁM CỦA SẢN PHẨM IN 3D

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.16 MB, 34 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<small>Chương trình kỹ sư chất lượng cao Việt Pháp</small>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

Leader: Đỗ Xuân Huy - huy.doxuan991@ hcmut.edu.vn

<small>Bảng 1: TỈ LỆ ĐÓNG GÓP CỦA CÁC THÀNH VIÊN TRONG NHÓM</small>

STT Họ và Tên MSSV Nhận xét và cho điểm

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

1GIỚI THIỆU BỘ DỮ LIỆU. . . .1

1.1Mô tả dữ liệu . . . .1

1.2Giới thiệu các biến . . . .1

2CƠ SỞ LÝ THUYẾT. . . .2

2.1Hồi quy bội. . . .2

2.2Phương pháp kiểm định Shapiro-Wilk. . . .6

2.3Phương pháp kiểm định Breusch-Pagan. . . .7

3PHÂN TÍCH VÀ TRỰC QUAN HĨA DỮ LIỆU.8 3.1Nhập file dữ liệu vào RStudio . . . .8

3.2Kiểm tra dữ liệu . . . .8

3.3Thống kê mô tả . . . .9

3.4Trực quan hóa dữ liệu . . . .9

4TRIỂN KHAI MƠ HÌNH HỒI QUY. . . .18

4.1Tiền kiểm tra . . . .18

4.2Hồi quy đa biến . . . .21

5BÀN LUẬN VÀ MỞ RỘNG. . . .25

5.1Hồi quy bội . . . .25

5.2Hồi quy đa thức . . . .26

6CODE VÀ CƠ SỞ DỮ LIỆU. . . .29

7TỔNG KẾT. . . .30

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

1GIỚI THIỆU BỘ DỮ LIỆU

<small>1.1Mô tả dữ liệu</small>

Tên bộ dữ liệu: Bộ dữ liệu Máy in 3D dành cho Kỹ sư cơ khí.

Nguồn: Bộ dữ liệu được lấy từ website kaggle.com và xuất phát từ nghiên cứu của khoa Cơ khí thuộc Đại học TR/Selcuk.

Mục tiêu: Mục tiêu: Mục tiêu của nghiên cứu này là phân tích mức độ ảnh hưởng của các thông số cài đặt của máy in 3D đến độ nhám của sản phẩm. Cụ thể, nhóm sẽ xác định mối quan hệ, giữa các thông số kỹ thuật in (độ cao của lớp in, độ dày của tường, nhiệt độ đầu phun,...) và các thuộc tính của sản phẩm in hồn thiện là độ nhám.

Mục đích: Việc phân tích bộ dữ liệu này giúp xác định các yếu tố quan trọng nhất ảnh hưởng tới độ nhám của sản phẩm. Từ đó hỗ trợ cho việc đề xuất các giải pháp để tối ưu hóa q trình in 3D và đưa ra quyết định trong việc lựa chọn thông số kỹ thuật cho các dự án in cụ thể.

Số lượng mẫu thu thập: 51 Số lượng các biến (tham số): 12

<small>1.2Giới thiệu các biến</small>

Trong bài tập lớn này, nhóm sẽ sử dụng R và R Studio để làm cơng cụ vàmơi trường cho việc phân tích dữ liệu

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<small>Tên biếnÝ nghĩaPhạm ViĐơn vịlayer_heightĐộ cao của lớp in 3Dx = {0.02, 0.06, 0.1, 0.15}mmwall_thicknessĐộ dày của bức tườnginfill_patternLoại cấu trúc dùng để lấp</small>

<small>đầy bên trong mô hình {0</small>

<small>2.1Hồi quy bội</small>

<small>2.1.1 Mơ hình hồi quy bội</small>

Mơ hình hồi quy bội : là mơ hình hồi quy trong đó biến phụ thuộc Y phụ thuộc vào <small>(k − 1)</small> biến độc lập <small>X</small><sub>1</sub><small>, X</small><sub>2</sub><small>, .., X</small><sub>kk</sub> có dạng như sau :

Hàm hồi quy tổng thể : <small>E(Y |X</small><sub>1</sub><small>, .., X</small><sub>k</sub><small>) = β</small><sub>1</sub><small>+ β</small><sub>1</sub><small>X</small><sub>1</sub><small>+ β</small><sub>2</sub><small>X</small><sub>2</sub><small>+ . . . + β</small><sub>k</sub><small>X</small><sub>k</sub>

Mơ hình hồi quy tổng thể <small>Y = β1+ β1X1+ β2X2+ . . . + β</small><sub>k</sub><small>X</small><sub>k</sub> <small>+ ϵ• ϵ</small> là sai số ngẫu nhiên

<small>• β1</small> là hệ số tự do, bằng giá trị trung bình của Y khi <small>X</small><sub>j</sub> <small>= 0</small>

<small>• βj</small> là hệ số hồi quy riêng (hay hệ số góc), thể hiện ảnh hưởng của riêng từng biến độc lập <small>X</small><sub>j</sub> lên trung bình của Y khi các biến khác được giữ không đổi. Cụ thể, khi Xj tăng hoặc giảm 1 đơn vị, trong điều kiện các biến độc lập khác khơng đổi, thì Y trung bình sẽ thay đổi <small>β</small><sub>j</sub> đơn vị. Có thể nhận thấy ba khả năng có thể xảy ra đối với các hệ số góc:

<small>• βj> 0</small> khi đó mối quan hệ giữa Y và Xj là ngược chiều, nghĩa là khi Xj tăng (hoặc giảm) trong điều kiện các biến độc lập khác khơng đổi thì Y sẽ giảm (hoặc tăng).

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<small>• βj= 0</small> có thể cho rằng giữa Y và <small>X</small><sub>j</sub>khơng có tương quan với nhau, cụ thể là Y có thể khơng phụ thuộc vào <small>X</small><sub>j</sub> hay là <small>X</small><sub>j</sub> không thực sự ảnh hưởng tới Y. Dựa vào kết quả ước lượng với một mẫu cụ thể, ta có thể đánh giá được mối quan hệ giữa biến phụ thuộc và các biến độc lập trong mơ hình một cách tương đối. Dù mơ hình có nhiều biến độc lập nhưng vẫn tồn tại những yếu tố tác động đến biến phụ thuộc nhưng không đưa vào mơ hình vì nhiều lý do (khơng có số liệu hoặc khơng muốn đưa vào). Do đó trong mơ hình vẫn tồn tại sai số ngẫu nhiên <small>ϵ</small>

đại diện cho các yếu tố khác ngoài các biến <small>X</small><sub>j</sub><small>(j = 2, 3, ..., k)</small> có tác động đến Y nhưng khơng đưa vào mơ hình như là biến số.

<small>2.1.2 Các giả thiết hồi quy bội</small>

Giả thuyết 1 : Việc ước lượng được dựa trên cơ sở mẫu ngẫu nhiên.

Giả thuyết 2 : Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị<small>(X</small><sub>2i</sub><small>, X</small><sub>3i</sub><small>, ..., X</small><sub>ki</sub> <small>= 0)</small>. E<small>(Y |X</small><sub>2i</sub><small>, X</small><sub>3i</sub><small>, . . . , X</small><sub>ki</sub> <small>) = 0</small>

Giả thuyết 3 : Phương sai của sai số ngẫu nhiên tại các giá trị <small>(X</small><sub>2i</sub><small>, X</small><sub>3i</sub><small>, . . . , X</small><sub>ki</sub><small>)</small>

đều bằng nhau.

Từ giả thiết 2 và 3 ta có thể nói sai số ngẫu nhiên <small>ϵ</small> tuân theo phân phối chuẩn. Giả thuyết 4 : Giữa các biến độc lập Xj khơng có quan hệ cộng tuyến hồn hảo, nghĩa là không tồn tại hằng số <small>λ</small><sub>2</sub><small>, λ</small><sub>3</sub><small>, .., λ</small><sub>k</sub> không đồng thời bằng 0 sao cho:

<small>X</small><sub>2</sub><small>λ</small><sub>2</sub><small>+ X</small><sub>3</sub><small>λ</small><sub>3</sub><small>+ .. + X</small><sub>K</sub><small>λ</small><sub>k</sub> <small>= 0</small>

Có thể nhận thấy nếu giữa các biến <small>X</small><sub>j</sub><small>(j = 2, 3, .., k)</small> có quan hệ cộng tuyến hồn hảo thì sẽ có ít nhất một trong các biến này sẽ suy ra được từ các biến cịn lại. Do đó, giả thiết 4 được đưa ra để loại trừ tình huống này.

<small>2.1.3 Phương pháp ước lượng mơ hình hồi quy bội – Phương pháp bình phươngnhỏ nhất (OLS)</small>

Sau khi xây dựng và tìm hiểu ý nghĩa của các hệ số hồi quy trong mơ hình, vấn đề tiếp theo ta quan tâm là làm sao để có được các ước lượng đáng tin cậy cho các hệ số <small>β</small><sub>j</sub> này.

Cũng như với mơ hình hồi quy hai biến, ta sẽ sử dụng phương pháp bình phương nhỏ nhất (OLS) để ước lượng các hệ số trong mơ hình hồi quy k biến.

Xét mơ hình k biến: <small>Y = β</small><sub>1</sub><small>+ β</small><sub>1</sub><small>X</small><sub>1</sub><small>+ β</small><sub>2</sub><small>X</small><sub>2</sub><small>+ . . . + β</small><sub>k</sub><small>X</small><sub>k</sub> <small>+ ϵ</small>

Giả sử có một mẫu quan sát với giá trị thực tế là <small>(Y</small><sub>1</sub><small>, X</small><sub>2i</sub><small>, X</small><sub>3i</sub><small>, . . . , X</small><sub>ki</sub><small>)</small> với <small>(i =1, 2, . . . , n)</small>. Ta sẽ sử dụng thông tin từ mẫu để xây dựng các ước lượng cho các hệ số <small>β</small><sub>j</sub><small>(j = 1, 2, . . . , k)</small>, ký hiệu là c<small>β</small><sub>j</sub> <small>(j = 1, 2, . . . , k)</small>.

Từ các giá trị ước lượng này có thể viết thành hàm hồi quy mẫu như sau:

<small>Y =β</small>b<sub>1</sub><small>+β</small>b<sub>1</sub> <small>.X</small><sub>2</sub><small>+ . . . +β</small>d<sub>K</sub> <small>. X</small><sub>k</sub>

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

Tại mỗi quan sát i, hàm hồi quy mẫu được viết thành:

Tương tự như mơ hình hồi quy hai biến, phương pháp OLS nhằm xác định các giá trị b<small>β</small><sub>j</sub> <small>(j = 1, 2, . . . , k)</small> sao cho tổng bình phương các phần dư là bé nhất: 22

Với điều kiện số quan sát trong mẫu lớn hơn số hệ số hồi quy cần ước lượng và giả thiết 4 được thỏa mãn thì hệ phương trình trên sẽ có nghiệm duy nhất. Việc giải hệ phương trình khá dễ dàng qua các phầm mềm thống kê nếu số biến không quá lớn. Các giá trị ước lượng bằng phương pháp OLS dựa trên số liệu mẫu cụ thể được xem như là các ước lượng điểm của các hệ số trong tổng thể.

Với mơ hình hồi quy bội (hồi quy k biến với k > 2), việc giải hệ phương trình để tìm các ước lượng hệ số<small>j (j = 1, 2, 3. . . k)</small> sẽ trở nên khó khăn hơn so với mơ hình hồi quy 2 biến do đó ta sẽ có được các kết quả này với sự giúp của các phần mềm thống kê.

Từ kết quả ước lượng từ phương pháp OLS, ta có thể khai thác các thông tin để đánh giá tác động của biến độc lập đối với sự thay đổi của biến phụ thuộc thông qua ý nghĩa các hệ số hồi quy.

Khi các giả thiết từ 1 đến 4 thỏa mãn thì các ước lượng thu được từ phương pháp OLS là ước lượng tuyến tính, khơng chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính khơng chệch. Hay nói một cách khác, nếu giả thiết từ 1 đến 4 được thỏa mãn thì ước lượng OLS là ước lượng tốt nhất trong lớp các ước lượng tuyến tính khơng chệch.

<small>2.1.4 Đánh giá mức độ phù hợp mơ hình hồi quy bội</small>

Khi đánh giá một mơ hình dựa trên số liệu mẫu, nếu chỉ quan tâm đến các ước lượng hệ số và độ lệch chuẩn của nó thì chưa đầy đủ. Có một con số cũng góp phần khơng nhỏ khi đánh giá chất lượng mơ hình đó là hệ số xác định.

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

Sau khi ước lượng được mơ hình hồi quy trong một khoảng tin cậy, ta muốn biết hàm hồi quy mẫu phù hợp với số liệu mẫu đến mức nào. Có thể đánh giá điều đó

SST (Sum Of Square Total ): Tổng bình phương độ lệch tồn phần. Đo mức độ biến động các giá trị quan sát<small>Y</small><sub>i</sub> xung quanh các giá trị trung bình của chính mẫu. SST được tạo bởi hai thành phần: SST = SSE + SSR.

SSE (Sum Of Square For Error): Tổng bình phương phần dư do sự chệnh lệch giữa từng giá trị quan sát với giá trị dự đoán (ước lượng).

SSR (Sum Of Square in Regression): Tổng bình phương độ lệch phần hồi quy, là sai số do khác biệt giữa đường hồi quy mẫu và trung bình của Y.

Giá trị <small>R</small><sup>2</sup> là mối tương quan bình phương giữa giá trị kết quả thực tế và giá trị. Nó giải thích trong 100% sự biến động của Y so với trung bình của nó thì có bao nhiêu % do các biến X gây ra. Hay tỉ lệ (phần trăm) sự thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập trong mơ hình, Mơ hình càng tốt thì chỉ số càng cao.

Ý nghĩa của hệ số xác định bội. Với mơ hình hồi quy k biến, <small>R</small><sup>2</sup> có ý nghĩa như sau:

<small>R</small><sup>2</sup> là tỷ lệ (hay tỷ lệ phần trăm) sự thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập trong mơ hình.

Với điều kiện <small>0 ≤ R</small><sup>2</sup> <small>≤ 1</small> , ta có hai trường hợp đặc biệt đó là:

<small>• R2= 1</small> nghĩa là 100% sự thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập trong mơ hình.

<small>• R2= 0</small> nghĩa là các biến độc lập khơng giải thích được một chút nào đối với sự thay đổi của biến phụ thuộc.

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

Rõ ràng, trong thực tế, khi xem xét các mối quan hệ giữa các biến thơng qua các mơ hình hồi quy thì <small>R</small><sup>2</sup> thường nằm trong khoảng <small>(0, 1)</small> nhiều hơn.

Một tính chất quan trọng của <small>R</small><sup>2</sup> là nó sẽ tăng khi ta đưa thêm biến độc lập vào mô hình. Dễ dàng thấy rằng SST khơng phụ thuộc vào số biến giải thích trong mơ hình nhưng SSR lại giảm. Do đó, nếu tăng số biến biến độc lập trong mơ hình thì

<small>R</small><sup>2</sup> cũng tăng. Như vậy, việc đưa thêm một biến số bất kỳ vào mơ hình nói chung sẽ làm gia tăng <small>R</small><sup>2</sup>, khơng kể nó có giúp giải thích thêm cho biến phụ thuộc hay khơng. Điều này ngụ ý rằng <small>R</small><sup>2</sup> chưa phải là thước đo tốt khi muốn so sánh các mơ hình với số biến khác nhau.

Để giải quyết vấn đề thiếu sót này, ta xem xét khái niệm <small>R</small><sup>2</sup> hiệu chỉnh, ký hiệu là và được định nghĩa như sau:

<small>R</small><sup>2</sup> <small>= 1 − (1 − R</small><sup>2</sup><small>)</small><sup>(n−1)</sup><sub>(n−k)</sub>

Ta thấy rằng khi số biến độc lập<small>(k − 1)</small> tăng lên thì <small>R</small><sup>¯</sup><small>2</small> cũng tăng lên nhưng tăng chậm hơn so với <small>R</small><sup>2</sup>.

Giá trị <small>R</small><sup>¯</sup><small>2</small> thường được sử dụng thay<small>R</small><sup>2</sup> khi so sánh hai mơ hình có cùng biến phụ thuộc nhưng số lượng biến độc lập khác nhau.

Trong thực tế, khi muốn đánh giá sự phù hợp của mơ hình thì<small>R</small><sup>¯</sup><small>2</small> hơn vì <small>R</small><sup>2</sup> rất dể đưa ra một kết quả lạc quan quá mức cho sự phù hợp của mơ hình hồi quy khi số lượng biến giải thích lớn hơn nhiều số lượng biến ta quan sát. Tuy nhiên, ta khơng thể nói trong mọi bài toán <small>R</small><sup>¯</sup><small>2</small> đều đưa ra mức độ phù hợp của mơ hình hồi quy một cách chính xác nhất mà phải dựa vào đặc trưng của từng bài tốn cụ thể mà thực hiện tính tốn sao cho phù hợp.

<small>2.2Phương pháp kiểm định Shapiro-Wilk</small>

Kiểm định Shapiro-Wilk có thể được sử để xác định xem một mẫu có phân bố bình thường/phân bố chuẩn hay khơng.

- Bước 1: Đặt giả thuyết:

<small>•</small> Giả thuyết <small>H</small><sub>0</sub> (giả thuyết khơng): Dữ liệu tuân theo phân phối chuẩn.

<small>•</small> Giả thuyết<small>H</small><sub>1</sub>(giả thuyết thay thế): Dữ liệu không tuân theo phân phối chuẩn. - Bước 2: Sử dụng thuật toán để kiểm định

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<small>0 < w < 1</small> ; w tương tự như hệ số tương quan

<small>•</small> Nếu giá trị p (p-value) nhỏ hơn ngưỡng ý nghĩa <small>α</small> (thường là 0.05), ta bác bỏ giả thuyết <small>H</small><sub>0</sub> và kết luận rằng dữ liệu khơng tn theo phân phối chuẩn.

<small>•</small> Ngược lại, nếu giá trị p lớn hơn ngưỡng ý nghĩa <small>α</small>, ta không đủ bằng chứng để bác bỏ giả thuyết <small>H</small><sub>0</sub> và kết luận rằng dữ liệu tuân theo phân phối chuẩn.

<small>2.3Phương pháp kiểm định Breusch-Pagan</small>

Phương pháp kiểm định Breusch-Pagan là một phương pháp kiểm định giả thiết thống kê về phương sai sai số thay đổi trong mơ hình hồi quy tuyến tính cổ điển.

<small>•</small> Giả thiết <small>H</small><sub>0</sub>: Phương sai sai số khơng thay đổi

<small>•</small> Giả thiết <small>H</small><sub>1</sub>: là phương sai sai số thay đổi

Đầu tiên ta tìm hàm hồi quy cho mơ hình <small>Y</small><sup>ˆ</sup><sub>i</sub> <small>= ˆβ</small><sub>1</sub><small>+ ˆβ</small><sub>2</sub><small>X</small><sub>2i</sub><small>+ . . . + ˆβ</small><sub>k</sub><small>X</small><sub>ki</sub> sau đó tính tốn bình phương của các phần dư <small>e</small><sup>2</sup><sub>i</sub> <small>= (Y</small><sub>i</sub><small>− ˆY</small><sub>i</sub><small>)</small><sup>2</sup>. Tiếp theo là tìm hàm hồi quy mới với <small>e</small><sup>2</sup><sub>i</sub> là biến phụ thuộc:

<small>e</small><sup>2</sup><sub>i</sub> <small>= a1+ a2x2i+ . . . + a</small><sub>k</sub><small>x</small><sub>ki</sub><small>+ vi→ R</small><sup>2</sup><sub>e</sub>. Lúc này, ta có giả thuyết <small>H0</small>: <small>a2= a3= . . . = a</small><sub>k</sub> <small>= 0</small>

Tính tốn giá trị quan sát:<small>F =</small> <sup>R</sup><sup>2</sup>

<small>1− R2×</small> <sub>k−1</sub><sup>n−k</sup> hoặc <small>LM = nR</small><sup>2</sup><sub>e</sub> <small>> χ</small><sup>2</sup><sub>e</sub><small>(k − 1)</small>

Nếu có quá nhiều biến độc lập nhưng số quan sát lại hạn chế thì ta có thể sử dụng các biến được dự đốn<small>Y</small><sup>ˆ</sup><small>i= ˆβ1+ ˆβ2X2i+ . . . + ˆβ</small><sub>k</sub><small>X</small><sub>ki</sub> như một dạng thay thế của kiểm định này. Khi đó:

<small>e</small><sup>2</sup><sub>i</sub> <small>= a</small><sub>1</sub><small>+ a</small><sub>2</sub><small>Y</small><sup>ˆ</sup><sub>i</sub><small>+ v</small><sub>i</sub> <small>→ R2</small>

<small>e</small> với <small>H</small><sub>0</sub> <small>: a</small><sub>2</sub> <small>= 0</small>

Tính tốn giá trị quan sát: <small>F =</small> <sup>R</sup><sup>2</sup>

<small>1− R2× n − k</small> hoặc <small>LM = nR</small><sup>2</sup><sub>e</sub> <small>> χ</small><sup>2</sup><sub>e</sub>(1) Tiếp đến ta tìm p-value dựa trên giá trị quan sát và cuối cùng là kết luận:

<small>•</small> Nếu giá trị p (p-value) nhỏ hơn ngưỡng ý nghĩa <small>α</small>, ta bác bỏ giả thuyết <small>H</small><sub>0</sub> và kết luận rằng sai sai số thay đổi.

<small>•</small> Ngược lại, nếu giá trị p lớn hơn ngưỡng ý nghĩa <small>α</small>, ta không đủ bằng chứng để bác bỏ giả thuyết<small>H</small><sub>0</sub> và có thể kết luận rằng sai sai số khơng thay đổi.

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

3PHÂN TÍCH VÀ TRỰC QUAN HÓA DỮ LIỆU

<small>3.1Nhập file dữ liệu vào RStudio</small>

data <small>←</small> read.csv("D:/archive (1)/data.csv") với địa chỉ file là địa chỉ lưu project trong máy tính cá nhân.

<small>3.2Kiểm tra dữ liệu</small>

Đầu tiên, ta sẽ kiểm tra xem dữ liệu có phù hợp cho việc thống kê chưa để đảm bảo không xảy ra sai sót khi phân tích dữ liệu. Kiểm tra dữ liệu từng cột và toàn bộ:

Như vậy, dữ liệu cần phân tích khơng có giá trị rộng (NA). Ta có thể tiếp tục các bước tiếp theo.

Ta sẽ phải kiểm tra cấu trúc của khung dữ liệu, xem một số hàng đầu tiên của dữ liệu, và lấy một bản tóm tắt thống kê của dữ liệu. Sử dụng str(date), head(data), summary(data) để xem xét tổng quan về bộ dữ liệu khi được nhập vào phần mềm R. Str(data) dùng để xem khung dữ liệu ban đầu, head(data) dùng để xem một số hàng đầu tiên, và summary(data) dùng để tóm tắt thống kê dữ liệu.

Vì sau khi thử nghiệm thì kết quả của các hàm str() và head() trả về là giống với bộ dữ liệu cho nên chúng ta sẽ chỉ xem xét kết quả của hàm summary() để từ đó đưa ra được một số đánh giá sơ bộ.

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

<small>3.4Trực quan hóa dữ liệu</small>

Cả hai biến đều thể hiện mức độ tập trung và phân tán khác nhau trong dữ liệu, với wall_thickness tập trung chặt chẽ quanh một giá trị cụ thể, cho thấy một quy trình sản xuất có sự kiểm sốt cao và chuẩn hóa. Mặt khác, layer_height có phân phối rộng hơn và đa đỉnh, phản ánh sự đa dạng trong quy trình sản xuất hoặc thiết kế sản phẩm. Đường KDE mượt mà của cả hai biến nêu bật những khác biệt này và cho thấy rằng trong khi chiều cao lớp có thể được kiểm sốt một cách nhất quán, độ dày tường lại có sự biến thiên lớn hơn, có thể do sự lựa chọn kỹ thuật hoặc yêu cầu thiết kế đa dạng. Những phát hiện này có thể hướng tới việc xác định các cơ hội cải tiến trong quy trình kiểm sốt chất lượng và tối ưu hóa thiết kế sản phẩm.

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

Biểu đồ histogram với KDE cho<small>inf ill</small>_<small>density</small> và<small>nozzle</small>_<small>temperature</small>cho thấy các đặc điểm phân phối khác nhau:

<small>•</small> Infill Density: Phân phối có dạng đa đỉnh, với hai giá trị mật độ đổ đầy nổi bật, phản ánh việc sử dụng hai chuẩn mật độ thông dụng trong quy trình sản xuất. Điều này có thể liên quan đến việc áp dụng các tiêu chuẩn khác nhau tùy thuộc vào đặc tính hoặc yêu cầu cụ thể của sản phẩm.

<small>•</small> Nozzle Temperature: Có một phân phối lệch phải với một đỉnh chính, cho thấy một nhiệt độ đầu phun phổ biến được sử dụng nhiều hơn các giá trị khác. Sự giảm dần về bên phải có thể chỉ ra rằng việc sử dụng nhiệt độ cao hơn là ít phổ biến hoặc có thể bị hạn chế do các nguyên nhân kỹ thuật hoặc tiêu chuẩn an toàn.

Cả hai biểu đồ đều cung cấp thông tin quan trọng về các quyết định và chuẩn mực trong quy trình sản xuất, từ đó có thể đưa ra các khuyến nghị hoặc điều chỉnh để tối ưu hóa quy trình và cải thiện chất lượng sản phẩm.

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

Dựa trên các biểu đồ histogram và KDE cho <small>bed</small>_<small>temperature</small> và <small>print</small>_<small>speed</small>:

<small>•</small> Bed Temperature: Histogram cho thấy một sự tập trung rất cao của các quan sát ở khoảng nhiệt độ giường cụ thể, với ít biến đổi, điều này chỉ ra rằng nhiệt độ giường được kiểm soát nghiêm ngặt và có thể phản ánh một chuẩn mực hoặc thực hành tối ưu trong quá trình in. Điều này thường quan trọng để đảm bảo độ bám dính và chất lượng bản in.

<small>•</small> Print Speed: Phân phối tốc độ in phản ánh một mơ hình đặc biệt với hai đỉnh chính, cho thấy rằng có hai tốc độ in được ưa chuộng, có lẽ tương ứng với hai chế độ in khác nhau: một cho chất lượng cao (tốc độ chậm hơn) và một cho in nhanh. Đây có thể là một chỉ báo của việc lựa chọn tốc độ dựa trên các yêu cầu đặc biệt của quy trình in hoặc các tiêu chuẩn sản phẩm.

Cả hai chỉ báo đều rất quan trọng đối với việc hiểu và tối ưu hóa quy trình in 3D, nơi mà cả nhiệt độ giường và tốc độ in đều có ảnh hưởng đáng kể đến kết quả cuối cùng và hiệu suất in.

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

Dựa trên các biểu đồ histogram và KDE cho roughness và <small>tension</small>_<small>strength</small>:

<small>•</small> Roughness: Biểu đồ cho thấy phân phối của độ nhám có dạng gần đối xứng và tập trung chủ yếu quanh một khoảng giá trị, điều này có thể phản ánh một quy trình sản xuất ổn định với độ nhám bề mặt có sự biến thiên giới hạn. Sự phân bố này cũng cho thấy rằng độ nhám có xu hướng tập trung quanh một giá trị trung bình với một số biến thiên vừa phải.

<small>•</small> Tension Strength: Phân phối của sức căng có vẻ đa đỉnh, có thể chỉ ra rằng có sự biến đổi lớn hơn trong các giá trị sức căng, điều này có thể liên quan đến các loại vật liệu khác nhau hoặc các quy trình sản xuất đa dạng. Sự xuất hiện của nhiều đỉnh có thể liên quan đến các nhóm sản phẩm có yêu cầu đặc tính kỹ thuật khác nhau.

Cả hai chỉ số đều quan trọng cho việc đánh giá chất lượng và độ tin cậy của sản phẩm in 3D.

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

Dựa trên biểu đồ histogram và KDE cho <small>f an</small>_<small>speed</small> và <small>elongation</small>:

<small>•</small> Fan Speed: Phân phối cho thấy một xu hướng tăng liên tục khơng có đỉnh rõ ràng, điều này có thể báo hiệu rằng tốc độ quạt được sử dụng qua nhiều cài đặt khác nhau, hoặc rằng tốc độ quạt không bị giới hạn bởi các tham số cụ thể trong quy trình sản xuất. Điều này có thể phản ánh sự linh hoạt trong việc điều chỉnh tốc độ quạt để đáp ứng với các u cầu khác nhau của quy trình in 3D.

<small>•</small> Elongation: Phân phối có đỉnh cao và rộng, chỉ ra rằng giá trị kéo dài của vật liệu thường xuyên xảy ra trong một phạm vi hẹp. Điều này có thể là kết quả của quy trình sản xuất tốt với sự kiểm sốt chất lượng cao, đảm bảo tính đàn hồi và sức mạnh kéo của sản phẩm. Độ lệch mạnh về phía giá trị thấp có thể liên quan đến việc ít sản phẩm đạt đến sự kéo dài cực đại do giới hạn của vật liệu hoặc thiết kế.

Cả hai biểu đồ đều cung cấp cái nhìn sâu sắc về đặc tính kỹ thuật của sản phẩm và quy trình sản xuất, từ đó có thể rút ra những hiểu biết về cách các tham số này ảnh hưởng đến chất lượng cuối cùng và đặc tính cơ học của sản phẩm in 3D.

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

Nhìn vào biểu đồ và bộ dữ liệu, đây là nhận xét về hai biến định tính<small>inf ill</small>_<small>pattern</small>

và <small>material</small>:

<small>•</small> Infill Pattern: Dữ liệu cho thấy có hai mẫu đổ đầy chính được sử dụng -"grid" và "honeycomb". Cả hai đều phổ biến như nhau trong bộ dữ liệu này. Điều này có thể phản ánh sự ưa chuộng khơng rõ rệt cho một kiểu mẫu cụ thể, hoặc nó có thể cho thấy rằng lựa chọn mẫu đổ đầy phụ thuộc vào yêu cầu kỹ thuật cụ thể của từng đối tượng in 3D.

<small>•</small> Material: Có hai loại vật liệu được sử dụng là "abs" và "pla". Cả hai loại vật liệu này đều xuất hiện với tần suất tương đương nhau trong bộ dữ liệu, điều này cho thấy sự cân nhắc ngang nhau trong việc lựa chọn vật liệu cho các dự án in 3D. Sự chia đều này có thể cho thấy rằng cả hai vật liệu đều được ưa chuộng bởi các thuộc tính đặc biệt hoặc đơn giản là sự sẵn có của chúng. Từ biểu đồ, có vẻ như khơng có sự chênh lệch đáng kể về tần suất sử dụng giữa các mẫu đổ đầy hay giữa hai loại vật liệu, cho thấy rằng trong môi trường sản xuất hoặc thiết kế hiện tại, khơng có sự phân biệt rõ ràng về ưu tiên sử dụng. Điều này có thể quan trọng khi xem xét tác động của các yếu tố này đối với các đặc tính cụ thể như độ bền, thẩm mỹ, hoặc chi phí của sản phẩm in 3D.

</div>

×