Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.53 MB, 66 trang )
<span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">
<i>Thành phố Hồ Chí Minh, ngày 8 tháng 5 năm 2024,</i>
<b>DANH SÁCH THÀNH VIÊN</b>
</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3"><b>I. TỔNG QUAN DỮ LIỆU...5</b>
<b>II. KIẾN THỨC NỀN...6</b>
<b>A. HỒI QUY...6</b>
1. Mơ hình hồi quy tuyến tính bội...6
2. Ước lượng các tham số của mơ hình hồi quy tuyến tính bội...7
2.1. Hàm hồi quy tổng thể (PRF – Population Regression Function) 7 2.2. Hàm hồi quy mẫu (SRF - Sample Regression Function)...7
2.3. Phương pháp bình phương nhỏ nhất (OLS - Ordinary Least Square)8 2.3.1. Mơ hình hồi quy tuyến tính...8
2.3.2. Các giá trị của X được cố định trong việc lấy mẫu lặp lại.8 2.3.3. Phương sai của sai số không đổi...8
2.3.4. Độc lập theo chuỗi...9
2.3.5. Phương pháp ước lượng các hệ số...9
2.4. Độ phù hợp của mơ hình...10
2.5. Khoảng tin cậy và kiểm định các hệ số hồi quy...12
2.5.1. Ước lượng khoảng tin cậy đối với các hệ số hồi quy...12
2.5.2. Kiểm định giả thiết đối với β<small>j</small>...12
2.6. Kiểm định ý nghĩa của mơ hình...13
<b>B. ANOVA MỘT YẾU TỐ (One-way ANOVA)...14</b>
1. Trường hợp k tổng thể có phân phối bình thường và phương sai bằng nhau...14
2. Kiểm tra các giả định của phân tích phương sai...19
3. Phân tích sâu ANOVA...21
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4"><b>III. TIỀN XỬ LÝ SỐ LIỆU...24</b>
1. Đọc dữ liệu...24
2. Kiểm tra dữ liệu khuyết...24
<b>IV. THỐNG KÊ TẢ...25</b>
1. Thực hiện tính thống kê mơ tả cho các biến trong dữ liệu...25
2. Vẽ biểu đồ biểu thị phân phối cho các biến...25
<b>VI. THỐNG KÊ SUY DIỄN...34</b>
1. Ta cần nghiên cứu xem mức độ ảnh hưởng của các thông số điều chỉnh trong máy in 3D đếnđộ nhám của bản in như thế nào?...34
2. Ta cần nghiên cứu xem mức độ ảnh hưởng của các thông số điều chỉnh trong máy in 3D đếnđộ căng của bản in như thế nào?...39
3. Ta cần nghiên cứu xem mức độ ảnh hưởng của các thông số điều chỉnh trong máy in 3D đếnđộ căng của bản in như thế nào?...44
<b>VI. THẢO LUẬN VÀ MỞ RỘNG...50</b>
<b>VII. NGUỒN DỮ LIỆU VÀ NGUỒN CODE...51</b>
<b>VIII. TÀI LIỆU THAM KHẢO...55</b>
</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5"> Nozzle temperature (C<small>o</small>): Nhiệt độ đầu đùn Bed temperature (C<small>o</small>): Nhiệt độ bàn in Print speed (mm/s): Tốc độ in
Đề tài nghiên cứu được thực hiện trên máy in Ultimaker S5 3-D.
Kiểm nghiệm sức bền của vật liệu và sản phẩm in được thực hiện trênmáy kéo Sinotec GMBH với khả năng kéo 20kN.
</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6"><b>II. KIẾN THỨC NỀNA. HỒI QUY</b>
Phân tích hồi quy là một dạng phân tích thống kê với mục đích xác địnhđược sự thay đổi của một yếu tố đầu ra (biến phụ thuộc) dựa vào sự tác độngcủa một hay nhiều biến số đầu vào (biến độc lập). Mơ hình hồi quy với haihay nhiều biến độc lập được gọi là mơ hình hồi quy đa biến hoặc mơ hình hồiquy bội.
Ví dụ: Sự phụ thuộc của điểm số của sinh viên dựa vào hoàn cảnh giađình, thời gian dành cho việc giải trí, mơi trường học và giới tính,…; Sứcmạnh của vận động viên cử tạ dựa vào các điều kiện như chế độ dinh dưỡng,thời gian tập luyện một tuần (giờ), thời gian nghỉ ngơi, số lượng bài tập hằngtuần,…; Độ hiểu quả của vaccine dựa trên độ tuổi, giới tính, cân nặng,…
<b>1. Mơ hình hồi quy tuyến tính bội</b>
Cơng thức tổng qt của mơ hình hồi quy đa biến:
β<small>i </small>đo lường tác động riêng phần của biến X<small>i</small> lên Y với điều kiện các biến sốkhác trong mơ hình khơng đổi. Cụ thể hơn, nếu các biến khác trong mơ hìnhkhơng đổi, giá trị kỳ vọn của Y sẽ tăng β<small>i</small> đơn nếu X<small>i</small> tăng 1 đơn vị.
Như vậy, "Hồi quy tuyến tính" là một phương pháp để dự đoán giá trị biếnphụ thuộc (Y) dựa trên giá trị của biến độc lập (X). Thuật ngữ tuyến tính dùngđể chỉ rằng bản chất của các thơng số của tổng thể β<small>1</small> và β<small>i</small> là tuyến tính (bậcnhất). Nó có thể được sử dụng cho các trường hợp chúng ta muốn dự đoán
</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">một số lượng liên tục. Ví dụ: dự đốn lượng nước trung bình một người trưởngthành uống một năm v.v... Bằng dữ liệu thu thập được, ta đi ước lượng hàmhồi quy của tổng thể, đó là ước lượng cáctham số của tổng thể: β<small>1</small>, β<small>2</small>,…, β<small>k</small>.
<b>2. Ước lượng các tham số của mơ hình hồi quy tuyến tính bội</b>
<b>2.1. Hàm hồi quy tổng thể (PRF – Population Regression Function)</b>
Với Y là biến phụ thuộc, X<small>2</small>, X<small>3</small>,…, X<small>k</small> là biến độc lập, Y là ngẫu nhiên và cómột phân phối xác suất nào đó. Suy ra, tồn tại E(Y|X<small>2</small>, X<small>3</small>,…, X<small>k</small>) = giá trị xácđịnh. Do vậy, F(X<small>2</small>, X<small>3</small>,…, X<small>k</small>) = E(Y|X<small>2</small>, X<small>3</small>,…, X<small>k</small>) là hàm hồi quy tổng thể của Ytheo X<small>2</small>, X<small>3</small>,…, X<small>k</small>. Với một cá thể i, tồn tại (X<small>2,i</small>, X3<small>,i</small>, …, X<small>k,i</small>, Y<small>i</small>).
Tuy vậy, giá trị thực tế của tổng thể có sự sai khác so với giá trị tính tốn.Lượng sai khác u<small>i </small> đó được tính như sau:
u<sub>i</sub> = Y<sub>i</sub>– F
Vậy hàm hồi quy tổng thể có dạng:
Y = E⟨Y|X⟩ + u<sub>i</sub>
<b>2.2. Hàm hồi quy mẫu (SRF - Sample Regression Function)</b>
Do không biết tổng thể, nên chúng ta không biết giá trị trung bình tổngthể của biến phụ thuộc là đúng ở mức độ nào. Do vậy chúng ta phải dựa vàodữ liệu mẫu để ước lượng.
Trên một mẫu có n á thể, gọi Ŷ = F̂(X<small>2</small>, X<small>3</small>,…, X<small>k</small>) là hồi quy mẫu.
Với một cá thể mẫu Y<small>i</small> ≠ F̂(X<small>2,i</small>, X<small>3,i</small>,…, X<small>k,i</small>) sinh ra e<small>i</small> = Y<small>i</small> – F̂ (X<small>2</small>, X<small>3</small>,…, X<small>k</small>);e<small>i</small> gọi là phần dư SRF.
Ta có hàm hồi quy mẫu tổng quát được viết dưới dạng như sau:
y<sub>i</sub> = ^β<sub>1</sub> + ^β<sub>2 X</sub><sub>3,i</sub> + ^β<sub>3 X</sub><sub>3,i</sub> + … + ^β<sub>k X</sub><sub>k,i</sub>
Phần dư sinh ra: e<small>i</small> = y<small>i</small> – ŷ<small>i</small>.
Ký hiệu: ^β<small>m là ước lượng của βm</small>. Chúng ta trông đợi ^β<small>m là ước lượng không</small>chệch của β<small>m</small>, hơn nữa phải là một ước lượng hiệu quả.
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">Ước lượng SRF: chọn một phương pháp nào đó để ước lượng các tham sốcủa F qua việc tìm tham số của F̂ và lấy giá trị quan sát của các tham số nàylàm giá trị xấp xỉ cho tham số của F.
<b>2.3. Phương pháp bình phương nhỏ nhất (OLS - Ordinary Least Square)</b>
Phương pháp bình phương nhỏ nhất được đưa ra bởi nhà Toán học ĐứcCarl Friedrich Gauss. Tư tưởng của phương pháp này là cực tiểu tổng bìnhphương của các phần dư. Do đó có thể nói để có được hồi quy thích hợp nhất,chúng ta chọn các ước lượng có tung độ gốc và độ dốc sao cho phần dư lànhỏ.
Phương pháp bình phương nhỏ nhất (OLS) là phương pháp rất đáng tin cậytrong việc ước lượng các tham số của mơ hình, tuy nhiên mơ hình ước lượngphải thỏa mãn giả thiết. Khi thỏa mãn các giả thiết, ước lượng bình phươngnhỏ nhất (OLS) là ước lượng tuyến tính khơng chệch có hiệu quả nhất trongcác ước lượng. Vì thế phương pháp OLS đưa ra ước lượng khơng chệch tuyếntính tốt nhất (BLUE).
Kết quả này được gọi là Định lý Gauss – Markov, theo lý thuyết này ướclượng OLS là BLUE, nghĩa là trong tất cả các tổ hợp tuyến tính khơng chệchcủa Y, ước lượng OLS có phương sai bé nhất. Các giả thiết như sau:
<b>2.3.1. Mơ hình hồi quy tuyến tính.</b>
Mơ hình hồi quy là tuyến tính theo các tham số của mơ hình.y = β<small>1</small> + β<small>2</small>X<small>2</small> + β<small>3</small>X<small>3</small> + β<small>4</small>X<small>4</small> + … + β<small>k</small>X<small>k</small> + u
<b>2.3.2. Các giá trị của X được cố định trong việc lấy mẫu lặp lại.</b>
Giá trị lấy ra từ biến X được coi là cố định trong các mẫu lặp lại. X đượccho là không ngẫu nhiên.
E(u<small>i</small>|X<small>i</small>) = 0
Đồng phương sai giữa u<small>i</small> và X<small>i</small> bằng 0, cov(u<small>i</small>, X<small>i</small>) = 0. Sự biến thiên trong các giá trị của X.
</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9"><b> Các giá trị Xi trong mẫu cho trước không thể tất cả đều bằng nhau, var(Xi ) ≠ 0.</b>
<b>2.3.3. Phương sai của sai số khơng đổi. </b>
Khơng có đa cộng tuyến hoàn toàn.
<b>2.3.5. Phương pháp ước lượng các hệ số:</b>
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">Chúng ta có thể thiết lập các điều kiện bậc nhất cho phép tính tối thiểunày như sau:
∂ ^β<sub>k</sub> <sup> = -2</sup>
Hệ phương trình mà chúng ta có được gọi là hệ phương trình chuẩn củahồi quy mẫu. Chúng ta có thể giải k phương trình chuẩn này để tìm k hệ số ^β
chưa biết. β^<small>1, </small>β^<small>2,…, </small>β^<small>k được gọi là các ước lượng bình phương nhỏ nhất.</small>
Σ(y<small>i </small>– ӯ))<small>2</small> : TSS – Total Sum of Squares.
Σ(ŷ<small>i</small> – ӯ))<small>2</small> : ESS – Explained Sum of Squares. Σe<small>i</small><sup>2</sup> : RSS – Residual Sum of Squares.
Do Σe<small>i</small>(ŷ<small>i</small> – ӯ)) = 0 ⇐ (Σe<small>i</small>ŷ<small>i</small> = 0; Σe<small>i</small>ӯ) = 0) Ta có thể viết: TSS= ESS + RSS
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11"> RSS là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sátY và các giá trị nhận được từ hàm hồi quy.
TSS được chia thành 2 phần: một phần do ESS và một phần do RSS gâyra.
Từ TTS = ESS + RSS, ta chia cả hai vế cho TSS, ta có:
0 ≤ R<small>2</small> ≤ 1.
R<small>2</small> cao nghĩa là mơ hình ước lượng được giải thích được một mức độ caobiến động của biến phụ thuộc.
Nếu R<small>2</small> = 1, nghĩa là đường hồi quy giải thích 100% thay đổi của y.
Nếu R<small>2</small> = 0, nghĩa là mơ hình khơng đưa ra thơng tin nào về sự thay đổicủa biến phụ thuộc y.
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">Trong mơ hình hồi quy đa biến tỷ lệ của toàn bộ sự khác biệt của biến y dotất cả các biến x<small>2</small> và x<small>3</small> gây ra được gọi là hệ số xác định bội, ký hiệu là R<small>2</small>
<b>2.5. Khoảng tin cậy và kiểm định các hệ số hồi quy.</b>
<b>2.5.1. Ước lượng khoảng tin cậy đối với các hệ số hồi quy</b>
Mục đích của phân tích hồi quy khơng phải chỉ suy đốn về β1, β2,…, βkmà cịn phải kiểm tra bản chất sự phụ thuộc. Do vậy cần phải biết phân bốxác suất của β1, β2,…, βk. Các phân bố này phụ thuộc vào phân bố của cácui.
Với các giả thiết OLS, ui có phân phối N (0, σ<small>2</small>). Các hệ số ước lượng tuântheo phân phối chuẩn:
β<sub>j</sub> ~ N
^β<sub>j</sub> - β<sub>j</sub>
Ước lượng 2 phía, ta tìm được <sup>t</sup><small>α2</small>
(n - 3)
^β<small>j</small> - β<small>j</small>
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13"><b>2.5.2. Kiểm định giả thiết đối với β<small>j</small></b>
Kiểm định ý nghĩa thống kê của các hệ số hồi quy có ý nghĩa hay khơng:kiểm định rằng biến giải thích có thực sự ảnh hưởng đến biến phụ thuộc haykhơng. Nói cách khác là hệ số hồi quy có ý nghĩa thống kê hay không.
Có thể đưa ra giả thiết nào đó đối với βj, chẳng hạn βj = βj*. Nếu giả thiếtđúng thì:
H<small>1</small>: βj < 0 ⇔ xj có tác động ngược H<small>1</small><b>: βj > 0 ⇔ xj có tác động thuận2.6. Kiểm định ý nghĩa của mơ hình</b>
Trong mơ hình hồi quy đa biến, giả thuyết “khơng” cho rằng mơ hìnhkhơng có ý nghĩa được hiểu là tất cả các hệ số hồi quy riêng đều bằng 0. Ứng dụng kiểm định Wald (thường được gọi là kiểm định F) được tiến hànhcụ thể như sau:
<b>Bước 1: Giả thuyết “không” là H</b><small>0</small>: β<small>2</small> = β<small>3</small> = … = β<small>k</small> = 0.
Giả thuyết đối là H1: “có ít nhất một trong những giá trị β khác không”.
</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14"><b>Bước 2: Trước tiên hồi quy Y theo một số hạng không đổi và X</b><small>2</small>, X<small>3</small>, …, X<small>k</small>, sauđó tính tổng bình phương sai số RSS<small>U</small>, RSS<small>R</small>. Phân phối F là tỷ số của hai biếnngẫu nhiên phân phối khi bình phương độc lập. Điều này cho ta trị thống kê:
~ F (α,k - m, n - k)
<b>Bước 3: Tra số liệu trong bảng F tương ứng với bậc tự do (k – 1) cho tử số và</b>
(n – k) cho mẫu số, và với mức ý nghĩa α cho trước.
<b>Bước 4: Bác bỏ giả thuyết H</b><small>0</small> ở mức ý nghĩa α nếu Fc > F(α, k-1, n-k). Đối vớiphương pháp giá trị p, tính giá trị p = P(F > F<small>c</small>|H<small>0</small>) và bác bỏ giả thuyết H<small>0</small>nếu p < α.
<b>B. ANOVA MỘT YẾU TỐ (One-way ANOVA)</b>
Phân tích phương sai (Analysis of Variance - ANOVA) là một phương phápthống kê được sử dụng để so sánh trung bình của ba hoặc nhiều nhóm khácnhau để xem xét xem có sự khác biệt đáng kể giữa chúng hay không. Mụctiêu của ANOVA là phát hiện ra xem liệu sự biến động giữa các nhóm có xuấtphát từ sự ngẫu nhiên hay từ một yếu tố nguyên nhân nào đó.
Phân tích phương sai một yếu tố (One-way ANOVA) là phân tích ảnh hưởng của một yếu tốnguyên nhân (dạng biến định tính) ảnh hưởng đến một yếu tố kết quả (dạng biến định lượng)đang nghiên cứu.
</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15"><b>1. Trường hợp k tổng thể có phân phối bình thường và phương sai bằng nhau</b>
Giả sử, muốn so sánh trung bình của k tổng thể trên những mẫu độc lập ngẫu nhiên gồm n<small>1</small>,n<small>2</small>,n<small>3</small>,…, n<small>k </small>quan sát từ k tổng thể này. Để có thể tiến hành phân tích ANOVA, cần phải ghi nhớ 3giả định sau về các nhóm tổng thể:
<small></small> Các tổng thể có phân phối chuẩn.
<small></small> Phương sai của các tổng thể bằng nhau.
<small></small> Các quan sát được lấy mẫu từ tổng thể là độc lập nhau.
Nếu trung bình của các tổng thể được kí hiệu là µ<small>1</small>, µ<small>2</small>, µ<small>3</small>,…, µ<small>k</small> thì khi các giả định trên đượcđáp ứng, mơ hình phân tích phương sai một yếu tố ảnh hưởng được mô tả dưới dạng kiểm địnhgiả thuyết như sau:
H0: µ<small>1 </small>= µ<small>2</small> = µ<small>3</small> =…= µ<small>k</small>
Giả thuyết H0 cho rằng trung bình của k tổng thể bằng nhau, xét về mặtnghiên cứu liên hệ thì giả thuyết này cho rằng yếu tố nguyên nhân khơng cótác động gì đến vấn đề đang nghiên cứu. Ta có được giả thuyết đối của giảthuyết H0 là:
H1: Tồn tại ít nhất một cặp trung bình tổng thể khác nhau
Hai giả định đầu tiên để tiến hành phân tích phương sai được mơ tả như hình dưới đây, bạnthấy ba tổng thể đều có phân phối bình thường với mức độ phân tán tương đối giống nhau, nhưngba vị trí chênh lệch của chúng cho thấy ba trị trung bình khác nhau. Rõ ràng là nếu bạn thực sựcó các giá trị của 3 tổng thể và biểu diễn được phân phối của chúng như hình dưới thì bạn khơngcần phải làm gì nữa mà kết luận được ngay là bạn bác bỏ H0 hay 3 tổng thể này có trị trung bìnhkhác nhau.
</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">Nhưng bạn chỉ có mẫu đại diện dược quan sát, nên để kiểm định giảthuyết này, ta thực hiện các bước sau:
<b>Bước 1: Tính các trung bình mẫu của các nhóm (xem như đại diện của các</b>
tổng thể)
Trước hết ta xem cách tính các trung bình mẫu từ những quan sát của k mẫu ngẫu nhiên độclập (kí hiệu x´<sub>1</sub>, ´x<sub>2</sub>, ´x<sub>3</sub>,…, ´x<small>k) và trung bình chung của k mẫu quan sát (kí hiệu </small>´x ) từ trường hợptổng quát như sau:
<b>Bảng 1: Bảng số liệu tổng quát thực hiện phân tích phương sai</b>
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">Và trung bình chung của k mẫu ( trung bình chung của tồn bộ mẫu khảo sát):
´x =
Ngoài ra, bạn có thể tính trung bình chung của k mẫu theo cách khác là cộng tất cả các x<sub>ij</sub>
trên Bảng 1 lại rồi đem chia cho
<b>Bước 2: Tính các tổng các chênh lệch bình phương ( hay gọi tắt là tổng bình phương)</b>
Tính tổng các chênh lệch bình phương trong nội bộ nhóm SSW<small>1 </small>và tổng các chênh lệch bìnhphương giữa các nhóm SSG.
Tổng các chênh lệch bình phương trong nội bộ nhóm (SSW) được tính bằng cách cộng cácchênh lệch bình phương giữa các giá trị quan sát với trung bình mẫu của từng nhóm, rồi sau đólại tính tổng cộng kết quả tát cả các nhóm lại. SSW phản ánh phần biến thiên của yếu tố kết quảdo ảnh hưởng của các yếu tố khác, chứ không phải do yếu tố nguyên nhân đang nghiên cứu (làyếu tố dùng để phân biệt các tổng thể/ nhóm đang so sánh).
Tổng các chênh lệch bình phương của từng nhóm dược tính theo cơng thức:
Nhóm 1: SS<sub>1</sub> =
( x<sub>1j</sub>− ´x<sub>1</sub>)<sup>2</sup>
Nhóm 2: SS<sub>2</sub> =
<small>j=1n2</small>
</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">SSW =
( x<sub>1j</sub>− ´x<sub>1</sub>)<sup>2</sup>
Tổng các chênh lệch bình phương giữa các nhóm (SSG) được tính bằng cách cộng các chênhlệch được lấy bình phương giữa các trung bình mẫu của từng nhóm với trung bình chung của knhóm (các chênh lệch này đều được nhận thêm với số quan sát tương ứng của từng nhóm). SSGphản ánh phần biến thiên của yếu tố kết quả do ảnh hưởng của yếu tố nguyên nhân đang nghiêncứu.
n<sub>1</sub>( x<sub>i</sub>− ´x )<small>2</small>
Tổng các chênh lệch bình phương tồn bộ SST được tính bằng cách cộng tổng các chênh lệchđã lấy bình phương giữa từng giá trị quan sát của tồn bộ mẫu nghiên cứu (x<small>ij) với trung bình</small>chung tồn bộ (´x) SST phản ánh biến thiên của yếu tố kết quả do ảnh hưởng của tất cả cácnguyên nhân.
( x<sub>ij</sub>− ´x )<sup>2</sup>
Có thể dễ dàng chứng minh là tổng các chênh lệch bình phương tồn bộ bằng tổng cộng tổngcác chênh lệch bình phương trong nội bộ các nhóm và tổng các chênh lệch bình phương giữa cácnhóm.
SST = SSW + SSG
Như vậy công thức trên cho thấy, SST là toàn bộ biến thiên của yếu tố kết quả đã được phântích thành 2 phần: phần biến thiên do yếu tố đang nghiên cứu tạo ra (SSG) và phần biến thiên cònlại do các yếu tố khác không nghiên cứu ở đây tạo ra (SSW). Nếu phần biến thiên do yếu tốnguyên nhân đang xét tạo ra căng "đáng kể” so với phần biến thiên do các yếu tố khác khơng xéttạo ra, thì chúng ta càng có cơ sở để bác bỏ H0 và kết luận là yếu tố nguyên nhân đang nghiêncứu ảnh hưởng có ý nghĩa đến yếu tố kết quả.
<b>Bước 3: Tính các phương sai (là trung bình của các chênh lệch bình phương)</b>
Các phương sai được tính bằng cách lấy các tổng các chênh lệch bình phương chia cho bậc tựdo tương ứng.
</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">Tình phương sai trong nội bộ nhóm (MSW) bằng cách lấy tổng các chênh lệch bình phươngtrong nội bộ các nhóm (SSW) chia cho bậc tự do tương ứng là n-k (n là số quan sát, k là số nhómso sánh). MSW là ước lượng phần biến thiên của yếu tố kết quả do các yếu tố khác gây ra (haygiải thích).
Tính phương sai giữa các nhóm (MSG) bằng cách lấy tổng các chênh lệch bình phương giữacác nhóm chia cho bậc tự do tương ứng là k – 1. MSG là ước lượng phần biến thiên của yếu tốkết quả do yếu tố nguyên nhân đang nghiên cứu gây ra (hay giải thích được).
<b>Bước 4: Kiểm định giả thuyết</b>
Giả thuyết về sự bằng nhau của k trung bình tổng thể được quyết định dựa trên tỉ số của haiphương sai: phương sai giữa các nhóm (MSG) và phương sai trong nội bộ nhóm (MSW), tỉ sốnày được gọi là tỷ số F vì nó tuần theo qui luật Fisher– Snedecor với bậc tự do là k - 1 ở tử số vàn - k ở mẫu số.
Tổng chênhlệch bình
Bậc tự do(df)
Phương sai(MS)
Tỉ số F
</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">(SS)Giữa các
Trong nộibộ các
<b>2. Kiểm tra các giả định của phân tích phương sai</b>
<b> Chúng ta có thể kiểm tra nhanh các giả định này bằng đồ thị. Histogram là phương pháp tốt</b>
nhất để kiểm tra giả định về phân phối bình thường của dữ liệu nhưng nó địi hỏi một số lượngquan sát khá lớn. Biểu đồ thân lá hay biểu đồ hộp và râu là một thay thế tốt trong tình huống sốquan sát ít hơn. Nếu cơng cụ đồ thị cho thấy tập dữ liệu mẫu khá phù hợp với phân phối bìnhthường đã thỏa mãn. Hình dưới mơ tả biểu đồ hộp râu cho tập dữ liệu mẫu về ba nhóm sinh viêntrong tập dữ liệu của chúng ta. Đồ thị cho thấy ngoại trừ nhóm có thời gian tự học TB có hìnhdáng phân phối của dữ liệu hơi lệch sang trái, cịn hai nhóm cịn lại có phân phối khá cân đối.Với số quan sát không nhiều thì biểu hiện như thế này của dữ liệu là khả quan và có thể chấpnhận được.
Để khảo sát giả định bằng nhau của phương sai, biểu đồ hộp và râu cũng cho cảm nhận banđầu nhanh chóng, với ba biểu đồ này, mức độ phân tán của dữ liệu trong trong mỗi tập dữ liệumẫu không khác biệt nhau nhiều.
</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">Một phương pháp kiểm định tham số chắc chắn hơn cho giả định phương sai bằng nhau làkiểm định Levene về phương sai của các tổng thể. Kiểm định này xuất phát từ giả thuyết sau.
H<sub>0</sub>: σ<sub>1</sub><small>2</small> = σ<sub>2</sub><small>2</small> =…= σ<sub>k</sub><small>2</small>
H<small>1: Không phải tất cả các phương sai đều bằng nhau</small>
Để quyết định chấp nhận hay bác bỏ H<small>0 </small>ta tính tốn giá trị kiểm định F theo cơng thức
(chú ý nếu kếtquả tính của n´ là số thập phân thì ta lấy phần nguyên).
Quy tắc quyết định:
</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">Nếu chúng ta không chắc chắn về các giả định hoặc nếu kết quả kiểm định cho thấy các giảđịnh hoặc nếu kết quả kiểm định cho thấy các giả định không được thỏa mãn thì một phươngpháp kiểm định thay thế cho ANOVA là phương pháp kiểm định hi tham số Krusksl-Wallis sẽđược áp dụng. Tuy nhiên trong ví dụ này ở đây, ta có thể xem các giả định để tiến hành phân tíchphương sai đã được thỏa mãn.
<b>3. Phân tích sâu ANOVA</b>
Mục đích của phân tích phương sai là kiểm định giả thuyết H<small>0 </small>rằng trung bình của các tổngthể bằng nhau. Sau khi phân tích và kết luận, có hai trường hợp xảy ra là chấp nhận giả thuyết H<small>0</small>
hoặc bác bỏ giả thuyết H<small>0</small>. Nếu chấp nhận giả thuyết H<small>0 </small>thì phân tích kết thúc. Nếu bác bỏ giảthuyết H0, bạn kết luận trung bình của các tổng thể khơng bằng nhau. Vì vậy, vấn để tiếp theo làphân tích sâu hơn để xác định nhóm (tổng thể) nào khác nhóm nào, nhóm nào có trung bình lớnhơn hay nhỏ hơn.
Có nhiều phương pháp để tiếp tục phân tích sâu ANOVA khi bác bỏ giả thuyết H<small>0</small>. Trongchương này chỉ để cập đến 1 phương pháp thơng dụng đó là phương pháp Tukey, phương phápnày còn được gọi là kiểm định HSD (Honestly Significant Differences). Nội dung của phươngpháp này là so sánh từng cặp các trung bình nhóm ở mức ý nghĩa α nào đó cho tất cả các cặpkiểm định có thể để phát hiện ra những nhóm khác nhau. Nếu có k nhóm nghiên cứu, và chúng taso sánh tất cả các cặp nhóm thì số lương cặp cần phải so sánh là tổ hợp chập 2 của k nhóm.
C<sub>k</sub><small>2</small> =<sup>k!</sup>
k(k−1)2
</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">T = q<sub>α, k, n-k</sub>
Trong đó:
q<small>α, k, n-k là giá trị tra bảng phân phối kiểm định Tukey (Bảng tra số 9) ở mức ý nghĩa </small>α, với bậctự do k và n – k , với n là tổng số quan sát mẫu (n =
MSW là phương sai trong nội bộ nhóm
n<small>i là số quan sát trong 1 nhóm (tổng thể), trong trường hợp mỗi nhóm có số quan sát </small>n<small>i khác</small>nhau, sử dụng giá trị n<small>i nhỏ nhất.</small>
Tiêu chuẩn quyết định là bác bỏ giả thiết H<small>0 khi độ lệch tuyệt đối giữa các cặp trung bình</small>mẫu lớn hơn hay bằng T giới hạn.
Trong chương trình Excel khơng có các lệnh phân tích sâu ANOVA. Chúng ta có thể thựchiện phân tích này bằng chương trình SPSS. Ngồi ra kết quả của SPSS còn cung cấp cho cácbạn một kiểm định chính thức về sự bằng nhau của các phương sai tổng thể là kiểm định Levene.(Bạn đọc có thể xem cách thức tiến hành kiểm tra giả định của phân tích ANOVA một yếu tố vàphân tích sâu ANOVA trong sách Phân tích dữ liệu nghiên cứu với SPSS của cùng tác giả). Phân tích phướng sai với kiểm định F chỉ có thể áp dụng khi các nhóm so sánh có phân phốibình thường và phương sai bằng nhau. Trong trường hợp không thỏa điều kiện này, chúng ta cóthể chuyển đổi dữ liệu của yếu tố kết quả từ dạng định lượng về dạng định tính (dữ liệu thứ bậc)và áp dụng một kiểm định phi tham số phù hợp tên là Kruskal- Wallis. Bạn đọc có thể tìm hiểuvề kiểm định này ở Chương 10, kiểm định phi tham số.
</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24"><b>III. TIỀN XỬ LÝ SỐ LIỆU1. Đọc dữ liệu</b>
</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25"><b>2. Vẽ biểu đồ biểu thị phân phối cho các biến.</b>
Biểu đồ Histogram của các biến “tension strenght”, “elongation”, “roughness”. Biểu đồ tension strenght.
</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">hist(data_BTL$tension_strenght,xlab="tension_strenght",main="Biểu đồ histogram của biến tension_strenght",col="cyan")
Biểu đồ elongation.
hist(data_BTL$elongation,xlab="elongation",main="Biểu đồ histogram của biến elongation",col="yellow")
</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27"> Elogation.
</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28"> Roughness.
boxplot(data_BTL$roughness~data_BTL$infill_pattern,xlab="infill_pattern",ylab= "roughness",col="green")
boxplot(data_BTL$roughness~data_BTL$material,xlab="material",ylab="roughness", col="green")
Vẽ ma trận tương quan giữa các biến.
data_cor <- subset(data_BTL,select = -c(infill_pattern,material))cor(data_cor)
</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">Biểu đồ phân tán của biến tension trenght.
plot(data_BTL$tension_strenght,data_BTL$layer_height,xlab="tension_strenght",ylab="layer_height",main="tension_strenght and layer_height")
plot(data_BTL$tension_strenght,data_BTL$wall_thickness,xlab="tension_strenght",ylab="wall_thickness",main="tension_strenght and wall_thickness")
plot(data_BTL$tension_strenght,data_BTL$infill_density,xlab="tension_strenght",ylab="infill_density",main="tension_strenght and infill_density")
plot(data_BTL$tension_strenght,data_BTL$nozzle_temperature,xlab="tension_strenght",ylab="nozzle_temperature",main="tension_strenght and nozzle_temperature")
plot(data_BTL$tension_strenght,data_BTL$bed_temperature,xlab="tension_strenght",ylab="bed_temperature",main="tension_strenght and bed_temperature")
plot(data_BTL$tension_strenght,data_BTL$print_speed,xlab="tension_strenght",ylab="print_speed",main="tension_strenght and print_speed")
</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">plot(data_BTL$elongation,data_BTL$wall_thickness,xlab="elongation",ylab="wall_ thickness",main="elongation and wall_thickness")
plot(data_BTL$elongation,data_BTL$infill_density,xlab="elongation",ylab="infill density",main="elongation and infill_density")
plot(data_BTL$elongation,data_BTL$nozzle_temperature,xlab="elongation",ylab= "nozzle_temperature",main="elongation and nozzle_temperature")
plot(data_BTL$elongation,data_BTL$bed_temperature,xlab="elongation",ylab="bed_ temperature",main="elongation and bed_temperature")
plot(data_BTL$elongation,data_BTL$print_speed,xlab="elongation",ylab="print_ speed",main="elongation and print_speed”)
</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">plot(data_BTL$roughness,data_BTL$wall_thickness,xlab="roughness",ylab= "wall_ thickness",main="roughness and wall_thickness")
plot(data_BTL$roughness,data_BTL$infill_density,xlab="roughness",ylab="infill_ density",main="roughnessand infill_density")
plot(data_BTL$roughness,data_BTL$nozzle_temperature,xlab="roughness",ylab= "nozzle_temperature",main="roughness and nozzle_temperature")
plot(data_BTL$roughness,data_BTL$bed_temperature,xlab="roughness",ylab= "bed_ temperature",main="roughness and bed_temperature")
plot(data_BTL$roughness,data_BTL$print_speed,xlab="roughness",ylab="print_ speed",main="roughness and print_speed")
</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32"><b>Nhận xét:</b>
Dựa trên các đồ thị phân tán của biến roughness ta thấy roughness có mối quan hệ tuyếntính mạnh với biến layer_height.
</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33"><b>VI. THỐNG KÊ SUY DIỄN</b>
<b>1.1. Tìm khoảng tin cậy 95% cho sức căng bề mặt của bản in trung bình</b>
</div>