Tải bản đầy đủ (.pdf) (67 trang)

Bài giảng môn xử lý số liệu thực nghiệm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.05 MB, 67 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

Đại học Đà Nẵng Trường Đại học Sư phạm

<b>Bài giảng môn </b>

<b>XỬ LÝ SỐ LIỆU THỰC NGHIỆM </b>

<b>GV-TS: Vũ Thị Duyên </b>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<b>MỤC LỤC </b>

Mở đầu……….4

CHƯƠNG 1. ĐÁNH GIÁ CÁC SAI SỐ TRONG XỬ LÝ SỐ LIỆU THỰC NGHIỆM ... 5

1.1. Các thông số thực nghiệm ... 5

1.1.1. Đại lượng ngẫu nhiên ... 5

1.1.2. Phân loại các sai số đo lường ... 5

1.2. Xử lý thống kê các số liệu thực nghiệm ... 7

1.2.1. Giá trị trung bình ... 7

1.2.2. Trung vị ... 7

1.2.3. Khoảng biến thiên ... 7

1.2.4. Phương sai, độ lệch chuẩn và sai số chuẩn ... 7

1.2.5. Khoảng tin cậy và xác suất tin cậy ... 10

1.3. Kiểm tra thống kê các dữ kiện thực nghiệm ... 11

1.3.1. Kiểm tra theo tiêu chuẩn 3s (ít dùng) ... 11

1.3.2. Kiểm tra theo tiêu chuẩn Q (chuẩn Đixơn) ... 12

1.3.3. Kiểm tra theo chuẩn F (chuẩn Fisher) ... 12

1.3.4. Kiểm tra theo chuẩn t ... 14

1.4. Sử dụng phần mềm Excel để xử lý thống kê các số liệu thực nghiệm ... 16

1.4.1. Xác định đặc trưng thống kê của các đại lượng ngẫu nhiên ... 16

1.4.2. Kiểm tra thống kê ... 18

CHƯƠNG 2. CÁC PHƯƠNG PHÁP PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUAN ... 22

2.1. Phân tích tương quan ... 22

2.2. Phân tích hồi quy ... 23

2.2.1. Khái niệm cơ bản ... 23

2.2.2. Phương pháp bình phương tối thiểu ... 24

2.2.3. Một số dạng phương trình hồi quy ... 24

2.3. Kiểm tra thống kê ... 27

2.3.1. Kiểm tra ý nghĩa của các hệ số trong phương trình hồi quy ... 27

2.3.2. Kiểm tra sự tương thích của phương trình hồi quy với thực nghiệm ... 29

2.4. Sử dụng phần mềm excel để phân tích tương quan và hồi quy... 31

2.4.1. Sử dụng công cụ trendline của chart ... 31

2.4.2. Sử dụng công cụ solver ... 33

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

CHƯƠNG 3. CÁC PHƯƠNG PHÁP QUY HOẠCH THỰC NGHIỆM ... 36

3.1. Phương pháp lựa chọn các yếu tố đầu vào ảnh hưởng đến q trình hóa học ... 36

3.1.1. Lựa chọn các yếu tố đầu vào (yếu tố độc lập) ... 36

3.1.2. Phương pháp chuyên gia ... 37

3.1.3. Các thực nghiệm sàng lọc ... 38

3.1.4. Nhóm các yếu tố vào và chọn mục tiêu đánh giá ... 38

3.1.5. Ảnh hưởng của các tiên đề của phân tích hồi quy đến sự lựa chọn các yếu tố độc lập ... 38

3.2. Khái niệm về quy hoạch thực nghiệm ... 39

3.2.1. Khái niệm chung về quy hoạch thực nghiệm ... 39

3.2.2. Các nguyên tắc cơ bản của quy hoạch thực nghiệm ... 40

3.2.3. Các bước của phương pháp quy hoạch thực nghiệm ... 41

3.3. Quy hoạch trực giao cấp I ... 42

3.3.1. Thực nghiệm yếu tố toàn phần (TYT) ... 43

3.1.2. Thực nghiệm từng phần (TYP) ... 47

3.4. Quy hoạch trực giao cấp II ... 48

3.5. Tối ưu hóa quy hoạch thực nghiệm ... 50

3.5.1. Tối ưu hóa theo phương pháp leo dốc ... 50

3.5.2. Phương pháp luân phiên từng biến giải bài tốn tối ưu phỏng định ... 53

3.6. Ví dụ về ứng dụng quy hoạch thực nghiệm trong các quá trình cơng nghệ hóa học .. 53

Tài liệu tham khảo ... 63

PHỤ LỤC ... 64

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>Mở đầu </b>

Nhiều cơng trình nghiên cứu khoa học cơng nghệ thường đưa đến giải bài tốn cực, tìm điều kiện tối ưu để tiến hành các quá trình hoặc lựa chọn thành phần tối ưu của hệ nhiều cấu tử. Chẳng hạn, khi xem xét các q trình cơng nghệ hóa học mới, nhiệm vụ nghiên cứu thường là thay đổi nhiệt độ, áp suất và tỉ lệ các chất phản ứng để tìm hiệu suất phản ứng cao nhất, tính tốn, lựa chọn giá trị thích hợp nhất của các thơng số cấu trúc và động học, nhằm đạt đến chất lượng làm việc và hiệu quả kinh tế cao nhất của q trình. Những bài tốn này thường giải quyết ở các mức độ nghiên cứu các yếu tố ảnh hưởng đến hệ, lập mơ hình biểu diễn mối phụ thuộc giữa các phần tử của hệ, điều khiển hệ theo mục đích cho trước, hoặc đưa về trạng thái tối ưu theo những chỉ tiêu đánh giá đã chọn. Thông thường các hệ cần điều khiển và tối ưu rất phức tạp, đối tượng nghiên cứu ngày càng đa dạng hơn, trở thành những hệ thống cồng kềnh với tập hợp lớn các yếu tố ảnh hưởng và chỉ tiêu đánh giá. Mối quan hệ giữa các thành phần trong hệ thống càng không thể mô tả bằng các hàm lý thuyết. Vì vậy, đa số các bài toán cực trị được giải quyết bằng thực nghiệm.

Ngày nay người ta thường đề cập tới phương pháp kết hợp giữa lý thuyết và thực nghiệm. Tùy theo mức độ hiểu biết về cơ chế của quá trình, ý nghĩa của nghiên cứu lý thuyết thường được giới hạn ở tác dụng định hướng ban đầu, hỗ trợ giảm bớt khối lượng công việc, rút ngắn thời gian cho nghiên cứu thực nghiệm. Bên cạnh đó, thực nghiệm có tác dụng trở lại, bổ sung cho kết quả nghiên cứu lý thuyết, xác định rõ hơn cơ chế của hiện tượng.

Vai trò của thực nghiệm càng lớn thì mục tiêu đề ra cho chúng càng cao, vì vậy thực nghiệm cũng có nhu cầu phát triển và trở thành đối tượng nghiên cứu, một ngành khoa học.

Có thể nói, lý thuyết quy hoạch thực nghiệm từ khi ra đời đã thu hút sự quan tâm và nhận được nhiều đóng góp hồn thiện của các nhà khoa học. Những ưu điểm rõ rệt của phương pháp này so với các thực nghiệm cổ điển là:

- Giảm đáng kể số lượng thí nghiệm cần thiết.

- Hàm lượng thông tin nhiều hơn rõ rệt, nhờ đánh giá được vai trò qua lại giữa các yếu tố và ảnh hưởng của chúng đến hàm mục tiêu. Nhận được mơ hình tốn học thống kê thực nghiệm theo các tiêu chuẩn thống kê, đánh giá được sai số của quá trình thực nghiệm theo các tiêu chuẩn thống kê cho phép xét ảnh hưởng của các yếu tố với mức độ tin cậy cần thiết. - Cho phép xác định được điều kiện tối ưu đa yếu tố của đối tượng nghiên cứu một cách khá chính xác bằng các cơng cụ tốn học, thay cho cách giải gần đúng, tìm tối ưu cục bộ như các thực nghiệm thụ động.

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<b>CHƯƠNG 1. ĐÁNH GIÁ CÁC SAI SỐ TRONG XỬ LÝ SỐ LIỆU THỰC NGHIỆM 1.1. Các thông số thực nghiệm </b>

<i><b>1.1.1. Đại lượng ngẫu nhiên </b></i>

Đại lượng ngẫu nhiên (X) là tập hợp tất cả các đại lượng mà giá trị của nó mang lại một cách ngẫu nhiên. Tức là sự xuất hiện là không biết trước.

Đại lượng ngẫu nhiên X được gọi là rời rạc khi nó nhận hữu hạn hoặc vô hạn các giá trị đếm được khác nhau.

Đại lượng ngẫu nhiên X được gọi là liên tục nếu nó nhận giá trị bất kì trong một khoảng của trục số.

<i><b>1.1.2. Phân loại các sai số đo lường </b></i>

Trong thực nghiệm, những giá trị nhận được là giá trị gần đúng của giá trị thực. Giả sử x là giá trị đo được từ thực nghiệm; a là giá trị thực thì: Δx = |x –a| được gọi là sai số tuyệt đối của phép đo hay còn gọi là độ lệch giữa a và x. Khi đó kết quả của phép đo được biểu diễn như sau: a ± Δx.

Ví dụ một mẫu có khối lượng thực là 3,24 g và khối lượng đo được là 3,15 g. Khi đó sai số tuyệt đối của phép đo là Δm = 0,09 g và kết quả của phép đo được biểu diễn là m = 3,24 ± 0,09 g.

Sai số thực nghiệm có thể chia thành 3 loại: sai số thô, sai số hệ thống và sai số ngẫu nhiên.

<b>a. Sai số thô </b>

Là sai số phạm phải do phá vỡ những điều kiện căn bản của việc chọn mẫu, phép đo, hoặc do sơ suất của người thực hiện dẫn đến các lần đo có kết quả khác nhau nhiều.

Ví dụ: người làm thí nghiệm chuẩn độ quên cho chất chỉ thị, quên cho xúc tác nên tạo thành sản phẩm khác hoặc đọc nhầm kết quả đo được…

Cách khử sai số thô:

+ Kiểm tra các điều kiện cơ bản có bị vi phạm khơng.

+ Sử dụng một phương pháp đánh giá để loại bỏ hoặc giữ lại các kết quả khơng bình thường.

<b>b. Sai số hệ thống </b>

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

quen của người đo và do điều kiện ngoại cảnh…Sai số hệ thống làm thay đổi số đo trung bình nên gọi là sai chệch.

Người ta phân biệt 3 dạng sai số hệ thống:

<b>+ Sai số hệ thống tự nhiên </b>

Như độ lớn của phơng phóng xạ trong phép đo bức xạ ln tồn tại trong phổ bức xạ đo được. Trong q trình phân tích xử lý phổ người ta phải loại bỏ sự đóng góp của các bức xạ phông này.

<b>+ Sai số hệ thống nguồn gốc được biết </b>

<b>- Sai số giới hạn của dụng cụ: sai số liên quan đến các loại dụng cụ đo và xác định </b>

chúng bằng cấp chính xác tương ứng. Các sai số như thế có thể biết được giới hạn trên và khơng thể tính hiệu chỉnh chúng. Ví dụ buret dùng để chuẩn độ loại 50 mL có sai số của phép đo thể tích là ΔV = 0,1 mL.

<b>- Sai số zero: Hầu hết các phép đo là hiệu số giữa các số liệu đọc dụng cụ và số liệu </b>

đọc dụng cụ có lối vào zero. Thường sai số zero do sự bỏ quả việc kiểm tra zero của dụng cụ. Sai số zero là một sai số hệ thống bởi vì tất cả các điểm bị ảnh hưởng bởi cùng một lượng. Ví dụ khi sử dụng cân trước khi sử dụng cần chỉnh về vị trí 0 nếu khơng sẽ dẫn đến làm cho giá trị đo được lớn hơn hoặc nhỏ hơn giá trị cần đo.

<b>+ Sai số hệ thống nguồn gốc khơng được biết </b>

Ví dụ như sử dụng các thiết bị đã cũ và nó đã có các sai hỏng ngầm, độ chính xác thực tế xấu hơn so với tiêu chuẩn kĩ thuật đã cho của dụng cụ. Để tìm ra sai số hệ thống thông thường các dụng cụ cần được lấy chuẩn với các tiêu chuẩn được định trước bởi nhà sản xuất.

Để giảm sai số hệ thống người ta đặt một hệ số hiệu chỉnh ứng với mỗi nguyên nhân.

<b>c. Sai số ngẫu nhiên </b>

Sai số ngẫu nhiên là sai số làm cho kết quả đo lệch về cả hai phía so với giá trị thực của đại lượng cần đo, là sai số còn lại khi đã khử sai số thô và sai số hệ thống. Sai số ngẫu nhiên không thể khống chế được bằng kĩ thuật thu thập số liệu, được sinh ra do nhiều nguyên nhân, tác dụng rất nhỏ, không thể tách riêng ra, vì thế khơng loại trừ được. Sai số ngẫu nhiên khơng làm thay đổi số đo trung bình, chỉ ảnh hưởng đến dao động xung quanh số trung bình.

Để khử sai số ngẫu nhiên cần thực hiện nhiều phép đo và lấy giá trị trung bình. Cách tốt nhất để hạn chế sai số ngẫu nhiên là đảm bảo cỡ mẫu đủ lớn.

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<b>1.2. Xử lý thống kê các số liệu thực nghiệm </b>

<i>x</i> là giá trị biểu diễn kết quả đo của phép thí nghiệm và tham gia vào việc xác định sai số của phép đo. Giá trị trung bình của các phép đo độc lập là xấp xỉ đo được của đại lượng đúng, đồng thời số phép đo n càng lớn thì độ tin cậy càng cao.

<i><b>1.2.2. Trung vị </b></i>

Nếu sắp xếp n giá trị lặp lại trong tập số liệu theo thứ tự tăng dần hoặc giảm dần từ x<small>1</small>, x<small>2</small>,…,x<small>n</small> thì số nằm chính giữa tập số liệu được gọi là trung vị.

- Nếu n lẻ thì trung vị là số ở chính giữa dãy số

- Nếu n chẵn thì trung vị là trung bình cộng của 2 giá trị nằm ở giữa dãy số

<i><b>1.2.3. Khoảng biến thiên </b></i>

Khoảng biến thiên hay quy mô biến thiên R là hiệu số giữa giá trị lớn nhất và nhỏ nhất trong tập số liệu : R = x<small>max</small> - x<small>min</small>.

<b>Ví dụ kết quả phân tích hàm lượng clorua trong một mẫu muối (%) bằng phương </b>

pháp chuẩn độ thu được : 24,39 ; 24,19 ; 24,36 ; 24,38 ; 24,25 ; 24,30. Giá trị trung bình của phép đo là :

Các số liệu sắp xếp theo trật tự tăng dần : 24,19 ; 24,25 ; 24,30 ; 24,36 ; 24,38 ; 24,39 Vì số số liệu là số chẵn nên trung vị bằng : 24,30 24,36 24,33% <sub></sub>

Trong tập số liệu giá trị lớn nhất x<small>max</small> = 24,39 % ; giá trị nhỏ nhất x<small>min</small> = 24,19 % Khoảng biến thiên là : R = 0,20 %.

<i><b>1.2.4. Phương sai, độ lệch chuẩn và sai số chuẩn </b></i>

<b>Phương sai là đặc trưng quan trọng để phản ánh độ phân tán giá trị biến ngẫu nhiên </b>

xung quanh giá trị trung bình và được kí hiệu là S<small>2</small>. Phương sai là giá trị trung bình của tổng bình phương sự sai khác giữa các giá trị riêng rẽ trong tập số liệu so với giá trị trung bình.

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

Phương sai đặc trưng cho độ chính xác của phép đo. Nếu phương sai càng lớn thì độ tản mạn của các giá trị đo lặp lại càng lớn hay độ lặp kém.

Phương sai không cùng thứ nguyên với các đại lượng đo mà có đơn vị bằng bình phương đơn vị của giá trị trung bình. Vì thế, cách hoán chuyển tốt nhất là chuyển giá trị của phương sai sao cho có cùng đơn vị với số trung bình bằng cách lấy căn bậc hai : <i>S</i> <i>S </i><small>2</small>

<b>biểu thị sự trải rộng của các giá trị quan sát được gọi là độ lệch chuẩn (SD) của mẫu hay sai </b>

Người ta thường sử dụng độ lệch chuẩn tương đối (RSD) hơn là độ lệch chuẩn (SD) do có thể đánh giá được độ lệch chiếm bao nhiêu phần trăm giá trị trung bình và từ đó so sánh được các biến số không cùng đơn vị.

Như đã biết, nguyên lý và mục đích đằng sau của thống kê học là ước tính những thơng số của một quần thể. Trong thực tế chúng ta không biết các thông số này, mà chỉ dựa vào những ước tính từ một hay nhiều mẫu để suy luận cho giá trị của quần thể mà các mẫu được chọn. Chẳng hạn như chúng ta không biết chiều cao của người Việt Nam là bao nhiêu (bởi vì khơng có ai đo lường chiều cao của hơn 90 triệu dân), chúng ta phải chọn một mẫu gồm n đối tượng để tính trị số trung bình của mẫu này, và dùng trị số trung bình của mẫu để suy luận cho toàn dân. Nhưng chọn mẫu phải ngẫu nhiên mới mang tính đại diện cao. Cứ mỗi lần chọn mẫu, chúng ta có một nhóm đối tượng khác và một số trung bình mới. Độ lệch chuẩn của các số trung bình này gọi là sai số chuẩn, tức là sai số chuẩn phản ứng độ dao động hay biến thiên của các số trung bình mẫu.

<b>Sai số chuẩn (SE) là tỉ lệ giữa độ lệch chuẩn trung bình mẫu với căn bậc hai của </b>

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

Kết quả của phép đo được biểu thị qua biểu thức : x = 44,5 ± 0,4 % Độ lệch chuẩn tương đối là : <i>RSD</i> <i><sup>S</sup></i>.100% 1,00%

<b>Ý nghĩa của phương sai, độ lệch chuẩn và sai số chuẩn : </b>

Gọi thơng số trung bình của một quần thể là a (chúng ta không biết giá trị của a), gọi ước số trung bình tính từ mẫu là <i>x</i> <sub> và độ lệch chuẩn là S. Theo lý thuyết xác suất của phân </sub>

phối chuẩn, chúng ta có thể phát biểu :

+ 68% cá nhân trong quần thể có giá trị từ <i>x S</i> <sub> đến </sub><i>x S</i>

+ 95% cá nhân trong quần thể có giá trị từ <i>x</i>1,96.<i>S đến x</i>1,96.<i>S </i>

+ 99% cá nhân trong quần thể có giá trị từ <i>x</i>3.<i>S</i><sub> đến </sub><i>x</i>3.<i>S</i>

Ngồi ra gọi sai số chuẩn là SE, ta cịn có thể phát biểu :

+ 68% số trung bình tính từ mẫu có giá trị từ <i>x SE</i> <sub> đến </sub><i>x SE</i>

+ 95% số trung bình tính từ mẫu có giá trị từ <i>x</i> 1,96.<i>SE đến x</i>1,96.<i>SE </i>

+ 99% số trung bình tính từ mẫu có giá trị từ <i>x</i>3.<i>SE</i><sub> đến </sub><i>x</i>3.<i>SE</i>

Như vậy độ lệch chuẩn phản ánh độ biến thiên của một số cá nhân trong một quần thể, còn sai số chuẩn phản ánh dao động của các số trung bình chọn từ quần thể.

Phương sai, độ lệch chuẩn, sai số chuẩn giúp cho ta nhận biết được mức độ đồng đều của giá trị thực nghiệm. Nếu phương sai, độ lệch chuẩn và sai số chuẩn nhỏ thì các giá trị thực nghiệm tương đối đồng đều và tập trung xung quanh giá trị trung bình.

<b>Phương sai tái hiện: xác định sai số tái hiện của phép đo hàng loại những thí </b>

nghiệm. Có n thí nghiệm song song, giá trị đo được là y<small>1</small>, y<small>2</small>,…,y<small>n </small>:

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

Nếu cần m mẫu, mỗi mẫu làm n thí nghiệm với các phương sai là s<small>1</small> , s<small>2</small> ,…,s<small>m</small><sup>2</sup>. Phương sai tái hiện được tính theo công thức :

với f<small>1 </small> là bậc tự do của thí nghiệm song song thứ i : f<small>i</small> = n<small>i</small> – 1.

<i><b>1.2.5. Khoảng tin cậy và xác suất tin cậy </b></i>

Mục đích của hầu hết các đo lường là tìm giá trị của đại lượng cần đo. Giá trị này có thể được dẫn xuất trực tiếp từ các đo lường hoặc được dẫn xuất từ các giá trị đo được bằng một hệ thức toán học. Trong trường hợp như vậy, chúng ta cần có sự phân tích thống kê các đo lường nhầm để thu giá trị cuối cùng và đưa ra sự bất định của nó. Tuy nhiên giá trị trung bình <i>x</i> <sub> (giá trị thực hay giá trị kì vọng tốn học) khơng chỉ ra giới hạn sai số của nó. Về </sub> nguyên tắc <i>x</i> có thể sai khác  bao nhiêu cũng được mặc dù xác suất của các biến cố như thế nhỏ không đáng kể. Sai số của các biểu thức đã khảo sát mang đặc trưng xác suất và được mô tả bằng khoảng độ tin cậy, đó là giới hạn mà xác suất tin cậy p không vượt quá

Độ tin cậy thường cho trước p = 0,95 ; 0,99 hoặc 0,999…

<b>α = 1-p: là mức có ý nghĩa tương ứng với khoảng; </b>

Sai số tin cậy được xác định bằng công thức : <i>t<sup>S</sup></i> <i>t</i>.

<i>n</i> <b><sup> , với t là hệ số tin cậy ; </sup></b>

S : là độ lệch chuẩn và n là cỡ mẫu ;

<sup></sup>

là sai số chuẩn.

t(p,f) là giá trị tra ở bảng phân vị của hàm phân phối Student (Bảng 3), với p là độ tin cậy, f = n – 1 là bậc tự do của tập số liệu, n : là số mẫu đo (hay còn gọi là cỡ mẫu).

Như vậy khoảng tin cậy phụ thuộc vào quy luật phân bố của x, số phép đo và xác suất tin cậy lựa chọn. Kết quả của một phép đo thường được trích dẫn dưới dạng <i><sup>x t</sup></i><sup></sup> <sup>.</sup>

<sup></sup>

, nghĩa là chúng ta chỉ biết giá trị đo được và khoảng rộng không đúng với một xác suất của một sự ước lượng sai số, giá trị đúng được bảo phụ bởi khoảng giữa các giới hạn <i>x t</i> .

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<b>Ví dụ khi chuẩn độ 10 mL dung dịch NaOH bằng dung dịch HCl 0,1 N thu được thể </b>

tích dung dịch HCl : 10,1 ; 10,0 ; 10,2 ; 10,1 ; 10,3 ; 10,5 mL. Xử lý số liệu thực nghiệm với

Tra bảng 3, với độ tin cậy p = 0,95, bậc tự do f = 6-1 = 5 => hệ số tin cậy t là: 2,57 Sai số tin cậy :  <i>t<sup>S</sup></i> 0,2056 0,2 <i>mL</i>

Khoảng tin cậy của kết quả thể tích HCl là (10,0 ; 10,4), tức là 10,0 mL < V<small>HCl</small> < 10,4 mL. Như vậy với độ tin cậy 95% thì trong các số liệu thu được V = 10,0 mL và V = 10,5 mL là hai số liệu không đáng tin cậy.

<b>1.3. Kiểm tra thống kê các dữ kiện thực nghiệm </b>

<i><b>1.3.1. Kiểm tra theo tiêu chuẩn 3s (ít dùng) </b></i>

Bước 1 : Tính giá trị trung bình số học :

+ Nếu Δx<small>i</small> ≤ 3S thì x<small>i</small> mắc sai số ngẫu nhiên, không bỏ được + Nếu Δx<small>i</small> > 3S thì x<small>i</small> mắc sai số thơ, cần loại bỏ

<b>Ví dụ : Kết quả phân tích thành phần nguyên tố C trong một hợp chất hữu cơ mới tổng hợp </b>

như sau : 17,77 ; 17,79; 18,83 ; 16,70 ; 17,69 ; 17,75 %. Hãy kiểm tra kết quả trên theo tiêu chuẩn 3s.

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

Bước 1 : Sắp xếp các số liệu theo chiều tăng hoặc giảm dần

Bước 3 : So sánh với giá trị Q chuẩn tra bảng : Q<small>p,n</small>

+ Nếu Q<small>tính</small> > Q<small>chuẩn</small> thì đó là sai số thơ, cần loại bỏ

+ Nếu Q<small>tính</small> ≤ Q<small>chuẩn</small> thì đó là sai số ngẫu nhiên, khơng loại bỏ được

<b>Ví dụ kết quả xác định hàm lượng CaCO</b><small>3</small> trong một mẫu đolomit thu kết quả như sau : 54,31 ; 54,36 ; 54,40 ; 54,59 %. Hãy kiểm tra xem giá trị nghi ngờ 54,59 có mắc sai số thơ hay không theo tiêu chuẩn Q?

Các số liệu xếp theo chiều tăng dần : 54,31 ; 54,36 ; 54,40 ; 54,59

Ta có : x<small>nghi ngờ</small> = 54,59 % ; x<small> lân cận</small> = 54,40 % ; x<small>max</small> = 54,59 % ; x<small>min</small> = 54,31 %

Tra bảng phân vị Đinxơn Q<small>p,n</small> = Q<small>0,95, 4</small> = 0,77

Q<small>tinh</small> < Q<small>chuẩn</small> nên số liệu nghi ngờ 54,59 không cần loại bỏ, sai số là sai số ngẫu nhiên

<i><b>1.3.3. Kiểm tra theo chuẩn F (chuẩn Fisher) </b></i>

Chuẩn này dựng để so sánh độ lặp của 2 dãy thí nghiệm bằng cách so sánh tỉ số của 2

Trong đó s<small>1</small> là phương sai lớn hơn ứng với bậc tự do f<small>1</small> = n<small>1</small> – 1 (n<small>1</small> là số thí nghiệm trong dãy này) ; s<small>2</small> là phương sai nhỏ hơn ứng với bậc tự do f<small>2</small> = n<small>2</small> – 1 (n<small>2</small> là số thí nghiệm trong dãy này).

So sánh giá trị F<small>tính </small> và F<small>(0,95 ; f1 ;f2)</small> tra trong bảng.

Nếu F<small>tính</small> ≤ F<small>bảng</small>, độ lặp của 2 dãy thí nghiệm là đồng nhất, chúng thuộc cùng một tập,

<i>x</i> .

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

Nếu F<small>tính</small> > F<small>bảng</small>, độ lặp của 2 dãy thí nghiệm khác nhau, chúng khơng thuộc cùng một tập, không thể gộp chung để tính <i>x</i> .

<b>Ví dụ 1: theo kết quả của 6 lần phân tích hàm lượng CaO bằng phương pháp A ta </b>

tính được độ lệch chuẩn của phương pháp này là s = 0,8 mg. Theo 5 lần phân tích theo phương pháp B ta tính được độ lệch chuẩn là 2,1 mg. Hỏi độ lặp lại của các phương pháp

Tra bảng phân vị Fisher F<small>(0,95 ; f1 ;f2)</small> = F<small>0,95 ; 5 ; 4)</small> = 6,3

Vì F<small>tính</small> > F<small>bảng</small> nên độ lặp của 2 dãy thí nghiệm là không đồng nhất, chúng không cùng một tập, không thể gộp chung để tính <i>x</i> .

<b>Ví dụ 2 : Xác định nồng độ dung dịch chuẩn HCl theo 2 chất gốc cho kết quả thí </b>

nghiệm như sau:

(1) Chuẩn độ HCl theo Na<small>2</small>CO<small>3</small> (mol/L): 0,1250 0,1248 0,1252 0,1254 (2) Chuẩn độ HCl theo Na<small>2</small>B<small>4</small>O<small>7</small>.10H<small>2</small>O (mol/L): 0,1254 0,1258 0,1253 0,1255 Hãy so sánh kết quả của 2 phép chuẩn độ này.

<b>Đối với phép chuẩn độ thứ nhất: </b>

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<i><b>1.3.4. Kiểm tra theo chuẩn t </b></i>

Dùng để so sánh hai giá trị trung bình từ hai dãy thí nghiệm độc lập (2 phòng thí nghiệm, 2 người thí nghiệm)

Phịng TN A : x<small>1</small>, x<small>2</small>, x<small>3</small>,…,x<small>n1</small>

Phòng TN B : x<small>1’</small>, x<small>2’</small>, x<small>3’</small>,…,x<small>n2’ </small>

Bước 1 : Tính giá trị trung bình <i>x x </i><sub>1</sub>; <sub>2</sub> Bước 2 : Tính phương sai S<small>1</small><sup>2 </sup>; S<small>2</small><sup>2 </sup>; Bước 3 : Tính chuẩn Student : t<small>tính</small>

TH1 : Nếu phương sai tương thích (S<small>1</small> ≠ S<small>2</small> do nguyên nhân ngẫu nhiên), chuẩn t<small>tính</small> được

TH2 : Nếu 2 phương sai khơng tương thích (S<small>1</small> ≠ S<small>2</small> do ngun nhân khơng ngẫu nhiên),

Bước 4 : So sánh giá trị t<small>tính</small> với t<small>p,k </small>(f) trong bảng tra cứu, với k = n<small>1</small>+n<small>2</small> – 2)

+Nếu t<small>tính</small> ≤ t<small>p,k</small>(f) thì <i>x</i><sub>1</sub> <i>x do ngun nhân ngẫu nhiên, 2 phịng thí nghiệm, 2 người thí </i><sub>2</sub>

nghiệm cho kết quả như nhau

+Nếu t<small>tính</small> > t<small>p,k</small>(f) thì <i>x</i><sub>1</sub> <i>x do nguyên nhân không ngẫu nhiên, 2 phịng thí nghiệm, 2 </i><sub>2</sub>

người thí nghiệm cho kết quả khác nhau

<b>Ví dụ : Người ta phát hiện thấy một ít tóc trong tay nạn nhân của một vụ án mạng. </b>

Việc phân tích hàm lượng Zn trong tóc bằng phương pháp hấp thụ phân tử ở tay nạn nhân với tóc người phục vụ bị nghi vấn có kết quả như sau:

(1)Tóc người phục vụ, %Zn: 240 ; 250 ; 265 ; 258 ; 268 ppm.

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

Có thể khẳng định người phục vụ nằm trong diện nghi vấn không?

<b>Đối với phép phân tích tóc người phục vụ: </b>

Tra bảng 3, với độ tin cậy p = 0,95, bậc tự do f = 5-1 = 4 => hệ số tin cậy t là: 2,78 Sai số tin cậy :  <i>t<sup>s</sup></i> 14,178 14,2 <i>ppm</i>

Khoảng tin cậy của phép đo là (242 ; 270,2)

Như vậy trong dãy số liệu trên cần loại bỏ số liệu 240 vì nó khơng nằm trong khoảng tin cậy với p = 95%, chỉ sử dụng 4 số liệu cịn lại để tính tốn.

Tính lại giá trị trung bình <sup></sup>

Tra bảng 3, với độ tin cậy p = 0,95, bậc tự do f = 5-1 = 4 => hệ số tin cậy t là: 2,78 Sai số tin cậy :  <i>t<sup>s</sup></i> 7,4782 7,5 <i>ppm</i>

Khoảng tin cậy của phép đo là (233,9 ; 248,9)

Như vậy trong dãy số liệu trên cần loại bỏ số liệu 249 vì nó khơng nằm trong khoảng tin cậy với p = 95%.

Tính lại giá trị trung bình <sup></sup>

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

Vì F<small>tính</small> < F<small>bảng</small> nên hai phương sai tương thích hay <small>2</small>  <small>2</small>

Tra bảng phân vị Student t<small>p,k </small>(f) = t<small>0,95, 6</small> = 2,45

Vì t<small>tinh</small> < t<small>bảng</small> nên <i>x</i><sub>1</sub> <i>x là do nguyên nhân ngẫu nhiên, 2 kết quả như nhau và người </i><sub>2</sub>

phục vụ nằm trong diện nghi vấn.

<b>1.4. Sử dụng phần mềm Excel để xử lý thống kê các số liệu thực nghiệm </b>

<i><b>1.4.1. Xác định đặc trưng thống kê của các đại lượng ngẫu nhiên </b></i>

Trong lần đầu tiên sử dụng công cụ analysis thì cần vào file → options → Add-Ins Chọn Analysis ToolPak → go

Sau đó chọn như hình phía dưới.

Để xác định giá trị trung bình, trung vị, khoảng biến thiên, phương sai, độ lệch chuẩn, sai số chuẩn, khoảng tin cậy, trước tiên nhập số liệu vào bảng excel, sau đó chọn Data → Data analysis → Descriptive Statistics → OK

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

+ Input range: bôi đen cột dữ liệu

+ Output range: chọn ô chỉ vị trí xuất dữ liệu ra

+ Chọn summary statistics (thơng số thống kê tổng hợp)

+ Chọn confidence level for mean : độ tin cậy của giá trị trung bình (tùy chọn, có thể là 95% hay 99% hay 99,9%...)

+ Bấm OK

Kết quả thu được như trình bày ở hình bên dưới.

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

<i><b>1.4.2. Kiểm tra thống kê </b></i>

<b>a) So sánh hai phương sai (kiểm tra theo chuẩn F) </b>

Chọn Data → Data analysis → F-Test Two Samplefor variances → OK Tính tiêu chuẩn kiểm định

Nhập các dãy số liệu, điền mức ý nghĩa α (thường mặc định α = 0,05 tức là p = 95%), chỉ ra nơi xuất dữ liệu.

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

Kết quả:

So sánh F<small>tinh</small> và F<small>α</small>:

+ Nếu F<small>tính</small> ≤ F<small>α</small> thì hai phương sai tương thích

+ Nếu F<small>tính </small> > F<small>α</small> thì hai phương sai khơng tương thích

Trong ví dụ này F<small>tính</small> > F<small>α</small> nên hai phương sai khơng tương thích.

<b>b) So sánh hai giá trị trung bình (kiểm tra theo chuẩn t) </b>

+ Trường hợp 2 phương sai tương thích :

Chọn Data → Data analysis → t-Test Two Sample Assuming Equal variances → OK

</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">

+ Trường hợp 2 phương sai khơng tương thích :

Chọn Data → Data analysis → t-Test Two Sample Assuming Uniequal variances→ OK

Nhập các dãy số liệu, điền mức ý nghĩa α (thường mặc định α = 0,05 tức là p = 95%), chỉ ra nơi xuất dữ liệu.

Kết quả:

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

So sánh t<small>tính</small> và t<small>(p.k)</small>:

+ Nếu t<small>tính</small> ≤ t<small>(p.k) </small>thì hai giá trị trung bình giống nhau + Nếu t<small>tính</small> > t<small>(p.k) </small>thì hai giá trị trung bình khác nhau

Trong ví dụ này t<small>tính</small> > t<small>(p.k) </small> nên hai giá trị trung bình khác nhau

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

<b>CHƯƠNG 2. CÁC PHƯƠNG PHÁP PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUAN </b>

Trong chương 1, chúng ta chỉ xem xét các vấn đề liên quan đến mẫu ngẫu nhiên của một biến ngẫu nhiên X. Trong chương này, chúng ta quan tâm đến mẫu ngẫu nhiên bao gồm các cặp giá trị của hai biến ngẫu nhiên X và Y. Ví dụ để nghiên cứu về chiều cao và cân nặng của các em học sinh trong một trường, chúng ta lẫy mẫu ngẫu nhiên gồm n học sinh và thu thập các số liệu về chiều cao và cân nặng của n học sinh. Gọi X là biến ngẫu nhiên để đo chiều cao của học sinh và Y là biến ngẫu nhiên để đo cân nặng. Với n học sinh ta có n cặp dữ liệu (X<small>i</small>,Y<small>i</small>).

Mục tiêu của chương này là nghiên cứu sự liên hệ giữa biến Y và X bằng phân tích tương quan và hồi quy.

- Trong phân tích tương quan, người ta đề cập đến cường độ của mối quan hệ giữa hai biến Y và X, đánh giá xem hai biến có quan hệ với nhau khơng ?

- Trong phân tích hồi quy, người ta lại xác định quan hệ giữa X và Y dưới dạng phương trình tốn học từ đó ta có thể dự đốn được biến Y (biến phụ thuộc) dựa vào biến X (biến độc lập).

<b>2.1. Phân tích tương quan </b>

Mục đích của phương pháp phân tích tương quan là ước lượng mức độ liên kết (tương quan) giữa các biến độc lập đến biến phụ thuộc, hoặc ảnh hưởng của các biến độc lập với nhau.

Để đo lượng mức độ quan hệ tuyến tính giữa hai biến người ta sử dụng hệ số tương quan r. Xét 2 đại lượng ngẫu nhiên X, Y trong n cặp kết quả quan sát (x<small>1</small>, y<small>1</small>),….(x<small>n</small>,y<small>n</small>). Hệ số tương quan được xác định theo công thức :

Hệ số tương quan khơng có đơn vị, có giá trị trong giới hạn – 1 < r < 1. |r| càng lớn thì tương quan giữa X và Y càng chặt.

+ |r| = 1 : mối quan hệ giữa các biến hoàn toàn chặt chẽ + |r| > 0,8 : tương quan mạnh

+ 0,4 ≤ |r| ≤ 0,8 : tương quan trung bình + |r| < 0,4 : tương quan yếu

+ r = 0 : giữa các biến khơng có mỗi quan hệ

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

<b>2.2. Phân tích hồi quy </b>

<i><b>2.2.1. Khái niệm cơ bản </b></i>

Phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập quy định các biến phụ thuộc như thế nào.

Đây là phương pháp thống kê mà giá trị kì vọng của một hay nhiều biến ngẫu nhiên được dự đoán dựa vào điều kiện của các biến ngẫu nhiên (đã tính tốn) khác. Cụ thể, có hồi qui tuyến tính, hồi qui lơgic, hồi qui Poisson và học có giám sát. Phân tích hồi qui khơng chỉ là trùng khớp đường cong (lựa chọn một đường cong mà vừa khớp nhất với một tập điểm dữ liệu); nó cịn phải trùng khớp với một mơ hình với các thành phần ngẫu nhiên và xác định. Thành phần xác định được gọi là bộ dự đoán và thành phần ngẫu nhiên được gọi là phần sai

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

<i><b>2.2.2. Phương pháp bình phương tối thiểu </b></i>

Phương pháp bình phương tối thiểu do nhà tốn học người Đức Carl Frieddich Gauss đưa ra. Phương trình hồi quy gần đúng phụ thuộc vào phương pháp tính dùng để tính các hệ số hồi quy. Phương pháp bình phương tối thiểu xác định hệ số phương trình hồi quy sao cho gần đúng với kì vọng toán học của thực nghiệm.

- Bài toán xác định hệ số hồi quy là xác định cực tiểu của hàm nhiều biến b<small>o, </small>b<small>1</small>,…

 <i><sup>n</sup></i> <sub></sub> <i><sub>i</sub></i>  ( , , ,...)<i><sub>i</sub><sub>o</sub></i> <sub>1</sub> <sub></sub><sup>2</sup> min

Trong đó x<small>i </small>: là yếu tố biến độc lập ; y<small>i </small>: giá trị thực nghiệm ; <i>Y</i><sub>= f(x</sub><sub>i</sub><sub>,b</sub><sub>o</sub><sub>,b</sub><sub>1</sub><sub>,…) giá trị </sub>

tìm được theo phương trình hồi quy.

Nếu <i>Y</i>= f(x<small>i</small>,b<small>o</small>,b<small>1</small>,…) là hàm khả vi thì điều kiện cực tiểu của  <i><sub> là : </sub></i>

Lập hệ phương trình với các biến b<small>0</small>, b<small>1</small>, b<small>2</small>,…Hệ phương trình thu được có bao nhiêu phương trình thì phương trình hồi quy có bấy nhiêu hệ số. Bằng các phương pháp toán học

<i>ta xác định được các hệ số của phương trình chuẩn. </i>

<i><b>2.2.3. Một số dạng phương trình hồi quy </b></i>

Tối ưu hóa phụ thuộc một biến <i>Y</i>= f(x) theo dạng hồi quy thực nghiệm.

<b>a) Phương trình hồi quy tuyến tính </b>

Phương trình hồi quy tuyến tính một biến có dạng : <i>Y</i>= b<small>o</small> + b<small>1</small> x

Các hệ số của phương trình hồi quy được xác định bằng phương pháp bình phương tối thiểu, với số thí nghiệm n là :

</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">

<b>Ví dụ : Khi nghiên cứu ảnh hưởng của nhiệt độ đến tốc độ phản ứng phân hủy HI : </b>

2HI  I<small>2</small> + H<small>2</small> ta được dữ liệu :

Như vậy sự phụ thuộc của lnk và 1/T là phương trình tuyến tính dạng y = b<small>0</small> + b<small>1</small>x. Sử dụng phương pháp bình phương tối thiểu có thể tìm được phương trình hồi quy, từ đó xác định được năng lượng hoạt hóa E<small>a</small>.

</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">

Trong trường hợp này hệ phương trình chuẩn có dạng :

Giải hệ 3 phương trình 3 ẩn sẽ thu được các hệ số hồi quy b<small>0</small>, b<small>1</small>, b<small>2</small><sup>.</sup>

<b>Ví dụ tìm hệ số hồi quy của phương trình hồi quy parabol cho cặp số liệu : </b>

Suy ra phương trình hồi quy thu được : Y = 5,957 + 0,344 x + 0,907 x<small>2</small>

<b>c) Hồi quy hàm mũ và lũy thừa </b>

Khi số thực nghiệm n bé, nếu tăng bậc của đa thức có thể dẫn đến việc tăng phương sai dư. Lúc này để giảm số các hệ số không xác định, ta dùng hồi quy hàm số mũ hoặc lũy thừa. Việc xác định các hệ số của phương tình hồi quy có thể rất khó khăn do phải giải hệ phương trình phi tuyến tính. Việc tính tốn sẽ trở nên đơn giản hơn nếu tiến hành thay thế các biến số và hạ bậc đa thức. Ví dụ các quan hệ hàm số mũ kiểu : <i>Y</i>= b<small>o</small> x<small>b1</small> hoặc lũy thừa :

<i>Y</i>= b<small>o</small>.b<small>1</small> . Logarit hóa ta được : log<i>Y</i>= logb<small>o</small> + b<small>1</small> log x hoặc : log<i>Y</i>= logb<small>o</small> + x log b<small>1</small>. Sau khi đặt log<i>Y Z</i> <i> ; log b</i><small>o</small> = a<small>o </small>; log x = t ; logb<small>1</small> = a<small>1</small>, sẽ thu được phương trình tuyến

</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27">

Nếu thông số tối ưu phụ thuộc vào k biến độc lập (x<small>1</small>, x<small>2</small>,…x<small>k</small>) gọi là hồi quy tuyến tính bội k :

<i>Y</i>= b<small>o</small> + b<small>1</small> x<small>1</small> + b<small>2</small> x<small>2</small> +…+ b<small>k</small>x<small>k </small>

Ở đây chúng ta gặp không phải đường hồi quy, mà là mặt phẳng hồi quy khi k = 2 và mặt hyper khi k > 2. Trong trường hợp chung, bề mặt này gọi là bề mặt mức hoặc bề mặt đáp trị. Khi xây dựng bề mặt mức trên các trục tọa độ của không gian yếu tố cần phải đặc các giá trị bằng số của các yếu tố lên hệ tọa độ. Phải chuyển từ quy mô tự nhiên sang quy mô chuẩn. Nghĩa là phải tiến hành chuẩn hóa tất cả các giá trị cả các đại lượng ngẫu nhiên theo các công thức thống kê và chuyển từ biến thực sang biến được mã hóa khơng thứ ngun.

<b>2.3. Kiểm tra thống kê </b>

Sau khi xác định được các hệ số của phương trình hồi quy cần tiến hành kiểm định ý nghĩa của hệ số hồi quy và sự tương thích của phương trình hồi quy.

<i><b>2.3.1. Kiểm tra ý nghĩa của các hệ số trong phương trình hồi quy </b></i>

Mục đích của kiểm tra này là xem các hệ số b<small>j</small> trong các phương trình hồi quy có khác khơng với độ tin cậy nào đó hay khơng ?

Để kiểm tra ý nghĩa của các hệ số trong phương trình hồi quy ta phải sử dụng chuẩn Student (t).

Các bước tiến hành kiểm tra :

B1 : Tính chuẩn t<small>tn</small> theo cơng thức : t<small>tn</small> = t<small>j</small> = <i><sup>j</sup></i>

B2 : Tra bảng t<small>p(f)</small> ứng với mức ý nghĩa P chọn trước và bậc tự do f ứng với phương sai tái hiện của từng phương án mà người nghiên cứu đã chọn (f = số thí nghiệm – 1).

B3 : So sánh t<small>j</small> và t<small>p(f) </small>:

+ Nếu t<small>j</small> > t<small>p(f) </small> thì hệ số b<small>j</small> có ý nghĩa là được giữ lại trong phương trình hồi quy

</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">

<b>Ví dụ 1: trở lại với ví dụ tìm hệ số hồi quy của phương trình tuyến tính lnk – 1/T ở </b>

trên. Từ số liệu bằng phương pháp bình phương tối thiểu đã xác định được b<small>0</small> = 25,753; b<small>1</small> = 22147,8. Để kiểm tra xem các hệ số b<small>0</small>, b<small>1</small> có ý nghĩa hay khơng ta cần thực hiện thí nghiệm lặp để tìm phương sai tái hiện. Ví dụ thực hiện thí nghiệm ở điều kiện T = 673 K, kết quả 3 lần đo thu được k = 7,3.10<small>-4 </small>; 8,3.10<small>-4 </small>; 8,6.10<small>-4</small> M<small>-1</small>.s<small>-1</small>.

Tra cứu trong Bảng phân vị Student t<small>0,95(2)</small> = 4,3. Như vậy cả t<small>0</small> và t<small>1</small> đều lớn hơn rất nhiều so với t<small>bảng</small> nên cả hệ số b<small>0</small> và b<small>1</small> đều có ý nghĩa.

<b>Ví dụ 2: Tìm và kiểm tra ý nghĩa các hệ số b</b><small>0</small>, b<small>1</small>, b<small>2</small> trong phương trình hồi quy parabol cho

</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">

Suy ra phương trình hồi quy thu được : Y = 6,175 + 0,102 x + 0,977 x<small>2</small>

Tra cứu trong Bảng phân vị Student t<small>0,95(12)</small> = 2,18. Như vậy cả t<small>0 </small>; t<small>1</small> và t<small>2</small> đều lớn hơn rất nhiều so với t<small>bảng</small> nên cả hệ số b<small>0</small> ; b<small>1 </small>; b<small>2</small> đều có ý nghĩa độ tin cậy P = 95%.

Với độ tin cậy P = 0,98 => t<small>0,98(12)</small> = 2,68, trong các t<small>j</small> thì t<small>1</small> nhỏ hơn t<small>bảng </small>nên b<small>1</small> khơng có ý nghĩa và phương trình hồi quy trở thành :Y = 6,175 + 0,977 x<small>2</small>

<i><b>2.3.2. Kiểm tra sự tương thích của phương trình hồi quy với thực nghiệm </b></i>

Dạng phương trình hồi quy là do người nghiên cứu tự chọn và các hệ số trong phương trình hồi quy được xác định dựa trên các dữ liệu thực nghiệm. Vì vậy cần phải xem xét mơ tả tốn học đó có phù hợp với thực nghiệm hay không, và người ta dùng phân phố Fisher (F) với một mức ý nghĩa nào đó.

<b>Các bước tiến hành kiểm tra : </b>

Bước 1 : Viết phương trình hồi quy với các hệ số có nghĩa Bước 2 : Tính F<small>tn</small> theo cơng thức : F<small>tn</small> = F<small>j</small> =

Trong đó S<small>tt</small><sup>2</sup> và S<small>th</small><sup>2</sup> là phương sai tương thích và phương sai tái hiện.

Bước 3 : Tra bảng giá trị F<small>b</small> = F<small>p </small>(f<small>1</small>,f<small>2</small>) tức là ứng với mức ý nghĩa P đã chọn và bậc tự do f<small>1</small>=f<small>tt</small> = n- L; f<small>2</small> = m-1 ( n là số thí nghiệm và L là số hệ số có nghĩa trong phương trình hồi quy ; m là số thí nghiệm tại tâm).

Bước 4 : So sánh F<small>tn</small> với F<small>b</small>

+ Nếu F<small>tn</small> < F<small>b </small>: phương trình hồi quy phù hợp với thực nghiệm

+ Nếu F<small>tn</small> > F<small>b </small>: phương trình khơng phù hợp và làm tiếp các công việc sau : kiểm tra lại công việc tính tốn – Xem lại mơ hình nghiên cứu – chọn mơ hình tốn học ở mức độ

</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">

<b>- Phương án thực nghiệm tại tâm : Sau khi hồn tất các thí nghiệm để xác định hệ </b>

số b, người nghiên cứu phải làm thêm m (m ≥ 3) thí nghiệm ở tâm với các giá trị ứng với thí

<i>n L</i> <sup>, với </sup> <i>y là giá trị được tính theo <small>i</small></i>

phương trình hồi quy ở điều kiện thí nghiệm thứ i ; y<small>i</small>.là giá trị thực nghiệm tại thí nghiệm thứ i.

<b>- Phương án thí nghiệm song song </b>

Tại mỗi điểm thí nghiệm được lặp lại m lần. Trước khi tính tốn hệ số b và kiểm định các thông số thông kê phải kiểm tra sự đồng nhất của các phương sai theo chuẩn Cochran (G), chỉ được phép ước lượng các sai số khi phương sai đồng nhất.

Q trình tính tốn thực hiện :

<b>1. Tính giá trị trung bình của y</b><small>i</small> ở mỗi điểm thí nghiệm :

So sánh với giá trị bảng : G<small>p,(f1 ;f2)</small> với P là mức ý nghĩa ; f<small>1</small> = m-1 ; f<small>2</small> = n Nếu G < G<small>p,(f1 ;f2)</small> ta có phương sai đồng nhất.

</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">

<b>7. Phương sai tương thích : </b> <sub></sub>

So sánh với giá trị bảng F<small>p,(f1,f2)</small>, với f<small>1</small> = n-L ; f<small>2</small> = n(m-1) Nếu F < F<small>p,(f1,f2)</small> thì phương trình tương thích với thực nghiệm

Nếu F > F<small>p,(f1,f2)</small> thì phương trình khơng tương thích với thực nghiệm

<b>Ví dụ : kiểm tra sự tương thích của phương trình hồi quy : lnk = 25,735 - 22147,8. 1/T ở ví </b>

dụ trên.

Phương sai tái hiện đã xác định ở trên S<small>th</small><sup>2</sup> = 0,0074

Tra bảng phân vị Fisher giá trị F<small>0,95,(3;2)</small> = 19,2

Vì F<small>tính</small> < F<small>bảng</small> nên phương trình tương thích với thực nghiệm

<b>2.4. Sử dụng phần mềm excel để phân tích tương quan và hồi quy </b>

<i><b>2.4.1. Sử dụng công cụ trendline của chart </b></i>

Chọn Insert → chart → scatter

</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">

Nhấp chuột phải vào điểm trên đồ thị, sau đó bấm Add trendline và lựa chọn các dạng hồi quy phù hợp.

<b>Chọn Display Equation on chart: hiển thị phương trình hồi quy </b>

Chọn display R-squared value on chart: cho biết r<small>2</small><b> (hệ số tương quan (tỉ số tương quan) bình phương). </b>

</div>

×