Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (683.83 KB, 18 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
Sau khi đọc bảng dữ liệu ta nhận xét rằng dữ liệu bao gồm 78 đối tượng tham gia và có7 biến bao gồm :
<b>- Person: số thứ tự của người tham gia thử nghiệm - gender: giới tính của người tham gia (1 = nam, 0 = nữ) - Age: tuổi (năm) </b>
<b>- Height: chiều cao (cm) </b>
<b>- pre.weight: cân nặng trước khi áp dụng chế độ ăn kiêng (kg) - Diet: chế độ ăn kiêng (3 chế độ khác nhau) </b>
<b>- weight6weeks: cân nặng sau 6 tuần ăn kiêng</b>
Ta khai biến trong R:
Ta nhận thấy trong bảng dữ liệu ở đối tượng 25 và 26 cịn trống ơ ở mục gender do đóta cần gán giá trị cho nó. Nhìn vào dataframe của data, ta nhận ra rằng giá trị của biếngender được liệt kê với giá trị 0 trước 1 sau, và sẽ lặp lại khi biến Diet thay đổi giá trị.
</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">Với logic này, đề xuất gán các giá trị NA tại ô thứ 25, 26 của biến gender bằng
giá trị 0. Thay 0=Nữ và 1= Nam cho cột gender.ta được bảng dữ liệu data hoàn chỉnhtrong R như sau:
</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">Ta thực hiện phân tích mẫu dựa trên yếu tố về giới tính và so sánh về số lượng quabiểu đồ barplot:
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8"><b>Tính tốn các Thống kê mô tả của mẫu: </b>
Dùng các lệnh summary và desc.
R khơng có hàm tính sai số chuẩn, và trong hàm summary, R cũng khơng cung cấp độlệch chuẩn. Để có các số này, chúng ta có thể tự viết một hàm đơn giản (hãy gọi làdesc) như sau:
desc <- function(x)
{ av <- mean(x) sd <- sd(x) se <- sd/sqrt(length(x)) c(MEAN=av, SD=sd, SE=se) }
</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">Ta thực hiện vẽ đồ thị của các biến trong data như sau:
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">Ta tiếp đến phân loại ra ba chế độ ăn khác nhau:
Ta có ba bảng liệt kê mỗi chết độ ăn như sau:
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">Đồ thị của 3 chế độ ăn trên đường tròn :
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">Tính tốn thống kê của 3 chế độ ăn thông qua lệnh summary.dataframe:
Tiếp đến ta so sánh sự hiệu quả giữa 3 chế độ ăn ( thông qua lượng cân nặng mất đi = cân nặng trước khi tham gia – cân nặng sau 6 tuần). Thực hiện các câu lệnh để tìm cân nặng mất đi( weightloss) và sử dụng biểu đồ boxplot để so sánh:
</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14"><b>NHẬN XÉT </b>
<b>CÂN NẶNG GIẢM ĐƯỢC THƠNG QUA CHẾ ĐỘ 1: </b>
- Có 25% cân nặng giảm ít hơn hoặc bằng 2. - Có 50% cân nặng giảm ít hơn hoặc bằng 3. - Có 75% cân nặng giảm ít hơn hoặc bằng 4. - Cân nặng giảm nhiều nhất khoảng 7 (IQR ≈ 2). - Cân nặng giảm ít nhất khoảng -1.
- Có thể có các giá trị ngoại vi trên giá trị cao nhất.
<b>CÂN NẶNG GIẢM ĐƯỢC THÔNG QUA CHẾ ĐỘ 2: </b>
- Có 25% cân nặng giảm ít hơn hoặc bằng 1.9. - Có 50% cân nặng giảm ít hơn hoặc bằng 3.4. - Có 75% cân nặng giảm ít hơn hoặc bằng 4.2.
- Cân nặng giảm nhiều nhất khoảng 7.65 (IQR ≈ 2.3). - Cân nặng giảm ít nhất khoảng -1.55.
<b>CÂN NẶNG GIẢM ĐƯỢC THÔNG QUA CHẾ ĐỘ 3: </b>
- Có 25% cân nặng giảm ít hơn hoặc bằng 3.5. - Có 50% cân nặng giảm ít hơn hoặc bằng 5.5. - Có 75% cân nặng giảm ít hơn hoặc bằng 7.
- Cân nặng giảm nhiều nhất khoảng 12.25 (IQR ≈ 3.5). - Cân nặng giảm ít nhất khoảng -1.75.
</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">Chúng ta cần kiểm tra nhân tố chính đó là Diet bao gồm 3 mức : chế độ ăn kiêng 1,2và 3 (diet_1,diet_2,diet_3).Để xác đinh chế độ ăn kiêng nào hiệu quả nhất chúng ta cầnphải dựa vào biến weightloss ở 3 chế độ.
Lập bảng phương sai ANOVA với x là lượng cân giảm và group là nhóm, ta được bảng dữ liệu như bên dưới :
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">Phân tích anova bảng dữ liệu bằng lệnh aov ta xác định được các giá trị như: sự biếnthiên giữa các nhóm (SSB), sự biến thiên trong từng nhóm (SSW) , trung bình phươnggiữa các nhóm và trong từng nhóm , thống kê F:
So sánh sự hiệu quả giữa 3 chế độ ăn trơng qua biến cân nặng trung bình giữa 3 chế độvà LSD.
</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">