Tải bản đầy đủ (.docx) (37 trang)

ỨNG DỤNG MÁY HỌC DỰ ĐOÁN XU HƯỚNG KHÁCH HÀNG MUA BẢO HIỂM DU LỊCH Ở ẤN ĐỘ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.5 MB, 37 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b>ĐẠI HỌC UEH</b>

<b>TRƯỜNG KINH DOANH</b>

<b>KHOA KINH DOANH QUỐC TẾ - MARKETING</b>

Sinh viên: Nguyễn Đình Bách-31211026220 Nguyễn Đức Bắc-31211022861 Nguyễn Cảnh Khánh-31211026221 Ngô Phi Khương-31211024113 Cao Minh Trí-31211024365Khóa – Lớp: 47 – IN001

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<b>MỤC LỤC</b>

<b><small>CHƯƠNG 1: TỔNG QUAN...7</small></b>

<b><small>1. Lý do chọn đề tài...7</small></b>

<b><small>2. Mục tiêu nghiên cứu...7</small></b>

<b><small>3. Đối tượng nghiên cứu...8</small></b>

<b><small>CHƯƠNG 2: QUY TRÌNH THỰC HIỆN VÀ KẾT QUẢ...8</small></b>

<small></small> <b><small>Mơ tả dữ liệu và cấu trúc dữ liệu...8</small></b>

<small></small> <b><small>Tiền xử lý dữ liệu:...10</small></b>

<b><small>1. BÀI TOÁN 1. BÀI TOÁN PHÁT HIỆN ĐIỂM ĐẶC THÙ CỦA DỮ LIỆU.111.1Mơ tả bài tốn 1...11</small></b>

<b><small>1.2Chạy mơ hình và kết quả...11</small></b>

<small></small> <b><small>Tỷ lệ mua bảo hiểm du lịch...11</small></b>

<b><small>1.3Kết quả thơng qua từ bài tốn...18</small></b>

<b><small>2. BÀI TỐN 2: DỰ ĐOÁN VIỆC MUA BẢO HIỂM DU LỊCH CỦA KHÁCH HÀNG...18</small></b>

<b><small>3.1Mơ tả bài tốn...18</small></b>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

<small>Hình 5. Kết quả Tree</small>

<small>Hình 6. Kết quả dự báo khách hàng mua hoặc khơng mua bảo hiểm du lịchHình 7. Mơ hình bài tốn phân cụm/nhóm có khả năng tham gia bảo hiểmHình 8. Kết quả của phương pháp K-means</small>

<small>Hình 9. Kết quả Silhouette Plot</small>

<small>Hình 10. Phân bố số lượng người mua bảo hiểm dựa theo độ tuổi của 2 nhómHình 11. Phân bố số lượng người mua bảo hiểm theo loại cơng việc của 2 nhómHình 12. Phân bố số lượng người mua bảo hiểm theo bằng tốt nghiệp của 2 nhómHình 13. Phân bố số lượng người mua bảo hiểm theo thu nhập của 2 nhóm</small>

<small>Hình 14. Phân bố số lượng người mua bảo hiểm theo số thành viên gia đình của 2nhóm</small>

<small>Hình 15. Phân bố số lượng người mua bảo hiểm theo bệnh mãn tính của 2 nhóm</small>

<small>Hình 16. Phân bố số lượng người mua bảo hiểm theo việc thường xun đi du lịch của2 nhóm</small>

<small>Hình 17. Phân bố số lượng người mua bảo hiểm dựa theo việc đã du lịch nước ngồicủa 2 nhóm</small>

<small>Hình 18. Kết quả của Feature Statistic</small>

<small>Biểu đồ 8. Thường xuyên đi du lịchBiểu đồ 9. Đã du lịch nước ngoài</small>

<b>DANH MỤC BẢNG</b>

<small>Bảng 1. Mô tả dữ liệu nghiên cứu</small>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>LỜI CẢM ƠN</b>

<i>Kính chào thầy Nguyễn Mạnh Tuấn,</i>

<i>Sau 5 buổi học bộ môn Khoa học dữ liệu của thầy, nhóm 2 chúng em đãđược tiếp cận và tìm hiểu thêm về mảng kiến thức thuộc lĩnh vực Data Science.Cụ thể là cách chúng ta có thể sử dụng dữ liệu để đưa ra các giải pháp hiệu quảgiải quyết các vấn đề của doanh nghiệp. Hoặc là khai thác nguồn dữ liệu tối ưuđể phát triển các sản phẩm công nghệ phục vụ nhu cầu con người. </i>

<i>Và trong q trình học tập, nhờ có sự tận tình giảng dạy của thầy, nhữngbài học ấy chắc chắn sẽ là tiền đề để bản thân chúng em có thể học hỏi, vậndụng trong quá trình học tập và cả trong tương lai. Việc vận dụng ấy đã đượcnhóm chúng em đã thực hiện trong mơ hình đồ án lần này. Do chưa có nhiềukinh nghiệm và kiến thức chuyên mơn, nên chúng em khó có thể tránh đượcnhưng sai lầm hoặc thiếu sót. Tuy nhiên, nhóm chúng em đã cố gắng cùng nhauđể cống hiện và hoàn thiện bài đồ án này một cách trọn vẹn nhất.</i>

<i>Chính vì vậy, rất mong thầy có thể đóng góp ý kiến cũng như nhận xét đểchúng em có thể rút kinh nghiệm và hồn thiện thêm. </i>

<i>Lời cuối cùng, nhóm 02 chúng em xin chân thành cảm ơn thầy NguyễnMạnh Tuấn, chúc thầy có thật nhiều sức khỏe và ln giữ được nhiệt huyết trêncon đường truyền đạt kiến thức và giảng dạy của thầy.</i>

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<b>CÁC BÀI TOÁN LIÊN QUAN TỚI CHUYÊN NGÀNH</b>

Ngành Bảo hiểm nói chung và Bảo hiểm nhân thọ hay phi nhân thọ nói riêng làmột ngành kinh doanh đặc thù dựa trên việc bảo vệ tài sản, sức khỏe và tínhmạng con người. Do đó, đặc thù của ngành rất cần thông tin và dữ liệu củakhách hàng để từ đó có một bộ dữ liệu khách hàng tiềm năng nhằm cung cấpđúng và đủ dịch vụ cũng như chọn những phương pháp, gói bảo hiểm phù hợpcho khách hàng. Vì thế nhóm đã chọn đề tài “Ứng dụng máy học dự đoán xuhướng khách hàng mua bảo hiểm du lịch ở Ấn Độ” để có thể áp dụng kiến thứcchuyên ngành vào việc xử lí bộ dữ liệu để từ đó dự đốn xu hướng khách hàngtừ một thị trường dân số lớn như Ấn Độ.

Nhóm đã sử dụng cơng cụ Orange và Excel để thực hiện và giải quyết 3 bàitoán như sau:

Bài toán 1 (Liên quan): Sử dụng các hàm thống kê thông dụng, công cụ, lượcđồ, biểu đồ để phát hiện những đặc điểm đặc thù của bộ dữ liệu. Ở bài tốn nàynhóm đã sử dụng các cơng cụ để phân tích những đặc tính liên quan đến tỉ lệmua bảo hiểm du lịch của khách hàng và từ đó đưa ra thêm những dự tính về bộdữ liệu khách hàng. Vốn là môt ngành đặc thù về sử dụng dữ liệu và việc sửdụng hợp lí, hiểu và từ đó phân tích được dữ liệu của khách hàng sẽ đem lạiđược doanh thu cũng như sự hài lòng, thấu hiểu đối với khách hàng cũng nhưđem lại được một nguồn doanh thu đều đặn và hiệu quả.

Bài toán 2 ( Liên quan): Dự đoán được việc mua bảo hiểm của khách hàng ( bàitoán phân lớp dữ liệu).

Đây là một bài toán rất quan trọng cũng như mang tính quyết định cho đề tài khidự đốn và phân tích tệp dữ liệu cũng như khả năng dự đốn việc mua bảo hiểmcủa khách hàng. Bằng việc cho Orange được học 3 phương pháp SVM, TREE

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

khơng cần xét đến Test and Score để phân tích và dự báo tệp dữ liệu kháchhàng. Ngành Bảo Hiểm thực sự rất cần sử dụng đúng và hiểu hồi quy cũng nhưtừ đó dự đốn bộ dữ liệu trở nên hợp lí để thơng qua đó, kết quả dự báo sẽ giúpta có thể xác định được những tệp khách hàng tiềm năng khách nhau, cũng nhưnhu cầu của khách hàng về sản phẩm bảo hiểm . Qua đó, các công ty bảo hiểmsẽ thiết kế được những sản phẩm phù hợp với thị hiếu khách hàng.

Bài toán 3 ( Liên quan): Phân loại các nhóm khách hàng có khả năng cao thamgia bảo hiểm du lịch (Bài toán phân cụm dữ liệu).

Ở bài tốn phân cụm, nhóm đã phân dữ liệu ra hai nhóm C1, C2 theo từng đặcđiểm từ đó nhìn nhận được xu hướng mua bảo hiểm của các nhóm khách hàngđể tút ra dự đoán,kết luận tổng thể. Ngành Bảo Hiểm rất đề cao việc hiểu vànghiên cứu xu hướng khách hàng cũng như thị trường để có thể xây dựng mộtkế hoạch kinh doanh hợp lí nhằm phát triển doanh thu và cung cấp những sảnphẩm chất lượng, đáng giá tiền cho người sử dụng.

Ba bài toán trên đều liên quan đến việc dự đoán xu hướng khách hàng giúp cungcấp tầm nhìn, số liệu cho các cơng ty có thể tiếp cận những tệp khách hàng tiềmnăng và thay đổi sản phẩm phù hợp với khách hàng, thị trường.

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<b>CHƯƠNG 1: TỔNG QUAN</b>

<b>1. Lý do chọn đề tài</b>

Trong những năm gần đây, việc mua bảo hiểm du lịch đã trở nên ngàycàng phổ biến và quan trọng đối với các khách hàng khi đi du lịch.Đặc biệt làsau covid-19 thì tầm quan trọng của việc bảo vệ bản thân và tài sản được đặt lênhàng đầu. Ngay cả khi bạn nghỉ ngơi sau một thời gian dài chìm đắm trongcơng việc,thì chắc chắn bạn có thể lựa chọn đi du lịch , dã ngoại,..., . Khơng cómột điều gì là chắc chắn bởi có thể xảy ra các sự cố bất ngờ như tai nạn, bệnhtật hoặc mất mát tài sản.

Một trong những lý do đáng nói tới đó là thị trường bảo hiểm du lịch đangphát triển: Ngành công nghiệp du lịch và bảo hiểm đang trên đà phát triển mạnhmẽ, đặc biệt với sự gia tăng về số lượng du khách và các loại hình du lịch khácnhau.Thị trường bảo hiểm du lịch thường biến đổi nhanh chóng và phụ thuộcvào nhiều yếu tố khác nhau như thời tiết, sự kiện, xu hướng du lịch và kinh tế.Áp dụng máy học để dự đoán xu hướng khách hàng mua bảo hiểm du lịch giúpcông ty bảo hiểm nắm bắt được sự thay đổi của thị trường và điều chỉnh chiếnlược kinh doanh một cách linh hoạt. Điều này giúp tạo ra sự đột phá cạnh tranhvà cung cấp giá trị gia tăng cho khách hàng.

Nhóm nghiên cứu muốn tạo ra một hệ thống để dự đoán xem một kháchhàng có mua bảo hiểm du lịch hay khơng thơng qua nhiều yếu tố. Nhóm hyvọng rằng việc phân tích dữ liệu sẽ giúp trả lời một số câu hỏi về cách các yếu tốkhác nhau ảnh hưởng đến quyết định của khách hàng khi mua bảo hiểm du lịchvà xác định nguyên nhân góp phần vào quyết định của họ. Kết quả nghiên cứucó thể hỗ trợ các cơng ty bảo hiểm trong việc xác định chính sách và biện phápđể tăng khả năng khách hàng mua bảo hiểm du lịch, đồng thời giảm thiểu việckhách hàng không mua bảo hiểm hoặc chuyển sang công ty bảo hiểm khác.

<b>2. Mục tiêu nghiên cứu 2.1 Mục tiêu tổng quát</b>

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

Mục tiêu là nghiên cứu xu hướng mua và hành vi khách hàng khi mua bảohiểm du lịch.

<b>2.2 Mục tiêu cụ thể </b>

Bài toán 1: Phát hiện điểm đặc thù của dữ liệu.

Bài toán 2: Dự đốn liệu khách hàng có quan tâm đến việc mua bảo hiểm du lịchhay khơng.

Bài tốn 3: Phân cụm/nhóm khách hàng có khả năng cao tham gia bảo hiểm khiđi du lịch.

<b>3. Đối tượng nghiên cứu</b>

Một công ty du lịch & lữ hành đang cung cấp gói bảo hiểm du lịch chokhách hàng của họ. Dữ liệu được cung cấp cho gần 2000 khách hàng trước đâycủa công ty và được u cầu xây dựng một mơ hình thơng minh có thể dự đốnliệu khách hàng có quan tâm đến việc mua gói bảo hiểm du lịch hay khơng dựatrên các thông số nhất định được đưa ra dưới đây.

<b>CHƯƠNG 2: QUY TRÌNH THỰC HIỆN VÀ KẾT QUẢ</b>

 <b>Mơ tả dữ liệu và cấu trúc dữ liệu</b>

Nguồn dữ liệu được lấy từ trang:

Đây là bộ dữ liệu do một công ty du lịch và lữ hành tổng hợp được từ cácthông tin, xu hướng khách hàng của họ trong 2 năm (2017-2019) với mục đíchsử dụng bộ dữ liệu từ đó có thể dự đốn xem những khách hàng có khả năng caosẽ tham gia bảo hiểm du lịch.

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

Số thứtự

Thuộc tính Ý nghĩa Kiểu dữ liệu

Integer2 Loại công việc Lĩnh vực mà

khách hàng đanglàm việc

3 Tốt nghiệp Khách hàng có tốtnghiệp hay khơng

Boolean4 Thu nhập thường

Thu nhập hàngnăm

Integer5 Số thành viên gia

Số lượng thànhviên trong gia đình

Integer6 Bệnh mãn tính Khách hàng có

bệnh mãn tính haykhơng

du lịch

Khách hàng cóthường xuyên thựchiện chuyến bayhay khơng

8 Đã du lịch nướcngồi

Khách hàng đãtừng đi du lịchnước ngoài haychưa

9 Bảo hiểm du lịch Khách hàng cómua bảo hiểm dulịch hay không

<b>Bảng 1: Mô tả dữ liệu của nghiên cứu</b>

 <b>Mô tả chi tiết dữ liệu:</b>

Tuổi: Trong khoảng 25-35 tuổi

Loại hình việc làm: Phân thành tư nhân hoặc Nhà Nước

Bằng Tốt Nghiệp: Phân thành đã tốt nghiệp hay chưa tốt nghiệp.

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

Thu Nhập Hằng Năm: Thu nhập nằm trong khoảng 300000 - 1800000 INR (ẤnĐộ)

Thành Viên Gia Đình: Trong khoảng từ 2-9 người

Bệnh Mãn Tính: Phân thành 2 trường hợp 0: khơng có bệnh và 1: có bệnh Thường Xun Bay: Phân thành 2 trường hợp Yes hoặc No

Từng Du Lịch Nước Ngoài: Phân thành 2 trường hợp Yes hoặc No

Bảo Hiểm Du Lịch: Phân thành 2 trường hợp 0: không có bảo hiểm và 1: có bảohiểm

 <b>Tiền xử lý dữ liệu:</b>

Nguồn dữ liệu được lấy từ trang:

Bộ dữ liệu được lấy từ Kaggle đã được xác minh và có đầy đủ thơng tinnên khơng cần phải thực hiện tiền xử lý.

Để thông tin được dễ hiểu và dễ tiếp cận hơn, nhóm sử dụng chức năngEdit Domain để chuyển đổi tên của các thuộc tính từ tiếng Anh sang tiếng Việt.Phân tách dữ liệu (để phù hợp với cấu hình hiện tại của laptop): Từ file dữ liệugốc, nhóm sử dụng chức năng Data Sampler để tách dữ liệu thành 2 file riêngbiệt như sau:70 phần trăm (%) dữ liệu từ dữ liệu gốc được tách ra thành dữ liệuđể huấn luyện mơ hình phân lớp (Data),30 phần trăm (%) từ dữ liệu còn lại đểlàm dữ liệu báo cáo cho mơ hình (Forecast) .

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<b>Hình 1. Tiền xử lý dữ liệu</b>

<b>1. BÀI TOÁN 1. BÀI TOÁN PHÁT HIỆN ĐIỂM ĐẶC THÙ CỦA DỮLIỆU. </b>

<b>1.1Mơ tả bài tốn 1</b>

Sử dụng các hàm thống kê thông dụng, công cụ, lược đồ biểu đồ cuaEXCEL để phát hiện các điểm đặc thù của bộ dữ liệu.

<b>1.2 Chạy mơ hình và kết quả </b>

 <b>Tỷ lệ mua bảo hiểm du lịch</b>

<b>Biểu đồ 1. Tỷ lệ mua bảo hiểm du lịch</b>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

Từ dữ liệu thu nhập được, trong 1987 đối tượng có khoảng 36% là cóbảo hiểm và 64% là khơng có bảo hiểm, điều này chứng tỏ càng nhiều kháchhàng chưa sẵn sàng bỏ tiền ra để mua bảo hiểm du lịch.

 <b>Tuổi</b>

<b>Biểu đồ 2. Độ tuổi</b>

Số liệu cho thấy độ tuổi khách hàng dao động từ 25- 35 tuổi, đây cũngchính là độ tuổi thích đi du lịch và khám phá nhiều nơi nhất. Tiêu biểu là nhómtuổi 28, có tận 506 lượng khách đi du lịch nhưng lại có số người mua bảo hiểmdu lịch khơng cao, chỉ chiếm ¼ khách hàng khơng có bảo hiểm.Trong đó độ tuổitừ dưới 26 tuổi và trên 33 tuổi có xu hướng mua bảo hiểm du lịch nhiều hơn cóthể là vì họ dưới 26 tuổi thì họ ít đi hoặc có khi là chưa đi du lịch bao giờ nên cónhiều lo lắng và nhiều sự chuẩn bị hơn, cịn ở độ tuổi 33 trở lên thì chắc chắn làđã có kinh nghiệm được đi du lịch nhiều nên biết rằng mua bảo hiểm du lịch làmột sự chuẩn bị rất cần thiết.

 <b>Loại công việc</b>

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<b>Biểu đồ 3: Loại cơng việc</b>

Nhóm khách hàng thuộc lĩnh vực nhà nước:Tổng số khách hàng: 570Số khách hàng không mua bảo hiểm du lịch: 430 và số khách hàng cómua bảo hiểm du lịch: 140

 <b>Bằng tốt nghiệp</b>

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<b>Biểu đồ 4. Bằng tốt nghiệp</b>

Số lượng người có bằng tốt nghiệp nhưng khơng mua bảo hiểm du lịch(1081) cao hơn số người có bằng tốt nghiệp và mua bảo hiểm du lịch (611).Điều này có thể cho thấy một số người không đánh giá cao hoặc không nhậnthức đầy đủ về tầm quan trọng của bảo hiểm du lịch, dù có trình độ học vấn cao.Số người khơng có bằng tốt nghiệp nhưng khơng mua bảo hiểm du lịch (196)cũng khá đáng chú ý. Điều này có thể ám chỉ rằng việc khơng có bằng tốt nghiệpcó thể ảnh hưởng đến khả năng nhận thức về tầm quan trọng của bảo hiểm dulịch.

Số người có bằng tốt nghiệp và mua bảo hiểm du lịch (99) khá ít. Điều này cóthể cho thấy một số người nhận ra tầm quan trọng của việc mua bảo hiểm dulịch nhưng khơng có khả năng tài chính hoặc ý thức đủ để mua nó.

 <b>Thu nhập thường niên</b>

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

<b>Biểu đồ 5. Thu nhập thường niên</b>

Thu nhập thường niên của khách hàng được thu thập lại dao động từ300000- 1800000 INR (Ấn Độ) . Ở mức thu nhập từ 300000- 1300000 INR thìkhách hàng hầu như khơng quan tâm nhiều đến bảo hiểm du lịch khi có nhữngdịp đi chơi, có thể có nhiều yếu tố khách quan như thu nhập khơng ổn định, chiphí du lịch, hoặc phí bảo hiểm q cao khiến họ khơng mua được bảo hiểm. Cịnđối với các nhóm có mức thu nhập cao (từ 1350000 trở lên) tỷ lệ tham gia bảohiểm rất cao (~91%), có thể nói với mức thu nhập này thì họ sẵn sàng cho mọichi phí đi du lịch để được an tâm và trọn vẹn nhất..

 <b>Số thành viên gia đình</b>

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

Đa số lượng thành viên đi du lịch sẽ tập trung nhiều ở những gia đình từ3-5 người. Dựa trên dữ liệu về mức độ mua bảo hiểm du lịch trong các nhómthành viên gia đình khác nhau, có thể thấy rằng mức độ ảnh hưởng của bảo hiểmdu lịch lên số thành viên gia đình khơng rõ ràng. Tuy có một số nhóm thành viêngia đình mua bảo hiểm du lịch nhiều hơn những nhóm khác, nhưng tỷ lệ muabảo hiểm vẫn khơng cao ở cả các nhóm. Điều này có thể cho thấy rằng việc muabảo hiểm du lịch không phụ thuộc quá nhiều vào số lượng thành viên gia đình

<b>Bệnh mãn tính</b>

<b>Biểu đồ 7. Bệnh mãn tính</b>

Có một thực tế cho rằng khi con người chưa có bệnh thì họ càng ít quantâm đến sức khỏe của bản thân họ hơn. Có khoảng 1435 người khơng có bệnhmãn tính nhưng trong đó hết 930 người khơng tham gia bảo hiểm vì họ nghĩ làkhơng cần thiết. Trong khi đó 552 người có bệnh thì tỷ lệ người mua bảo hiểmlại cao hơn khơng có bệnh bởi vì họ ý thức được nhiều rủi ro hơn và đánh giátầm quan trọng của bảo hiểm khi đi du lịch, đặc biệt là du lịch nước ngoài.

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

<b>Biểu đồ 8. Thường xuyên đi du lịch</b>

Trong 1987 người thì số lượng người thường xuyên đi du lịch không cao,một số có thể cho rằng đi xa nhiều rất nhiều rủi ro mà khơng thể lường trước,một số cịn cho rằng đã từng đi du lịch nhiều rồi không bị sao và chủ quankhông mua bảo hiểm.

Những người thường xuyên bay có xu hướng mua nhiều bảo hiểm du lịchhơn

 <b>Đã du lịch nước ngoài</b>

<b>Biểu đồ 9. Đã du lịch nước ngồi</b>

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

Những người có kinh nghiệm du lịch trong quá khứ có nhiều khả năngmua bảo hiểm du lịch hơn. Ngược lại các nhóm đối tượng ít đi nước ngồi hoặcchưa bao giờ đi sẽ khơng có xu hướng nhắm tới việc mua bảo hiểm liền.

<b>1.3 Kết quả thơng qua từ bài tốn</b>

Thơng qua các hàm thống kê và các lược đồ, có thể thấy tỷ lệ khách hàngmua bảo hiểm du lịch không cao. Đây là mơ hình tổng qt đánh giá tồn bộ dữliệu mẫu, nên chưa thấy được ý nghĩa thống kê chi tiết của người đã tham giabảo hiểm. Tuy nhiên bài tốn đã trình bày được những điểm đặc thù của cácbiến có mối quan hệ tương quan như thế nào đến biến phụ thuộc. Từ đó cáccơng ty bảo hiểm có thể nhìn thấy được tiềm năng và đánh giá nhanh các đốitượng khách hàng của mình.

<b>2. BÀI TOÁN 2: DỰ ĐOÁN VIỆC MUA BẢO HIỂM DU LỊCHCỦA KHÁCH HÀNG</b>

<b>3.1 Mơ tả bài tốn</b>

Bước 1: Chọn dữ liệu File “BHDL” và chọn cột “Bảo hiểm du lịch” làm Target.Bước 2: Mở File “Data”, nối File và 3 phương pháp SVM, Tree và LogisticRegression với Test and Score. Nối Test and Score với Confusion Matrix đểthực hiện kết quả và đánh giá ma trận nhầm lẫn.

Bước 3: Liên kết phương pháp tốt nhất và File “Insurance_forecast” vớiPredictions để đánh giá và phân loại dữ liệu đầu vào.

Bước 4: Xuất kết quả dự báo qua Data Table, nhận xét và đánh giá.

<b>3.2 Xây dựng mơ hình. </b>

</div>

×