BỘ GIÁO DỤC & ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH
KHOA QUẢN LÝ ĐẤT ĐAI & BẤT ĐỘNG SẢN
BÁO CÁO TỐT NGHIỆP
ĐỀ TÀI:
ỨNG DỤNG PHẦN MỀM DTREG ĐỂ ĐÁNH GIÁ
THÍCH NGHI ĐẤT ĐAI CHO TRỒNG ĐIỀU TRÊN ĐỊA
BÀN HUYỆN ĐỊNH QUÁN TỈNH ĐỒNG NAI
SVTH
MSSV
LỚP
KHÓA
NGÀNH
:
:
:
:
:
PHAN NGUYỄN HOÀNG HẢI
07124027
DH07QL
2007 - 2011
Quản lý đất đai
TP. Hồ Chí Minh, tháng 8 năm 2011
TRƯỜNG ĐẠI HỌC NÔNG LÂM TP.HỒ CHÍ MINH
KHOA QUẢN LÝ ĐẤT ĐAI & BẤT ĐỘNG SẢN
BỘ MÔN QUẢN LÝ ĐẤT ĐAI
PHAN NGUYỄN HOÀNG HẢI
ỨNG DỤNG PHẦN MỀM DTREG ĐỂ ĐÁNH GIÁ
THÍCH NGHI ĐẤT ĐAI CHO TRỒNG ĐIỀU TRÊN ĐỊA
BÀN HUYỆN ĐỊNH QUÁN TỈNH ĐỒNG NAI
Giáo viên hướng dẫn: TS. Trần Thanh Hùng
Địa chỉ cơ quan: Trường Đại Học Nông Lâm TP.Hồ Chí Minh
Ký tên: ………………………………
Tháng 8 năm 2011
LỜI CẢM ƠN
Để có được như ngày hôm nay, lời đầu tiên tôi xin chân thành kính gửi
đến Ba Mẹ lòng biết ơn sâu sắc nhất, người đã sinh thành, nuôi dưỡng, yêu
thương và luôn tạo những điều kiện tốt nhất cho việc học tập của tôi trong
suốt cả chặng đường dài mà tôi đã đi qua.
Tôi trân trọng biết ơn:
Ban Giám Hiệu trường Đại Học Nông Lâm, thành phố Hồ Chí Minh.
Ban Chủ Nhiệm Khoa Quản Lý Đất Đai & Bất Động Sản.
Thầy Trần Thanh Hùng đã tận tình chỉ dạy, trực tiếp hướng dẫn tôi
hoàn thành tốt báo cáo tốt nghiệp.
Cùng tất cả quý Thầy, Cô đã tận tình giảng dạy, truyền đạt những kinh
nghiệm và bài học quý báu làm hành trang cho tôi trong cuộc sống và công
việc sau này.
Quý Anh, Chị đã giúp đỡ và tạo điều kiện thuận lợi để tôi an tâm hoàn
thành việc học.
Lời cuối cùng, tôi cảm ơn các bạn lớp Quản Lý Đất Đai Khóa 33, Quản
Lý Thị Trường Bất Động Sản khóa 33 đã đồng hành, giúp đỡ tôi trong suốt
thời gian học tập, sinh hoạt tại trường.
Với lòng biết ơn sâu sắc nhất, xin chúc quý thầy cô, quý anh chị, và các
bạn nhiều sức khỏe và thành công trong cuộc sống.
TP.Hồ Chí Minh, ngày 20 tháng 8 năm 2011
Sinh viên
Phan Nguyễn Hoàng Hải
TÓM TẮT
Sinh viên thực hiện: Phan Nguyễn Hoàng Hải, Ngành Quản Lý Đất Đai, Khoa
Quản Lý Đất Đai & Bất Động Sản, Trường Đại Học Nông Lâm TP.Hồ Chí Minh.
Đề tài: “ỨNG DỤNG PHẦN MỀM DTREG ĐỂ ĐÁNH GIÁ THÍCH NGHI
ĐẤT ĐAI CHO TRỒNG ĐIỀU TRÊN ĐỊA BÀN HUYỆN ĐỊNH QUÁN TỈNH
ĐỒNG NAI”
Giáo viên hướng dẫn: TS. Trần Thanh Hùng, Bộ môn Kinh tế Đất Đai & Bất
Động Sản, Khoa Quản Lý Đất Đai & Bất Động Sản Trường Đại Học Nông Lâm
TP.Hồ Chí Minh.
Hiện nay, trong công tác quản lý đất đai ở nước ta được pháp luật quy định thì
nội dung đánh giá đất đai là một trong hai nội dung quản lý quan trọng, nội dung này
có nhiệm vụ cung cấp căn cứ khoa học hỗ trợ cho việc lập quy hoạch sử dụng đất đai,
hoạch định các chính sách tài chính về đất đai và các công tác quản lý khác.
Mức độ chính xác của việc đánh giá phân hạng thích nghi không chỉ phụ thuộc
vào việc xác định số lượng và loại yếu tố đặc điểm của đất đai, mà còn phụ thuộc
quyết định vào việc định lượng mối quan hệ giữa các yếu tố đặc điểm này với năng
suất cây trồng, hiệu quả kinh tế và giá trị đất đai. Tuy nhiên hiện nay việc định lượng
các mối quan hệ này còn mang tính kinh nghiệm chủ quan, nên căn cứ định lượng
phân cấp thích nghi của từng yếu tố đặc điểm đất đai có sai số lớn (±30%). Cho nên,
kết quả đánh giá phân hạng thích nghi đất đai chỉ có giá trị định hướng chung, mà
không thể sử dụng làm căn cứ khoa học cho việc định giá đất đai, phục vụ công tác
quy hoạch, hoạch định các chính sách tài chính về đất đai và các công tác quản lý. Để
giải quyết các vấn đề định lượng trên ta ứng dụng kỹ thuật khai phá dữ liệu là mô hình
cây quyết định thông qua phần mềm DTREG.
Bằng các phương pháp nghiên cứu tiến hành đi điều tra tại địa phương. Đưa kết
quả điều tra được từ địa bàn nghiên cứu vào phần mềm DTREG để phân tích. Từ kết
quả phân tích dữ liệu điều tra theo mô hình cây quyết định ta rút ra những tổ hợp các
yếu tố theo năng suất trung bình của cây trồng. Dựa vào năng suất có thể đánh giá mức
độ thích nghi cho từng tổ hợp yếu tố ảnh hưởng. Ở đây ta chỉ nghiên cứu một loại hình
sử dụng đất đai là cây điều. Theo điều tra nghiên cứu, phân tích đưa ra được 21 tổ hợp
các yếu tố đặc điểm đất đai bao gồm loại đất, tầng dày, chế độ nước, đá lộ đầu và độ
dốc theo tầm quan trọng giảm dần ảnh hưởng đến năng suất cây điều, dựa vào 21 tổ
hợp đó ta có thể đánh giá thích nghi cho cây điều tại địa bàn nghiên cứu.
Sau khi tiến hành so sánh kết quả đánh giá với kết quả đánh giá theo FAO. Thì
hai kết quả có những điểm khác nhau điều này xảy ra vì đặc điểm giữa hai phương
pháp khác nhau, nhưng theo kết quả điều tra thực tế thì có thể mô hình này đã khắc
phục được hạn chế của FAO là nó thể hiện được sự tương tác giữa các yếu tố và có thể
đánh giá tầm quan trọng của các biến điều tra, không phân tích riêng biệt từng yếu tố
và cho các yếu tố ảnh hưởng bằng nhau như FAO.
Kết quả nghiên cứu này sẽ góp phần hoàn thiện phương pháp đánh giá đất đai
hiện hành. Có khả năng ứng dụng trong thực tiễn rất cao. Vì vậy cần phải tổ chức
nghiên cứu rộng hơn, để phát triển ứng dụng trong công tác đánh giá đất đai hiện nay.
MỤC LỤC
ĐẶT VẤN ĐỀ............................................................................................................... 1
Phần 1
TỔNG QUAN ............................................................................................................... 3
1.1. Khái niệm, đặc điểm và vai trò của đất đai............................................................. 3
1.2. Tổng quan về đánh giá đất đai của FAO ................................................................ 5
1.2.1. Định nghĩa đánh giá đất đai của FAO ............................................................ 5
1.2.2. Một số khái niệm trong đánh giá đất đai........................................................ 5
1.2.3. Khái quát phương pháp đánh giá đất đai theo FAO ...................................... 6
1.3. Tổng quan về khai phá dữ liệu.............................................................................. 10
1.3.1. Khái niệm khai phá dữ liệu .......................................................................... 10
1.3.2. Quá trình khai phá dữ liệu............................................................................ 10
1.3.3. Chức năng của khai phá dữ liệu ................................................................... 11
1.3.4. Các kỹ thuật khai phá dữ liệu....................................................................... 11
1.3.5. Ứng dụng của khai phá dữ liệu: ................................................................... 12
1.3.6. Giới thiệu về phần mềm DTREG ................................................................ 12
1.4. Khả năng ứng dụng khai phá dữ liệu trong đánh giá đất đai ................................ 15
1.5. Khái quát về địa bàn nghiên cứu .......................................................................... 17
1.5.1. Điều kiện tự nhiên ........................................................................................ 17
1.5.2. Điều kiện kinh tế xã hội ............................................................................... 19
1.6. Nội dung và phương pháp nghiên cứu.................................................................. 23
1.6.1. Nội dung nghiên cứu .................................................................................... 23
1.6.2. Phương pháp nghiên cứu.............................................................................. 24
1.6.3. Phương tiện nghiên cứu ............................................................................... 24
Phần 2
KẾT QUẢ NGHIÊN CỨU ...................................................................................... 25
2.1. Đánh giá chung về điều kiện tự nhiên, kinh tế xã hội .......................................... 25
2.2. Khái quát về tài nguyên đất đai trên địa bàn huyện định quán ............................. 26
2.2.1. Phân loại các nhóm đất chính của huyện Định Quán .................................. 26
2.2.2. Mô tả các đơn vị đất đai phục vụ cho việc đánh giá thích nghi nông nghiệp27
2.3. Hiện trạng sử dụng đất sản xuất nông nghiệp trên địa bàn huyện Định Quán ..... 29
2.4. Phân tích các yếu tố đặc điểm đất đai ảnh hưởng đến năng suất cây điều theo mô
hình hồi quy cây quyết định .......................................................................................... 31
2.4.1. Mô hình hồi quy cây quyết định được xây dựng từ dữ liệu điều tra............ 31
2.4.2. Mức độ quan trọng các yếu tố đặc điểm đất đai ảnh hưởng đến năng suất
cây điều ................................................................................................................... 32
2.4.3. Phân tích mô hình cây quyết định ................................................................ 33
2.4.4. Kết quả phân tích từ mô hình ....................................................................... 40
2.5. Đánh giá kết quả điều tra và so sánh với kết quả đánh giá của FAO ................... 42
2.5.1. Đánh giá kết quả chất lượng điều tra ........................................................... 42
2.5.2. So sánh đối chứng với kết quả đánh giá đất đai bằng phương pháp FAO... 43
Phần 3
KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................. 46
3.1. Kết luận................................................................................................................... 46
3.2. Kiến nghị ................................................................................................................ 46
DANH SÁCH CHỮ VIẾT TẮT
LMU (Land maping unit)
: Đơn vị bản đồ đất đai
LUT (Land Use Type)
: Loại hình sử dụng đất
LQ (Land Quality)
: Chất lượng đất đai
LC (Land Characteristic)
: Tính chất đất đai
LUR (Land Use Requirements)
: Yêu cầu sử dụng đất
FAO (Food and Agriculture Organization) : Tổ chức lương - nông Liên hợp quốc
LE
: Đánh giá đất đai
LHSDĐĐ
: Loại hình sử dụng đất đai
KTXH
: Kinh tế xã hội
DANH MỤC BẢNG VÀ HÌNH
Bảng 1. Cấu trúc phân loại khả năng thích nghi đất đai .................................................. 9
Bảng 2. Cơ cấu các nhóm đất chính của huyện Định Quán .......................................... 26
Bảng 3. Hiện trạng sử dụng đất nông nghiệp ................................................................ 29
Bảng 4. Kết quả tổ hợp các yếu tố ảnh hưởng theo năng suất cây điều ........................ 40
Bảng 5. Điểm theo năng suất trung bình mô hình phân tích ......................................... 42
Bảng 6. Yêu cầu sử dụng đất cho cây điều ở huyện định quán ..................................... 43
Bảng 7. Đánh giá thích nghi theo FAO và phương pháp nghiên cứu ........................... 44
Hình 1. Quá trình khai phá dữ liệu .............................................................................. 101
Hình 2. Giao diện phần mềm DTREG .......................................................................... 32
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
ĐẶT VẤN ĐỀ
Hiện nay, vấn đề về lĩnh vực đất đai là những vấn đề hết sức nhạy cảm. Đất đai là
nguồn tài nguyên quan trọng không thể thiếu để đất nước phát triển, để con người sinh
sống, làm việc. Đất đai là đầu vào tham gia vào hầu hết các ngành kinh tế nó thúc đẩy
phát triển các ngành kinh tế, cũng như xã hội, tạo khả năng thu hút các nguồn vốn đầu
tư trong nước và ngoài nước. Ngoài ra, đất đai còn là nơi gắn bó đối với mỗi chúng ta
trong cuộc sống, là tài sản của mỗi cá nhân, gia đình, cộng đồng và của đất nước, việc
sử dụng và quản lý đất đai là việc làm hết sức cần thiết.
Trong công tác quản lý đất đai ở nước ta được pháp luật quy định thì nội dung
đánh giá đất đai là một trong hai nội dung quản lý quan trọng, nội dung này có nhiệm
vụ cung cấp căn cứ khoa học hỗ trợ cho việc lập quy hoạch sử dụng đất đai, hoạch
định các chính sách tài chính về đất đai và các công tác quản lý khác. Đánh giá đất đai
là một quá trình điều tra, nghiên cứu đặc điểm và đánh giá khả năng sử dụng đất đai
cho sản xuất nông nghiệp được thực hiện hầu hết ở tất cả các nước trên thế giới. Quá
trình điều tra đánh giá tài nguyên đất đai đều dựa trên nền tảng căn bản là sức sản xuất
của đất thể hiện bằng các chỉ tiêu tự nhiên như loại đất, tầng dầy, thành phần cơ giới,
độ phì, địa hình, chế độ nước, khí hậu,…
Ngoài ra, mức độ chính xác của việc đánh giá phân hạng thích nghi không chỉ
phụ thuộc vào việc xác định số lượng và loại yếu tố đặc điểm của đất đai, mà còn phụ
thuộc quyết định vào việc định lượng mối quan hệ giữa các yếu tố đặc điểm này với
năng suất cây trồng, hiệu quả kinh tế và giá trị đất đai. Tuy nhiên hiện nay việc định
lượng các mối quan hệ này còn mang tính kinh nghiệm chủ quan, nên căn cứ định
lượng phân cấp thích nghi của từng yếu tố đặc điểm đất đai có sai số lớn (±30%). Cho
nên, kết quả đánh giá phân hạng thích nghi đất đai chỉ có giá trị định hướng chung, mà
không thể sử dụng làm căn cứ khoa học cho việc định giá đất đai, phục vụ công tác
quy hoạch, hoạch định các chính sách tài chính về đất đai và các công tác quản lý
khác.
Để giải quyết vấn đề lượng hóa các nhà kinh tế lượng đề xuất sử dụng kỹ thuật
phân tích hồi quy tuyến tính bằng phương pháp bình phương bé nhất xác định hàm số
biểu thị sự phụ thuộc năng suất cây trồng vào các yếu tố đặc điểm đất đai. Hàm số
được xác định trong kinh tế học thường gọi là hàm sản xuất. Trong các hàm này biến
số phụ thuộc là năng suất cây trồng, còn biến số độc lập là các yếu tố đặc điểm đất đai,
tất cả các biến số thuộc loại liên tục (continuous) hay nhị nguyên (dichotomous). Hàm
hồi quy được xác định bằng các phần mềm phân tích thống kê hiện có Eview, SPSS,
NLREG,…
Tuy nhiên, trong thực tế không phải tất cả các yếu tố đặc điểm tự nhiên của đất
đai đều là các biến số thuộc loại liên tục hay có thể được chuyển về loại nhị nguyên,
mà còn là các đại lượng biến thiên có miền giá trị là các phạm trù, được gọi là biến rời
rạc (discrete) hay là biến phạm trù (categorical). Với biến phạm trù thì kỹ thuật và
công cụ phân tích hồi quy nêu trên lại tỏ ra kém hiệu quả trong việc xử lý dữ liệu. Các
kỹ thuật và công cụ khai phá dữ liệu được phát triển gần đây trong lĩnh vực khoa học
công nghệ thông tin thì lại tỏ ra hiệu quả và được ứng dụng rộng rãi trong việc xử lý
dữ liệu về môi trường, sinh học, kinh tế, xã hội, chính trị, ... với các biến số liên tục và
biến rời rạc bằng các mô hình cây quyết định (decision tree), máy phân lớp sử dụng
1
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
vector hỗ trợ (support vector machine) và phần mềm DTREG (Phillip H. Sherrod,
2003).
Từ thực tế nêu trên việc “Ứng dụng phần mềm DTREG để đánh giá thích nghi
đất đai cho trồng điều trên địa bàn Huyện Định Quán Tỉnh Đồng Nai” là thực sự cần
thiết và có ý nghĩa khoa học cũng như thực tiễn.
MỤC TIÊU NGHIÊN CỨU CỦA ĐỀ TÀI
Đánh giá khả năng ứng dụng các kỹ thuật khai phá dữ liệu trong đánh giá đất đai
nhằm xác định các yếu tố đặc điểm đất đai ảnh hưởng đến tiềm năng sử dụng đất nông
nghiệp và giá trị đất đai, lượng hóa mối quan hệ giữa các yếu tố đặc điểm đất đai với
năng suất cây trồng, hiệu quả kinh tế và giá trị đất đai.
ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng nghiên cứu là tất cả các đặc điểm tự nhiên của đất đai, các yếu tố về
kinh tế xã hội có ảnh hưởng tới năng suất cây trồng giá trị và tiềm năng sử dụng của
đất đai. Những quy luật về mối quan hệ giữa của các yếu tố trên.
Đề tài được thực hiện trong phạm vi huyện Định Quán, Tỉnh Đồng Nai.
Đề tài nghiên cứu với loại hình sử dụng đất là đất trồng điều
Ý NGHĨA CỦA ĐỀ TÀI
- Ý nghĩa khoa học
+ Góp phần hoàn thiện phương pháp đánh giá đất đai
+ Cung cấp căn cứ khoa học cho việc định giá đất đai và lập quy hoạch sử
dụng đất đai.
- Ý nghĩa thực tiễn
Xác định các yếu tố đặc điểm đất đai ảnh hưởng đến tiềm năng sử dụng đất
nông nghiệp, lượng hóa mối quan hệ giữa các yếu tố đặc điểm đất đai với năng suất
cây trồng huyện Định Quán, tỉnh Đồng Nai. Từ đó tiến hành đánh giá đất đai cho
vùng.
2
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
Phần 1
TỔNG QUAN
1.1. Khái niệm, đặc điểm và vai trò của đất đai
Khái niệm đất đai
Đất đai là một loại tài nguyên tự nhiên, một loại tài nguyên sản xuất, bao gồm cả
lục địa và mặt nước trên bề mặt trái đất. Theo quan điểm kinh tế học thì đất đai không
chỉ bao gồm mặt đất còn bao gồm cả tài nguyên trong lòng đất và tất cả mọi thứ sinh
sôi trên mặt đất và trong lòng đất không do lao động và con người làm ra, tức là bao
gồm nước mặt đất và nước ngầm, thổ nhưỡng, thực vật và động vật. Với nghĩa chung
nhất, đó là lớp bề mặt của trái đất, bao gồm đồng ruộng, đồng cỏ, bãi chăn thả, cây
rừng, bãi hoang, mặt nước, đầm lầy và bãi đá... Với nghĩa hẹp thì đất đai biểu hiện
khối lượng và tính chất của quyền lợi hoặc tài sản mà một người có thể chiếm đối với
đất. Nó có thể bao gồm lợi ích trên đất về mặt pháp lý cũng như những quyền theo tập
quán không thành văn.
Đất đai là một nguồn tài nguyên thiên nhiên, là tư liệu sản xuất đặc biệt, là thành
phần quan trọng của môi trường sống, là địa bàn phân bố khu dân cư, xây dựng cơ sở
kinh tế, văn hoá, an ninh và quốc phòng.
Đất đai là tài sản vì đất đai có đầy đủ thuộc tính của một tài sản như: đáp ứng
được nhu cầu nào đó của con người, tức là có giá trị sử dụng; con người có khả năng
chiếm hữu và sử dụng; là đối tượng trao đổi, mua bán (tức là có tham gia vào giao lưu
dân sự)... Đất đai còn được coi là tài sản chuyển tiếp qua các thế hệ và được coi là một
dạng tài sản trong phương thức tích luỹ của cải vật chất của xã hội.
Đất đai cố định về vị trí, có giới hạn về không gian và vô hạn về thời gian sử
dụng. Bên cạnh đó, đất đai có khả năng sinh lợi, vì trong quá trình sử dụng, nếu biết sử
dụng và sử dụng một cách hợp lý thì giá trị của đất đai (đã được khai thác sử dụng)
không những không mất đi mà có xu hướng tăng lên.
Đặc điểm và vai trò của đất đai
Đất đai là sự vật địa lý - kinh tế nên nó có hai thuộc tính tự nhiên và xã hội đặc
trưng cho khả năng của đất đai đáp ứng các nhu cầu hoạt động kinh tế - xã hội của con
người, “Khi ta ở, chỉ là nơi đất ở. Khi ta đi đất bỗng hóa tâm hồn”.
Thuộc tính tự nhiên bao gồm các thuộc tính không gian như diện tích, hình
thể, chiều dài, chiều rộng và vị trí cùng với các đặc điểm về địa chất, địa chấn, địa
hình, địa mạo và các tính chất sinh lý hóa của đất.
Thuộc tính xã hội của đất đai chính là vị thế của đất đai - là hình thức đo sự
mong muốn về mặt xã hội gắn với đất đai tại một vị trí nhất định, là những thuộc tính
phi vật thể.
Vị thế cũng được hiểu là tổng hòa các quan hệ xã hội, được xác định thông qua
số lượng, chất lượng và cường độ quan hệ xã hội. Đất đai có vị thế cao hay thấp phụ
thuộc vào khả năng thiết lập cho người sử dụng đất đai được nhiều hay ít mối quan hệ
với các nhà cung cấp dịch vụ đô thị, với những người láng giềng và với các đối tác
khác… Chú ý Cường độ quan hệ bị ảnh hưởng bởi yếu tố khoảng cách không gian,
giảm dần một cách phi tuyến theo sự tăng dần của khoảng cách, “Bán anh em xa, mua
3
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
láng giềng gần”. Vì vậy có thể nói chính vị thế đất đai là cơ sở để hình thành nên giá
trị đất đai còn thuộc tính tự nhiên chỉ tạo nên giá trị sử dụng của đất đai.
Vị thế đất đai khác với vị trí đất đai. Vị thế là thuộc tính xã hội của đất đai, còn vị
trí là thuộc tính không gian của nó. Vị thế của đất đai là thuộc tính không gian tâm lý
của con người, còn vị trí của đất đai là thuộc tính không gian địa lý (tự nhiên). Vị thế
không đồng nhất với vị trí, “Đồng sàng, dị mộng”.
Vậy tại sao trong nghiên cứu cũng như trong thực tế định giá đất đai và bất động
sản người ta chỉ nhắc đến “vị trí, vị trí và vị trí”? Phải chăng vị trí địa lý là yếu tố cấu
thành giá trị của đất đai, là thuộc tính quan trọng mà nhà định giá phải quan tâm.
Trước hết cần xem xét mối quan hệ giữa vị trí địa lý của đất đai và giá trị của nó.
Từ thực tế có thể khẳng định giữa chúng không có quan hệ với nhau. Vị trí tự bản thân
nó, tức vị trí trong trạng thái “trần trụi” không có ảnh hưởng tác động đến giá trị đất
đai, không phải là thuộc tính mà nhà định giá cần quan tâm.
Thuộc tính vị trí của đất đai mà các nhà định giá muốn nói đến chính là vị trí
trong không gian địa lý - kinh tế, vị trí trong không gian kinh tế - xã hội đô thị. Ở đây,
có thể nói, vị trí địa lý đã được bao phủ bởi các thuộc tính kinh tế - xã hội của đất đai,
hay nói theo ngôn ngữ của lý thuyết vị thế - chất lượng, đấy chính là vị thế, thuộc tính
tạo ra “khả năng sinh lời của vị trí”, thuộc tính so sánh lợi ích của các đơn vị diện tích
đất đai ở các vị trí khác nhau.
Tổ hợp vị thế xã hội và chất lượng tự nhiên trong một thửa đất cụ thể tạo ra một
khả năng đáp ứng nhu cầu hoạt động kinh tế - xã hội của con người, được gọi là dịch
vụ đất đai. Dịch vụ đất đai là đối tượng của cung cầu thị trường đất đai. Cung cầu về
đất đai trên thị trường là cung cầu về dịch vụ đất đai, chứ không phải là cung cầu về
một thửa đất cụ thể như một số tác giả đã khẳng định.
Đất đai có khả năng tái tạo và nâng cao chất lượng về mặt tự nhiên và vị thế xã
hội thông qua hoạt động đầu tư của con người.
Ngoài ra đất đai còn có một số đặc tính khác như: tính cố định, tính khan hiếm,
tính dị biệt, tính thích ứng và tính tăng trị.
Tính dị biệt tức sự khác biệt, nhưng chỉ khác biệt tương đối. Có nghĩa là các
thửa đất đai khác nhau về mặt lượng, chứ không khác nhau về mặt chất.
Tính cố định và khan hiếm do no giới hạn bởi bề mặt địa cầu và trong phạm
vi lãnh thổ của từng quốc gia.
Tính thích ứng là khả năng sử dụng vào các mục đích khác nhau.
Tính tăng trị có nghĩa là giá trị đất đai có xu hướng tăng dần do nhu cầu và
giá trị đầu tư vào đất đai ngày càng tăng.
Vai trò của đất đai đối với hoạt động kinh tế xã hội:
Là đối tượng lao động.
Là công cụ lao động.
Là tư liệu sản xuất.
Là cơ sở không gian bố trí lực lượng sản xuất và phát triển đô thị.
Là nhân tố sản xuất đầu vào và là tài sản bất động sản.
4
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
1.2. Tổng quan về đánh giá đất đai của FAO
1.2.1. Định nghĩa đánh giá đất đai của FAO
Đánh giá đất đai (LE) là quá trình so sánh, đối chiếu những tính chất vốn có của
một vạt/khoanh đất cần đánh giá với những tính chất đất đai và loại yêu cầu sử dụng
đất cần phải có. LE là quá trình xem xét khả năng thích ứng của đất đai với những loại
hình sử dụng đất khác nhau. (theo FAO đề xuất năm 1976).
Hay có thể nói khác đi là: LE nhằm mục tiêu cung cấp những thông tin về sự
thuận lợi và khó khăn cho việc sử dụng đất đai, làm căn cứ cho việc đưa ra những
quyết định về việc sử dụng và quản lý đất đai một cách hợp lý.
1.2.2. Một số khái niệm trong đánh giá đất đai
Khái niệm về đất (Soil)
Đất là phần trên cùng của vỏ phong hoá trái đất được hình thành từ 6 yếu tố: (1)
sinh vật; (2) khí hậu; (3) đá mẹ; (4) địa hình; (5) thời gian (tuổi tương đối); (6) yếu tố
nhân tác (đối với đất đã sử dụng).
Đơn vị bản đồ đất đai (Land Map Units)
Đơn vị bản đồ đất đai là một phần của hệ thống sử dụng đất trong đánh giá đất.
Đây là một khoanh/vạt đất được xác định cụ thể trên bản đồ đơn vị đất đai (LUM) với
những đặc tính và tính chất đất đai riêng biệt thích hợp đồng nhất cho từng LUT, có
cùng một điều kiện quản lý đất và cùng một khả năng sản xuất và cải tạo đất.
Khái niệm về hệ thống sử dụng đất (Land use system – LUS)
LUS là một LUT bố trí trong một điều kiện tự nhiên cụ thể, có thể là một LMU. Nó
bao hàm cả vấn đề đầu tư, cải tạo đất và thu nhập có thể có.
Loại hình sử dụng đất đai (Land Use Type-LUT) Là những loại hình đặc biệt
của sử dụng đất được mô tả theo các thuộc tính nhất định. Các thuộc tính đó bao gồm: quy
trình sản xuất, các đặc tính về quản lý đất đai như sức kéo trong làm đất , đầu tư vật tư kỹ
thuật ... và các đặc tính về kinh tế kỹ thuật như định hướng thị trường, vốn thâm canh, lao
động, vấn đề sở hữu đất đai. Không phải tất cả các thuộc tính trên đều được đề cập đến như
nhau trong các dự án LE mà việc lựa chọn các thuộc tính và mức độ mô tả chi tiết phụ
thuộc vào tình hình sử dụng đất của địa phương cũng như cấp độ, yêu cầu chi tiết và mục
tiêu của mỗi dự án LE khác nhau .
Phân hạng thích hợp đất đai Phân hạng thích hợp đất đai là sự kết hợp các
tính thích hợp từng phần của các yếu tố chẩn đoán vào thành khả năng thích hợp tổng
thể của LMU cho một LUT nhất định. Ký hiệu phân hạng thích hợp đất đai: S1, S2, S3
và N1, N2
Đặc tính đất đai (Land Characteristic) Là thuộc tính của đất đai mà chúng ta có
thể đo đếm và ước lượng được, tính chất đất đai được dùng để phân biệt các đơn vị bản
đồ đất đai với nhau và để mô tả các đặc tính đất đai.
Đặc tính đất đai bao gồm:
Khí hậu: mưa, gió, nhiệt độ không khí, ẩm độ, bức xạ,….
Đất: sa cấu, ẩm độ chất, các chất trong đất, độ sâu tầng đất,…
Nước: độ sâu ngập, thời gian ngập, khối lượng nước hồ, ….
Địa hình /địa chất: mẫu chất, cao độ, độ dốc,….
5
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
Thực vật: số loài, độ che phủ,….
Động vật: số loài, phân bố,…
Vị trí: địa điểm riêng biệt, tọa độ,…
Diện tích: kích thước thửa đất, kích thước đơn vị đất,…
Kết quả hoạt động của con người: nhà ở, cơ sở hạ tầng…
Chất lượng đất đai (Land Quality-LQ)
Là tính chất phức tạp của đất đai thể hiện những mức độ thích nghi khác nhau
cho một loại hình sử dụng đất cụ thể. Thông thường nó phản ánh mối quan hệ nội tại
của rất nhiều đặt tính đất đai như: Mức độ xói mòn, mức độ ngập, độ ẩm, độ phì nhiêu
của đồng cỏ, giao thông thuận lợi…
Yêu cầu sử dụng đất đai (Land Use Requirements-LUR): Là những điều kiện
đất đai cần thiết và đòi hỏi cho việc bố trí một loại hình sử dụng đất cụ thể một cách
ổn định và có hiệu quả. Yêu cầu này bao gồm các yêu cầu của cây trồng, vật nuôi, yêu
cầu về quản trị và biện pháp bảo vệ đất đai.
Yếu tố hạn chế (Limitation factor) Yếu tố hạn chế (Limitation factor): là
chất lượng đất đai hoặc đặc tính đất đai có ảnh hưởng bất lợi đến loại hình sử dụng đất
nhất định. Chúng thường được dùng làm tiêu chuẩn để phân cấp các mức thích hợp.
Hiện trạng sử dụng đất đai Thể hiện qua phân bố các loại cây trồng, thảm thực
vật tự nhiên... Là kết quả của quá trình sử dụng đất trong quá khứ và hiện tại, làm tiền đề
cho hướng phát triển trong tương lai. Hiện trạng sử dụng đất đai phản ảnh khả năng sử dụng
đất đai, đồng thời cũng là một trong những tiền đề cho việc đề xuất sử dụng đất đai phù hợp
với thực tế.
Quy hoạch sử dụng đất đai: Là sự đánh giá tiềm năng đất nước có hệ thống,
tính thay đổi trong sử dụng đất đai và những điều kiện kinh tế xã hội để chọn lọc và
thực hiện các sự chọn lựa sử dụng đất đai tốt nhất. Đồng thời quy hoạch sử dụng đất
đai cũng là chọn lọc và đưa vào thực hành những sử dụng đất đai đó mà nó phải phù
hợp với yêu cầu cần thiết của con người về bảo vệ nguồn tài nguyên thiên nhiên trong
tương lai.
1.2.3. Khái quát phương pháp đánh giá đất đai theo FAO
1. Mục đích
Xác định và xây dựng nguyên lý, quan điểm và quy trình LE cho sử dụng đất
nông nghiệp như: trồng trọt, chăn nuôi, thủy sản; lâm nghiệp, bảo tồn thiên nhiên.
Có khả năng áp dụng được cho toàn cầu và xuống đến cấp địa phương của
cả các quốc gia.
Cung cấp những thông tin cần thiết cho quy hoạch sử dụng đất đai.
Hệ thống này được sử dụng như là nền tảng để đánh giá các hệ thống LE
hiện có thông qua sự so sánh và kết quả.
Với hệ thống này sẽ là cơ sở cho việc nghiên cứu thành những hệ thống LE
mới riêng cho các vùng chuyên biệt.
2. Nguyên tắc đánh giá đất đai
Khả năng thích nghi của đất đai được đánh giá và phân hạng cho các loại
hình sử dụng đất (các LUT) cụ thể.
6
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
Việc đánh giá đòi hỏi có sự so sánh giữa lợi nhuận thu được và đầu tư cần
thiết trên các loại đất khác nhau (phân bón, lao động, thuốc trừ sâu, máy móc, ... ).
Đánh giá yêu cầu phải có quan điểm tổng hợp, nghĩa là phải có sự phối hợp
và tham gia đầy đủ của các nhà nông học, lâm nghiệp, kinh tế và xã hội học.
Việc đánh giá đất đai phải phù hợp với điều kiện tự nhiên, kinh tế –xã hội
của vùng, khu vực nghiên cứu.
Khả năng thích hợp đưa vào sử dụng phải dựa trên cơ sở bền vững, các
nhân tố sinh thái trong sử dụng đất phải được dùng để quyết định.
Đánh giá đất phải tập trung so sánh nhiều kiểu sử dụng đất khác nhau.
3. Nội dung chính của đánh giá đất đai
Đánh giá đất đai bao gồm 4 vấn đề sau:
Xác định các chỉ tiêu và quy trình xây dựng bản đồ đơn vị đất đai.
Xác định và mô tả các loại hình sử dụng đất và yêu cầu sử dụng đất.
Xây dựng hệ thống cấu trúc phân hạng đất đai.
Phân hạng thích nghi đất đai.
Đồng thời, ngoài 4 bước trên theo quy trình của tổ chức FAO, sau khi tiến hành
đánh giá đất đai nên có một bước đề xuất phương án sử dụng đất, làm cơ sở cho việc
quy hoạch sử dụng đất.
4. Các bước tiến hành trong đánh giá đất đai
Theo tài liệu: “Đánh giá đất vì sự phát triển”, FAO đã đề ra các bước đánh giá
như sau:
Các bước đánh giá đất đai:
1
Xác
định
mục
tiêu
2
Thu
thập
tài
liệu
3
Xác định
LHSDĐĐ
4
Xác định
đơn vị đất
đai
5
Đánh
giá
khả
năng
thích
hợp
6
Xác định
Hiện
trạng
KTXH –
môi
trường
7
Xác định
LHSDĐĐ
thích hợp
nhất
8
Quy
hoạch
sử dụng
đất
9
Áp dụng
của việc
đánh giá
đất
Quy trình trên tập trung vào các bước sau:
1) Dựa vào mục tiêu và quy mô của từng dự án đánh giá đất, thu thập các tài
liệu, thông tin có sẵn về tự nhiên, kinh tế và xã hội của vùng dự án.
2) Xây dựng bản đồ đơn vị đất đai: mô tả các đơn vị bản đồ đất đai (Land
Mapping Unit – LMU) dựa trên kết quả điều tra tài nguyên đất (chất đất, khí hậu, dáng
đất, thực vật, độ dốc, bề mặt đất, nước ngầm…). Mỗi một LMU có các đặc tính khác
với LMU kề bên.
3) Chuyển đổi các đặc tính của mỗi LMU thành tính chất đất đai có tác động
trực tiếp đến sự hình thành hệ thống sử dụng đất (Land Use System – LUS) hay nói
cách khác, đó là sự kết hợp của LUT được lựa chọn với LMU.
7
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
4) Xác định và mô tả các loại hình sử dụng đất (Land Use Type – LUT) với các
thuộc tính chính liên quan đến:
- Những chính sách và mục tiêu phát triển.
- Những hạn chế đặc biệt trong sử dụng đất.
- Những yêu cầu và ưu tiên của chủ sử dụng đất.
- Các điều kiện tổng quát về kinh tế - xã hội và sinh thái nông nghiệp trong
vùng đánh giá đất.
5) Quyết định các yêu cầu sử dụng đất (chủ yếu về tự nhiên và sinh học) cho
mỗi loại hình sử dụng đất được lựa chọn.
6) Đối chiếu xếp hạng các LUT trên cơ sở so sánh các yêu cầu sử dụng đất của
các LUT với các tính chất đất đai của LMU nhằm xác định mức độ phù hợp của các
tính chất đất đai của mỗi LMU cho mỗi LUT. Quá trình đối chiếu này là tiền đề của
nội dung phân hạng tích hợp của các LMU cho từng LUT. Tiến hành phân hạng thích
hợp đất đai cho các LUT đã đối chiếu.
7) Đề xuất hệ thống sử dụng đất tối ưu và các giải pháp tạo các LUT thích hợp
phục vụ quy hoạch sử dụng đất và tăng cường công tác quản lý, bảo vệ tài nguyên đất
của vùng.
5. Cấu trúc phân hạng thích hợp đất đai theo FAO
a. Cấu trúc tổng quát của phân loại khả năng thích nghi đất đai: gồm 4 cấp
- Bộ (Orders): phản ánh các loại thích nghi. Trong bộ phân ra làm 2 mức: thích
nghi (S) và không thích nghi (N).
- Lớp (Classes): phản ánh mức độ thích nghi của bộ.
- Lớp phụ (Sub-classes): phản ánh những giới hạn cụ thể của từng đơn vị đất đai
với từng loại hình sử dụng đất. Những yếu tố này tạo ra sự khác biệt giữa các dạng
thích nghi trong cùng một lớp.
- Đơn vị (Units): phản ánh những sự khác biệt về yêu cầu quản trị của các dạng
thích nghi trong cùng một lớp phụ.
Bộ thích nghi đất đai được chia làm 3 lớp: S1 (thích nghi cao), S2 (thích nghi
trung bình), S3 (thích nghi kém).
S1: Thích nghi cao (Highly Suitable): Đất đai không thể hiện những hạn chế
hoặc chỉ thể hiện những hạn chế ở mức độ nhẹ, rất dễ khắc phục. Sản xuất trên đất này
sẽ dễ dàng và cho hiệu quả cao.
S2: Thích nghi trung bình (Moderately Suitable): Đất đai có thể hiện các hạn
chế nhưng ở mức độ trung bình có thể khắc phục được bằng các biện pháp kỹ thuật
hoặc tăng mức độ đầu tư. Sản xuất trên đất này khó khăn và tốn kém hơn so với đất
S1. Có khả năng cải tạo để nâng lên hạng S1
S3: Thích nghi kém (Marginally Suitable): Đất đai có những giới hạn mà
cộng chung lại là nghiêm trọng đối với một loại hình sử dụng đất được đưa ra, tuy
nhiên vẫn không làm ta phải bỏ loại sử dụng đã định. Phí tổn sản xuất cao nhưng vẫn
có lãi.
Bộ không thích nghi đất đai được chia làm 2 lớp: N1 (không thích nghi hiện
tại) và N2 (không thích nghi vĩnh viễn).
8
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
N1: Không thích nghi hiện tại (Currently Not Suitable): Đất đai không thích
nghi với loại hình sử dụng đất nào đó trong điều kiện hiện tại. Những giới hạn đó có
thể khắc phục được bằng những đầu tư lớn trong tương lai.
N2: Không thích nghi vĩnh viễn (Permanently Not Suitable): Đất không
thích nghi với loại hình sử dụng đất cả trong hiện tại và tương lai, vì có giới hạn rất
nghiêm trọng mà con người không có khả năng làm thay đổi.
Bảng 1. Cấu trúc phân loại khả năng thích nghi đất đai
Phân loại (Category)
Bộ (Order)
Thích nghi S
Không thích nghi N
Lớp (Class)
L ớp phụ (Sub-class)
S1
S2
S3
S2/Sl (*)
S2/De
S2/Ir
N1
N2
Đơn vị (Unit)
S2/De1 (**)
S2/De2
S2/De3
....
N1/Ir
N1/De
…
(*)Yếu tố hạn chế (Sl: độ dốc; De: độ dày tầng đất mặt; Ir: khả năng tưới)
(**)Yếu tố hạn chế trong cùng 1 lớp phụ, phản ảnh sự khác biệt về mặt quản trị
(ví dụ: De1: <50cm, De2: 50-100cm, De3: >100cm)
b. Phương pháp xác định loại khả năng thích nghi đất đai:
Kết hợp theo điều kiện hạn chế:
Sử dụng theo cấp hạn chế cao nhất để kết luận khả năng thích nghi chung. Thí
dụ, một LMU đối với một LUT nào đó có hạn chế về loại hình thổ nhưỡng là S1, tầng
dầy đất là S2; nhưng hạn chế về nguồn nước là N, sẽ được kết luận chung là N
(S1+S2+N = N).
Thuận lợi của phương này là đơn giản và an toàn trong quy hoạch sử dụng đất.
Trong phương pháp yêu cầu các yếu tố chuẩn đoán cần phải được cân nhắc kỹ và chỉ
chọn lọc các yếu tố điển hình.
Phương pháp toán học:
thực hiện bằng các tính cộng, nhân, theo phần trăm hoặc cho điểm với các hệ
số và thang bậc quy định.
Ví dụ: Về phương pháp cộng dồn là S1 + S1 + S2 = S1
S1 + S2 + S2 = S2
Nhìn chung phương pháp toán học dễ hiểu, dễ phân biệt và dễ thực hiện bởi có
sự trợ giúp của máy tính. Nhưng vẫn mang tính chủ quan khi sắp xếp thang bậc và
không thể áp dụng được từ địa phương này sang địa phương khác.
9
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
Phương pháp kết hợp theo chủ quan:
Người đánh giá tốt nhất là bàn bạc với nông dân, cán bộ địa phương, tóm lược
việc kết hợp các điều kiện xảy ra khác nhau và chỉnh sửa làm sao cho chúng có thể
đánh giá được cho tất cả các khả năng thích nghi.
Phương pháp kết hợp xem xét về kinh tế: Trên cơ sở so sánh các kết quả về
đánh giá kinh tế đã có trước đây với LQ, sau đó đưa ra phân cấp đánh giá. Phương
pháp này chỉ phù hợp cho đánh giá kinh tế đất đơn thuần.
Thông thường trong các đánh giá đất đai ở Việt Nam hiện nay thường áp dụng
theo phương pháp thứ nhất (Kết hợp theo điều kiện hạn chế) nhằm khắc phục các hạn
chế của phương pháp này chúng ta nên đồng thời áp dụng phương pháp chủ quan, thảo
luận kỹ càng giữa các chuyên gia và người sử dụng đất. Đồng thời có xem xét thêm
vấn đề kinh tế xã hội và môi trường để điều chỉnh hạng đất cho phù hợp thực tế.
1.3. Tổng quan về khai phá dữ liệu
1.3.1. Khái niệm khai phá dữ liệu
Khai phá dữ liệu (data mining) là quá trình khám phá các tri thức mới và các tri
thức có ích ở dạng tiềm năng trong nguồn dữ liệu đã có.
1.3.2. Quá trình khai phá dữ liệu
Khai phá dữ liệu là hoạt động trọng tâm của quá trình khám phá tri thức. Thuật
ngữ khai phá dữ liệu còn được một số nhà khoa học gọi là phát hiện tri thức trong cơ
sở dữ liệu (knowledge discovery in database_KDD) (theo Fayyad Smyth and
Piatestky-Shapiro 1989). Quá trình này gồm có 6 bước:
Hình 1. Quá trình khai phá dữ liệu
Quá trình khai phá dữ liệu bắt đầu với kho dữ liệu thô và kết thúc với tri thức
được chiết xuất ra. Nội dung của quá trình như sau:
Gom dữ liệu (gatherin)
Trích lọc dữ liệu (selection)
Ở giai đoạn này dữ liệu được lựa chọn và phân chia theo một số tiêu chuẩn nào
đó.
Làm sạch và tiền xử lý dữ liệu (cleansing preprocessing).
Chuyển đổi dữ liệu (transformation)
10
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
Mục đích của việc chuyển đổi dữ liệu là làm cho dữ liệu phù hợp hơn với mục
đích khai phá dữ liệu.
Phát hiện và trích mẫu dữ liệu (pattern extraction and discovery)
Đây là bước tư duy trong khai phá dữ liệu. Ở trong giai đoạn này nhiều thuật toán
khác nhau đã được sử dụng để trích ra các mẫu từ dữ liệu. Thuật toán thường dùng để
trích mẫu dữ liệu là thuật toán phân loại dữ liệu, kết hợp dữ liệu, thuật toán mô hình
hoá dữ liệu tuần tự.
Đánh giá kết quả mẫu (evaluation of result)
Đây là giai đoạn cuối cùng trong quá trình khai phá dữ liệu, ở giai đoạn này các mẫu
dữ liệu được chiết xuất ra bởi phần mềm khai phá dữ liệu. Không phải mẫu dữ liệu nào
cũng hữu ích, đôi khi nó còn bị sai lệch. Vì vậy cần phải đưa ra những tiêu chuẩn đánh giá
độ ưu tiên cho các mẫu dữ liệu để rút ra được những tri thức cần thiết.
1.3.3. Chức năng của khai phá dữ liệu
Khai phá dữ liệu có hai chức năng cơ bản đó là: chức năng dự đoán và chức năng mô
tả.
1.3.4. Các kỹ thuật khai phá dữ liệu
Trong thực tế có nhiều kỹ thuật khai phá dữ liệu khác nhau nhằm thực hiện hai
chức năng mô tả và dự đoán.
- Kỹ thuật khai phá dữ liệu mô tả: có nhiệm vụ mô tả các tính chất hoặc các đặc
tính chung của dữ liệu trong CSDL hiện có. Một số kỹ thuật khai phá trong nhóm này
là: phân cụm dữ liệu (Clustering), tổng hợp (Summarisation), trực quan hoá
(Visualization), phân tích sự phát triển và độ lệch (Evolution and deviation
analyst),….
- Kỹ thuật khai phá dữ liệu dự đoán: có nhiệm vụ đưa ra các dự đoán dựa vào các
suy diễn trên cơ sở dữ liệu hiện thời. Một số kỹ thuật khai phá trong nhóm này là:
phân lớp (Classification), hồi quy (Regression), cây quyết định (Decision tree), thống
kê (statictics), mạng nơron (neural network), luật kết hợp,….
Một số kỹ thuật phổ biến thường được sử dụng để khai phá dữ liệu hiện nay là:
Phân lớp dữ liệu
Mục tiêu của phân lớp dữ liệu đó là dự đoán nhãn lớp cho các mẫu dữ liệu. Quá
trình gồm hai bước: xây dựng mô hình, sử dụng mô hình để phân lớp dữ liệu (mỗi mẫu
1 lớp). Mô hình được sử dụng để dự đoán nhãn lớp khi mà độ chính xác của mô hình
chấp nhận được.
Phân cụm dữ liệu
Mục tiêu của phân cụm dữ liệu là nhóm các đối tượng tương tự nhau trong tập dữ
liệu vào các cụm, sao cho các đối tượng thuộc cùng một lớp là tương đồng.
Khai phá luật kết hợp
Mục tiêu của phương pháp này là phát hiện và đưa ra các mối liên hệ giữa các giá
trị dữ liệu trong cơ sở dữ liệu. Đầu ra của giải thuật luật kết hợp là tập luật kết hợp tìm
được. Phương pháp khai phá luật kết hợp gồm có hai bước:
- Bước 1: Tìm ra tất cả các tập mục phổ biến. Một tập mục phổ biến được xác
định thông qua tính độ hỗ trợ và thoả mãn độ hỗ trợ cực tiểu.
11
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
- Bước 2: Sinh ra các luật kết hợp mạnh từ tập mục phổ biến, các luật phải thoả
mãn độ hỗ trợ và độ tin cậy cực tiểu.
Hồi quy
Phương pháp hồi quy tương tự như là phân lớp dữ liệu. Nhưng khác ở chỗ nó
dùng để dự đoán các giá trị liên tục còn phân lớp dữ liệu dùng để dự đoán các giá trị
rời rạc.
Giải thuật di truyền
Là quá trình mô phỏng theo tiến hoá của tự nhiên. Ý tưởng chính của giải thuật
là dựa vào quy luật di truyền trong biến đổi, chọn lọc tự nhiên và tiến hoá trong sinh
học.
Mạng nơron
Đây là một trong những kỹ thuật khai phá dữ liệu được ứng dụng phổ biến hiện nay.
Kỹ thuật này phát triển dựa trên một nền tảng toán học vững vàng, khả năng huấn luyện
trong kỹ thuật này dựa trên mô hình thần kinh trung ương của con người.
Kết quả mà mạng nơron học được có khả năng tạo ra các mô hình dự báo, dự đoán
với độ chính xác và độ tin cậy cao. Nó có khả năng phát hiện ra được các xu hướng
phức tạp mà kỹ thuật thông thường khác khó có thể phát hiện ra được. Tuy nhiên
phương pháp mạng nơron rất phức tạp và quá trình tiến hành nó gặp rất nhiều khó khăn:
đòi hỏi mất nhiều thời gian, nhiều dữ liệu, nhiều lần kiểm tra thử nghiệm.
Cây quyết định
Kỹ thuật cây quyết định là một công cụ mạnh và hiệu quả trong việc phân lớp và
dự báo. Các đối tượng dữ liệu được phân thành các lớp. Các giá trị của đối tượng dữ
liệu chưa biết sẽ được dự đoán, dự báo. Tri thức được rút ra trong kỹ thuật này thường
được mô tả dưới dạng tường minh, đơn giản, trực quan, dễ hiểu đối với người sử dụng.
1.3.5. Ứng dụng của khai phá dữ liệu:
Khai phá dữ liệu được vận dụng để giải quyết các vấn đề thuộc nhiều lĩnh vực khác
nhau.
Khai phá dữ liệu được sử dụng để phân tích dữ liệu, hỗ trợ ra quyết định.
- Trong sinh học
- Trong y học.
- Tài chính và thị trường chứng khoán
- Khai thác dữ liệu web.
- Trong thông tin kỹ thuật
- Trong thông tin thương mại.
1.3.6. Giới thiệu về phần mềm DTREG
1. DTREG
DTREG là chương trình phân tích thống kê mạnh mẽ, có khả năng xây dựng cây
quyết định phân lớp, hồi quy và hỗ trợ mô hình SVM để mô tả mối liên hệ giữa dữ
liệu, và có thể sử dụng để dự đoán giá trị khảo sát trong tương lai.
DTREG chấp nhận tập hợp dữ liệu chứa một số dòng với một cột cho mỗi biến.
Một trong các biến là biến kết quả (target variable), giá trị của nó được mô hình hóa và
được dự đoán như là một hàm của biến cho trước (biến dự báo - predictor variable).
12
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
DTREG phân tích giá trị và cho ra một mô hình chỉ cách tốt nhất để dự đoán giá trị
của biến kết quả dựa trên giá trị biến cho trước.
Ngoài việc xây dựng mô hình dự báo, DTREG còn thực hiện V-fold qua sự xác
nhận tính hợp lệ và lấy mẫu những cản trở để đo chất lượng mô hình.
DTREG có thể tạo những mô hình cây đơn cổ điển cũng như TreeBoost,
Decision Tree Forest gồm có nhiều cây. DTREG cũng có thể xây dựng mô hình
Support Vector Machine (SVM) và Hồi quy logictic (Logistic Regression) .
DTREG bao gồm ngôn ngữ chuyển đổi dữ liệu (DTL: data transformation
language) để chuyển đổi biến, tạo ra biến mới và chọn các dòng để phân tích.
Đặc điểm của DTREG
Dễ sử dụng: DTREG là một ứng dụng thiết thực được cài đặt dễ dàng trên các
hệ thống Windows bất kỳ. DTREG dùng giá trị phân cách dấu phẩy những file dữ liệu
để dễ dàng tạo ra hầu hết các nguồn dữ liệu bất kỳ. Một khi bạn tạo những file dữ liệu
của bạn, ngay khi cung cấp nó vào trong DTREG, và để DTREG làm tất cả công việc
tạo cây quyết định, SVM hoặc mô hinh Logistic Regression. Ngay cả những phân tích
phức tạp cũng có thể thực hiện trong vài phút.
Cây phân lớp và cây hồi quy: DTREG có thể xây dựng cây phân lớp nơi mà
biến kết quả được dự đoán là categorical và cây hồi quy khi mà biến kết quả là
continuous như số lượng thu vào hoặc bán ra.
Single-tree, TreeBoost, Decision Tree Forests, Support Vector Machine và
Logistic Regression: Bằng cách đánh dấu (check) một button, bạn có thể điều khiển
DTREG xây dựng một lớp mô hình single-tree, một mô hình treeBoost gồm có một
chuỗi cây, Decision Tree Forest.
Tự động tỉa (pruning) cây: DTREG sử dụng V-fold cross-validation để quyết
định kích thước tối ưu của cây. Thủ tục này để tránh vấn đề vượt giới hạn nơi đó cây
phát sinh phù hợp tốt với dữ liệu “huấn luyện” nhưng không cung cấp dự đoán chính
xác dữ liệu mới.
Việc chia thay thế (Surrogate splitters) cho dữ liệu thiếu: DTREG sử dụng
một kỹ thuật tinh vi để giải quyết việc chia thay thế dữ liệu (Surrogate splitters )
trong trường hợp thiếu giá trị. Điều này cho phép những trường hợp có giá trị và một
vài trường hợp thiếu giá trị được sử dụng để dự đoán giá trị cho những trường hợp
thiếu giá trị.
Trình bày trực quan cây: DTREG có thể trình bày cây quyết định đã phát
sinh trên màn hình, ghi vào file hình ảnh .jpg hoặc file .png để in nó. Khi in DTREG
sử dụng kỹ thuật tinh vi để đánh số cây qua nhiều trang.
DTREG chấp nhận dữ liệu text cũng như dữ liệu số.
DTL: data transformation language (DTL) DTREG bao gồm một ngôn ngữ
chuyển đổ dữ liệu để chuyển đổi biến, tạo các biến mới và chọn những trường hợp bao
gộp trong phân tích.
Lưu những thông tin đã phân tích vào Project files: DTREG lưu tất cả
những thông tin về biến, phấn tích tham số cũng như bản tường thuật và cây phát sinh
vào project file. Sau này bạn có thể mở project file, những tham số thay đổi hoặc trả về
với một tập dữ liệu khác.
13
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
Cho điểm những giá trị dự đoán: Khi cây quyết định đã được xây dựng, bạn
có thể dùng DTREG để cho điểm tập dữ liệu mới và giá trị dự đoán cho biến kết quả.
Tạo Source code tính điểm: Chức năng “Translate” trong DTREG phát sinh
source code C, C++ và SAS@ để tính toán giá trị dự đoán. Source code này có thể
được bao gồm trong chương trình ứng dụng để thực hiện việc cho điểm vùng dữ liệu
lớn.
Có khả năng rất mạnh: Enterprise Version của DTREG có thể sử dụng
không giới hạn số dòng dữ liệu. DTREG có thể xây dựng cây phân lớp với những biến
dự báo có hàng trăm loại biến dự báo được sử dụng một thuật toán gom cụm hiệu quả.
(Nhiều chương trình cây quyết định khác hạn chế biến dự báo tối đa là 16 loại).
Thư viện DTREG COM: DTREG COM Library có thể được gọi từ chương
trình ứng dụng để tính toán dự báo giá trị biến kết quả sử dụng cây quyết định phát
sinh bởi DTREG.
2. Cây quyết định
Một trong những phương pháp mô hình hóa phức tạp nhất là cây quyết định và
phương pháp “tập hợp” (ensemble) cây, như TreeBoost và Decision Tree Forest.
Chương trình DTREG phân tích (“khai thác”) tập giá trị dữ liệu và tạo ra cây
quyết định. Cây quyết định có thể sử dụng để dự đoán giá trị của biến target dựa trên
những giá trị của những biến predictor. Giống như một cái cây thật, cây quyết định có
gốc, nhánh và lá. Một dự đoán được tạo bằng cách vào cây tại gốc và theo nhánh trái
hoặc phải dựa vào giá trị biến predictor cho đến khi tới lá. Mỗi lá chỉ ra giá trị có khả
năng phù hợp nhất cho biến target đã cho bởi giá trị predictor dẫn đến lá.
Khái niệm cây quyết định đã có từ lâu, nó bắt nguồn từ khái niệm cơ bản về quá
trình suy diễn, nhưng khả năng phân tích một tập dữ liệu lớn với nhiều biến lại đòi hỏi
năng lực của máy tính rất lớn mà điều này là không khả thi cho đến hiện nay, khi mà
những máy tính tốc độ cao được phát triển.
Cây quyết định có một số thuận lợi hơn trong cạnh tranh.
Đặc điểm của những mô hình cây quyết định cơ sở:
Cây quyết định dễ xây dựng: Ngay khi cung cấp tập dữ liệu vào DTREG, nó
sẽ làm tất cả các công việc xây dựng cây quyết định và tỉa (rút gọn) nó 1 cách hiệu quả
nhất.
Cây quyết định dễ hiểu: Trái với sự phức tạp của các mô hình hồi quy phi
tuyến, hay các mạng Neural. Cây quyết định cung cấp một mô hình trình bày dữ liệu
rõ ràng, logic. Chúng có thể được hiểu và được sử dụng bởi những người không có
năng khiếu toán học
Cây quyết định xử lý cả hai loại biến continuous và categorical: Biến
Categorical như là giống, chủng tộc, tín ngưỡng tình trạng hôn nhân và vùng địa lý thì
rất khó khăn để mô hình hóa bằng cách sử dụng kỹ thuật số giống như hồi quy và
mạng neural. Trái lại, biến categorical được xử lý dễ dàng bởi cây quyết định.
Cây quyết định có thể thực hiện phân lớp cũng như hồi quy: Giá trị dự
đoán từ cây quyết định không chỉ đơn giản là giá trị số nhưng cũng có thể dự đoán
những loại như là giống đực/cái, độc ác/hiền lành, thường xuyên mua/ thỉnh thoảng
mua v.v…
14
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
Cây quyết định chấp nhân dữ liệu kiểu text cũng như dữ liệu kiểu số: Nếu
bạn có những biến categorical với các giá trị như “Male”, “Female”, “Married”,
“Tennessee”, Protestant” v.v.., không cần mã hóa chúng như là dữ liệu số.
Cây quyết định tự động xử lý sự tương tác giữa các biến: Có thể phân biệt
ý nghĩa khác nhau giữa đàn ông/đàn bà, người sống ở miền Bắc và miền Nam v.v…
Những tác động này được biết như những sự tương tác biến. Cây quyết định tự động
phân phối những tương tác này bằng cách chia những trường hợp và phân tích mỗi
nhóm một cách riêng biệt.
Cây quyết định nhận ra những biến quan trọng: Bằng cách xem xét những
biến nào được sử dụng để chia những nút gần đỉnh của cây, bạn có thể xem xét nhanh
chóng những biến quan trọng nhất. DTREG dẫn điều này xa hơn bằng cách phân tích
tất cả sự chia tách đã phát sinh từ mỗi biến và chọn lựa điều chia tách đại diện
Những mô hình cây tổng quát có độ chính xác cao: DTREG cung cấp mô
hình cây đơn cổ điển cũng như mô hình Tree Boost và Rừng Cây Quyết Định. Đối với
nhiều ứng dụng phương pháp cây tổng quát sản sinh những kết quả đúng đắn nhất của
những phương pháp mô hình bất kỳ
1.4. Khả năng ứng dụng khai phá dữ liệu trong đánh giá đất đai
Trong phương pháp đánh giá đất của FAO, ở Việt Nam thông thường trong các
đánh giá đất đai hiện nay thường áp dụng phương pháp kết hợp theo điều kiện hạn chế,
dựa vào mức độ thích nghi của các yếu tố thành phần, mức độ thành phần tổng hợp
được xác định theo nguyên tắc dựa vào cấp hạn chế cao nhất để kết luận khả năng
thích nghi chung, mà không tính đến tầm quan trọng và sự tương tác hỗ trợ thay thế
giữa các yếu tố thành phần. Việc đánh giá phân hạng thích nghi đất đai của FAO là do
sự nhận định chủ quan của người đánh giá xác định theo đặc điểm, đặc tính sinh lý của
loại cây trồng mà các nhà nông học đã nhận định để đưa ra những cấp phân hạng S1,
S2, S3, N. Do đó làm cho kết quả đánh giá phân hạng thích nghi đất đai chỉ có giá trị
định hướng chung.
Để khắc phục những hạn chế của phương pháp đánh giá đất của FAO có thể ứng
dụng kỹ thuật khai phá dữ liệu vào trong đánh giá đất đai. Từ năng suất cây trồng
trong quá trình canh tác ta tiến hành phân tích hồi quy cây quyết định để định lượng
trong đánh giá đất đai. Phân tích hồi quy cây quyết định dựa trên nền tảng toán rời rạc,
các biến yếu tố đặc điểm đất đai ví dụ như loại đất (đất đỏ, đất đen, đất xám….) được thể
hiện dưới dạng TEXT, dạng mô phỏng gọi là biến phạm trù (categorical), mà không phải
dưới dạng các biến số liên tục hay biến nhị nguyên như trong các phần mềm phân tích
thống kê hiện có Eview, SPSS,… Kết quả phân tích hồi quy cây quyết định sẽ cho ta
kết quả là một tổ hợp các yếu tố đặc điểm của đất đai, tương ứng với mỗi tổ hợp đó là
một mức sản lượng trung bình với sai số cho phép.
Chương trình DTREG là phần mềm phân tích thống kê mạnh mẽ nó đáp ứng các
yêu cầu cho việc phân tích hồi quy cây quyết định. Ngay khi cung cấp tập dữ liệu vào
DTREG, nó sẽ làm tất cả các công việc xây dựng cây quyết định, phân tích hồi quy và
tỉa (rút gọn) dữ liệu 1 cách hiệu quả nhất. Trái với sự phức tạp của các mô hình hồi
quy phi tuyến, hay các mạng Neural. Cây quyết định cung cấp một mô hình trình bày
dữ liệu rõ ràng, logic.
15
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
Như vậy, để tiến hành định lượng trong đánh giá đất đai chúng ta có thể sử dụng kỹ
thuật khai phá dữ liệu đó là xây dựng hàm hồi quy kết hợp mô hình cây quyết định cụ thể là
thông qua phần mềm DTREG:
Mô hình Cây quyết định
Việc xây dựng cây quyết định được thực hiện dựa trên phép đo tính thuần nhất
hay ngược lại là mức độ hỗn loạn (entropy) của một tập hợp.
Có hai độ đo thường dùng để lựa chọn thuộc tính:
Độ lợi thông tin (Information Gain): đo mức độ hỗn loạn của thông tin. Tại
mỗi cấp, cây được phân nhánh theo thuộc tính có độ lợi thông tin lớn nhất (hay nói
cách khác tối thiểu hóa mức độ hỗn loạn của thông tin).
Khi đó, với
S : số lượng tập dữ liệu
Si : số các mẫu của S nằm trong lớp Ci với i = {1, …, m}
thì thông tin cần biết để phân lớp một mẫu:
m
s
s
I( s1 ,s 2 ,...,s m ) i log 2 i
s
i 1 s
Thuộc tính A có các giá trị {a1, a2, …,an}. Dùng thuộc tính A để phân chia tập dữ
liệu thành n tập con {S1, S2,…,Sn}
Sij: số mẫu của lớp Ci thuộc tập con Sj (A = aj)
- Entropy của thuộc tính A:
E(A)
n
s 1 j ... s mj
j 1
s
I ( s 1 j ,..., s mj )
- Độ lợi thông tin dựa trên phân nhánh bằng thuộc tính A:
G(A) I(s1 , s 2 ,..., s m ) E(A)
Chỉ số Gini (Gini Index): trái với Gain, Gini đo độ “không trong suốt” của
thông tin, phép chia được chọn là phép chia có chỉ số Gini thấp nhất.
Chỉ số Gini của nút t:
GINI(t ) 1 p( j t )
2
Với p (j/t) là tần suất của lớp jj trong nút t.
Khi phân chia nút p thành k nhánh, chất lượng của phép chia được tính
bằng:
k
GINIchia
i 1
ni
GINI(i )
n
ni là số mẫu trong nút i
n là số mẫu trong nút p
Hai độ đo Gain và Gini được dùng cho mô hình phân lớp (biến kết quả là biến rời
Trong đó:
rạc).
Đối với mô hình hồi quy (biến kết quả là biến liên tục), việc xây dựng cây quyết
định lại dựa vào phương pháp bình phương bé nhất (Least Squares). Phép tách được
16
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
thực hiện sao cho tổng phương sai của các dòng trong mỗi node so với giá trị trung
bình mỗi node là bé nhất.
Như vậy, xét cho cùng, tuy với cách thức khác nhau, nhưng về bản chất vấn đề,
các phương pháp đều nhằm tối thiểu hóa sự hỗn loạn, và tối đa hóa độ lợi thông tin.
Tuy nhiên, khả năng ứng dụng của mỗi loại mô hình trong đánh giá đất đai là khác
nhau.
Hồi quy cây quyết định
- Dự báo các loại hình sử dụng đất thích hợp từ các biến liên tục và rời rạc. Do
đó mở ra khả năng nghiên cứu chính xác hơn ảnh hưởng của nhiều yếu tố đặc điểm đất
đai đến loại hình sử dụng đất, tiềm năng sử dụng đất nông nghiệp.
- Kết quả là một mô hình trình bày dữ liệu một cách dễ hiểu, rõ ràng. Việc dự
báo loại hình sử dụng đất thích hợp, phân cấp thích nghi đất đai hiển thị trên mô hình,
không cần tính toán.
- Cây quyết định xử lý được sự tương tác giữa các biến: tự động phân phối
những tương tác này bằng cách chia những trường hợp và phân tích mỗi nhóm một
cách riêng biệt. Từ đó thấy được mức độ tác động khác nhau của các yếu tố đến tiềm
năng sử dụng đất nông nghiệp tại những phân khúc khác nhau.
- Cây quyết định nhận ra những biến quan trọng, tạo nên sự khác biệt lớn khả
năng thích nghi đất đai.
Bằng các mô hình cây quyết định (decision tree), và phần mềm DTREG (Phillip
H. Sherrod, 2003) có thể định lượng mối quan hệ giữa các yếu tố đặc điểm đất đai với
năng suất cây trồng, phân cấp thích nghi của từng yếu tố đặc điểm đất đai với sai số
nhỏ hơn rất nhiều. Trong đề tài này, chúng tôi chọn huyện Định Quán – tỉnh Đồng
Nai, loại hình sử dụng đất là đất trồng điều làm ví dụ để ứng dụng khai phá dữ liệu để
định lượng trong đánh giá đất đai.
1.5. Khái quát về địa bàn nghiên cứu
1.5.1. Điều kiện tự nhiên
1. Vị trí địa lý
Huyện Định Quán với diện tích tự nhiên 971,23 km2 là huyện trung du phía Bắc
tỉnh Đồng Nai thuộc vùng Kinh tế trọng điểm phía Nam (KTTĐPN) – vùng kinh tế
năng động nhất cả nước.
Huyện Định Quán nằm trong tọa độ 110 00’30’’ – 110 25’00’’ vĩ độ Bắc và
107007’30’’ – 1070 30’00’’ kinh độ Đông, có ranh giới hành chính như sau:
+ Phía Bắc và Phía Đông giáp huyện Tân Phú.
+ Phía Đông Nam giáp huyện Đức Linh- tỉnh Bình Thuận.
+ Phía Nam giáp huyện Thống Nhất, Long Khánh, Xuân Lộc.
+ Phía Tây giáp huyện Vĩnh Cữu
Huyện có 14 đơn vị hành chính gồm: thị trấn Định Quán và 13 xã: Thanh Sơn,
Phú Tân, Phú Vinh, Phú Lợi, Phú Hòa, Ngọc Định, Gia Canh, Phú Ngọc, La Ngà, Túc
Trưng, Phú Túc, Phú Cường, Suối Nho.
17
Ngành Quản lý đất đai
SVTH: Phan Nguyễn Hoàng Hải
2. Địa hình, địa mạo
Huyện Định Quán là vùng chuyển tiếp giữa cao nguyên và trung du do đó địa
hình không bằng phẳng, có những vùng đồi gò lượn sóng tập trung ở các xã La Ngà,
Ngọc Định, Gia Canh, Thanh Sơn, Phú Vinh … và những vùng dốc thoải, độ nghiêng
trung bình 2,50/km theo hướng Đông Bắc - Tây Nam, độ cao trung bình 180m so với
mặt nước biển. Địa hình bị chia cắt bởi sông Đồng Nai và sông La Ngà tạo nên ba tiểu
vùng có các đặc điểm địa hình và thổ nhưỡng khác nhau bao gồm: Tiểu vùng phía
Nam gồm các xã La Ngà, Phú Túc, Túc Trưng, Phú Cường và Suối Nho, tiểu vùng
Thanh Sơn và phần còn lại.
3. Khí hậu
Khí hậu của huyện Định Quán mang đặc tính của khí hậu nhiệt đới gió mùa cận xích
đạo, nhiệt độ ổn định quanh năm, chịu ảnh huởng một thời gian ngắn đặc tính khí hậu
vùng cao nguyên Bảo Lộc – Lâm Đồng, hầu như không có mùa đông, có 2 mùa rõ rệt:
- Mùa khô: từ tháng 11 đến tháng 4 năm sau, có gió mùa Đông bắc mang đặc tính
chủ yếu của vành đai tín phong và khí hậu nhiệt đới ít hơi ẩm, nóng và hầu như không
mưa. Tuy nhiên do ảnh huởng của những cánh rừng phía bắc nên nhiệt độ không khí
phần nào đuợc điều hoà và dịu đi so với tính chất thực của nó.
- Mùa mưa: từ tháng 5 đến tháng 10, cũng chịu ảnh huởng chung của khí hậu
vùng Đông Nam Bộ, có gió mùa Tây Nam mang nhiều hơi ẩm từ biển Ấn Độ Duơng
khí hậu xích đạo nhiệt đới có đặc tính nóng ẩm và mưa nhiều. Ngoài ra còn chịu ảnh
huởng của vùng khí hậu cao nguyên (Bảo Lộc – Lâm Đồng) nên luợng mưa theo mùa
thương lớn, và đây cũng là nguồn nước chính cung cấp cho hồ Trị An
Nhiệt độ trung bình từ 23oC đến 29oC chênh lệch nhiệt độ không cao giữa các
tháng trong năm, giữa các ngày trong tháng, giữa ngày và đêm.
- Tổng tích ôn cao và nhiệt độ ít phân hoá tạo điều kiện cho việc bố trí các thời vụ
cây trồng trong năm. Tuy nhiên lượng mưa phân bố không đồng đều thường gây ảnh
hưởng đến sự tăng trưởng của cây trồng đặc biệt là sự lây lan sâu bệnh. Do đó cần phân
vùng nông nghiệp và lựa chọn cơ cấu cây trồng cho thích hợp với từng mùa vụ trong
năm.
- Do ảnh hưởng vùng cao nguyên Bảo Lộc – Lâm Đồng là sờn chắn gió tây
mang nhiều hơi ẩm từ biển Ấn Độ Dương nên lượng mưa ở Định Quán tương đối lớn
từ 2500 – 2800mm/ năm, có số ngày mưa từ 150 – 160 ngày/năm. Lượng mưa thường
phân bố theo mùa. Huyện Định Quán nằm trong vùng có lượng mưa cao nhất của tỉnh,
trung bình hàng năm từ 2.500 – 2.800mm. Khí hậu có hai mùa rõ rệt: mùa khô từ
tháng 11 đến tháng 4, vào thời gian này hầu như không có mưa. Mùa mưa từ tháng 5
đến tháng 10 chiếm 90% tổng lượng mưa cả mùa mưa, số ngày mưa từ 150 – 170
ngày/năm.
Có hai huớng gió chính và thổi theo mùa. Mùa khô có gió Đông Bắc (khô và
nóng), mùa mưa có gió Tây Nam (ẩm và nóng).
4. Thuỷ văn
Trên địa bàn có 02 tuyến thủy văn quan trọng: Sông Đồng Nai và Sông La Ngà
- Sông Đồng Nai bắt nguồn từ dãy Trường Sơn Nam, có độ dốc bình quân lưu vực
4,6%, độ cao trung bình lưu vực 470m, độ cao nguồn 1700m, lưu vực nước 30 tỷ
m3/năm.
18