Báo cáo tóm tắt đề tài khoa học và công nghệ: Nghiên cứu một số thuật toán lấy cảm hứng từ tự nhiên và ứng dụng vào bài toán tối ưu nỗ lực, chi phí phát triển phần mềm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.23 MB, 30 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

BÁO CÁO TÓM TẮT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP ĐẠI HỌC ĐÀ NẴNG

NGHIÊN CỨU MỘT SỐ THUẬT TOÁN LẤY CẢM HỨNG
TỪ TỰ NHIÊN VÀ ỨNG DỤNG VÀO BÀI TỐN
TỐI ƯU NỠ LỰC, CHI PHÍ PHÁT TRIỂN PHẦN MỀM
Mã số: B2016-ĐN02-06

Chủ nhiệm đề tài: TS. Lê Thị Mỹ Hạnh
Thành viên : KS. Khuất Thanh Tùng
KS. Ngô Thành Phát

Đà nẵng, 5/2018

Mục lục

ii

MỤC LỤC
MỤC LỤC .................................................................................................................................. I
DANH SÁCH HÌNH VẼ ........................................................................................................ IV
DANH SÁCH BẢNG ............................................................................................................. IV
CHƯƠNG 1. CÁC THUẬT TOÁN TỐI ƯU LẤY CẢM HỨNG TỪ TỰ NHIÊN ............... 1
1.1. Giới thiệu vấn đề ....................................................................................................... 1
1.2. Tính phức tạp của bài tốn tới ưu .............................................................................. 1
1.3. Phân lớp các ng̀n cảm hứng từ tự nhiên để xây dựng tḥt tốn tới ưu ................ 1
1.4. Tởng quan về các tḥt tốn tới ưu từ tự nhiên ......................................................... 1

1.5. Giới thiệu chung về các thuật toán được sử dụng trong đề tài .................................. 1
1.6. Thuật toán đàn ong nhân tạo ..................................................................................... 2
1.7. Thuật toán dạy-học .................................................................................................... 2
1.8. Thuật toán đàn ong nhân tạo kết hợp dạy học ........................................................... 2
1.9. Tḥt tốn tới ưu bầy đàn .......................................................................................... 2
1.10. Thuật toán lai giữa đàn ong nhân tạo và tối ưu bầy đàn (ABC-PSO) ....................... 2
CHƯƠNG 2. BÀI TOÁN ƯỚC LƯỢNG NỖ LỰC PHÁT TRIỂN PHẦN MỀM .................. 3
2.1. Giới thiệu bài tốn ..................................................................................................... 3
2.2. Tởng quan về các kỹ thuật ước lượng nỗ lực phần mềm .......................................... 3
2.3. Các phương pháp ước lượng nỗ lực dựa trên phương tình tốn học ......................... 4
2.3.1.
Mơ hình ước lượng giá cấu thành COCOMO ............................................... 4
2.3.1.1. Các phương thức phát triển phần mềm trong mô hình COCOMO ......... 4
2.3.1.2. Mô hình COCOMO cơ sở ........................................................................ 4
2.3.1.3. Mô hình COCOMO trung cấp ................................................................. 4
2.3.1.4. Mô hình COCOMO nâng cao .................................................................. 4
2.3.1.5. Mô hình COCOMO II .............................................................................. 4
2.3.2.
Phương pháp điểm chức năng ....................................................................... 8
2.3.3.
Kết hợp COCOMO II và điểm chức năng để ước lượng nỗ lực ................... 8
2.4. Phương pháp ước lượng nỗ lực cho quy trình phần mềm Agile ............................... 8
2.4.1.
Quy trình phát triển phần mềm Agile............................................................ 8
2.4.1.1. Các nguyên tắc của quy trình Agile......................................................... 8
2.4.1.2. Các đặc trưng của quy trình Agile .......................................................... 8
2.4.2.
Phương pháp ước lượng nỗ lực phát triển phần mềm sử dụng quy trình Agile8
2.4.2.1. Các yếu tố đầu vào của mô hình ước lượng ............................................ 9
2.4.2.2. Xác định story point cho dự án .............................................................. 10

2.4.2.3. Xác định vận tốc của nhóm phát triển ................................................... 11
2.4.2.4. Xác định thời gian và chi phí dự án ...................................................... 11
CHƯƠNG 3. CÀI ĐẶT, THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ ................................. 12
3.1. Đặt vấn đề................................................................................................................ 12
3.2. Các tiêu chuẩn đánh giá kết quả ước lượng nỗ lực ................................................. 13
3.3. Tới ưu tham sớ mơ hình COCOMO bằng tḥt tốn TLABC ................................ 13
3.3.1.
Hàm thích nghi ............................................................................................ 13
3.3.2.
Kết quả thực nghiệm ................................................................................... 14
3.4. Phương trình toán học mới cho bài toán ước lượng nỗ lực phát triển cho các phần mềm
sử dụng quy trình Agile ...................................................................................................... 14
3.4.1.
Phương trình toán học đề xuất .................................................................... 14

Mục lục
iii
3.4.2.
Tìm tham số tối ưu cho công thức ước lượng Agile sử dụng thuật toán ABCPSO
..................................................................................................................... 14
3.4.2.1. Biểu diễn cá thể của thuật toán và hàm thích nghi ............................... 15
3.4.2.2. Kết quả thực nghiệm .............................................................................. 15
3.5. Phân tích chức năng của chương trình .................................................................... 15
3.6. Thiết kế chương trình .............................................................................................. 15
3.6.1.
Biểu đồ ca sử dụng (Use case) .................................................................... 16
3.6.2.
Biểu đồ tuần tự và hoạt động ...................................................................... 17
3.6.3.

Biểu đồ lớp .................................................................................................. 18
3.7. Một số hình ảnh của hệ thống ước lượng nỗ lực ..................................................... 19
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .............................................................................. 21

Danh sách hình vẽ và bảng

iv

DANH SÁCH HÌNH VẼ
Hình 1.
Hình 2.
Hình 3.
Hình 4.
Hình 5.
Hình 6.
Hình 7.
Hình 8.
Hình 9.
Hình 10.
Hình 11.

Phân loại các nguồn cảm hứng từ tự nhiên ....................................................... 1
Phân loại các kỹ thuật ước lượng nỗ lực phát triển phần mềm ......................... 3
Biểu đồ Ca sử dụng (Use case) ....................................................................... 16
Biểu đồ phân rã chức năng xem dự án ............................................................ 17
Biểu đồ tuần tự của chức năng ước lượng dự án ............................................. 17
Biểu đồ hoạt động của chức năng thiết lập tham số mô hình ước lượng ........ 18
Biểu đồ lớp của hệ thống ước lượng nỗ lực .................................................... 18
Giao diện chức năng chính của phần mềm ước lượng nỗ lực ......................... 19

Giao diện khi một dự án đã kết thúc ............................................................... 19
Giao diện chức năng tạo mới một dự án COCOMO ....................................... 20
Giao diện chức năng thiết lập cấu hình tham số.............................................. 20

DANH SÁCH BẢNG
Bảng 1.
Bảng 2.
Bảng 3.
Bảng 4.
Bảng 5.
Bảng 6.
Bảng 7.

Các yếu tố hiệu chính chi phí của mô hình COCOMO II ................................. 4
Thang điểm các yếu tố hiệu chỉnh chi phí mô hình COCOMO II .................... 6
Các nhân tố ảnh hưởng đến quy mô dự án ........................................................ 7
Thang điểm các nhân tố ảnh hưởng đến quy mô dự án..................................... 7
Điểm quy mô cho các user story ..................................................................... 10
Kết quả ước lượng nỗ lực sử dụng thuật toán ABC, TLABC, COCOMO II .. 14
Kết quả ước lượng của các tḥt tốn tới ưu trên các tiêu chí đánh giá.......... 15

Danh sách từ viết tắt

v

DANH SÁCH TỪ VIẾT TẮT
Từ viết tắt
ABC
ABC-PSO

CCNN
CoBRA
COCOMO
D
DF
EAF
Eff
ES
FP
FR
GMDHPNN
GRNN
KLOC
MAR
MdMRE
ME
MMRE
MRE
NE
NP
PNN
PSO
PRED(N)
SF
SP
TCF
TLBO
TLABC
UFP
Vi

V

Ý nghĩa
Artificial Bee Colony – Thuật toán đàn ong nhân tạo
Hybrid Artificial Bee Colony and Particle Swarm Optimization – Thuật tốn
lai giữa đàn ong nhân tạo và tới ưu bầy đàn
Cascade-Correlation Neural Networks – Mạng nơ-ron tương quan xếp tầng
Phương pháp ước lượng chi phí, chuẩn hóa và phân tích rủi ro
COnstructive COst MOdel – Mô hình ước lượng giá cấu thành
Sớ chiều của bài tốn
Hệ sớ giảm tớc của các yếu tố hay biến động trong dự án Agile
Effort adjustment factor – Yếu tố hiệu chỉnh nỗ lực
Effort – Nỗ lực
Điểm cho mỗi user story
Function Point – Điểm chức năng
Hệ số giảm vận tốc thường xuyên trong dự án Agile
Group Method of Data Handling Polynomial Neural Network – Mạng nơ-ron
với phương pháp nhóm xử lý dữ liệu tuyến tính
General Regression Neural Networks – Mạng nơ-ron hồi quy tổng quát
Ngàn dòng lệnh
Mean Absolute Residual – số dư tuyệt đối trung bình
Median Magnitude of Relative Error – Độ lớn trung vị của lỗi tương đối
Methodology – Nhân tố phương pháp luận trong mô hình Sheta-Uysal
Mean Magnitude of Relative Error – Độ lớn trung bình của lỗi tương đối
Magnitude of Relative Error – Độ lớn của lỗi tương đối
Số ong thợ trong tḥt tốn ABC
Sớ cá thể trong tḥt tốn tới ưu bầy đàn
Probabilistic Neural Networks – Mạng nơ-ron xác suất
Particle Swarm Optimization – Tḥt tốn tới ưu bầy đàn
Precision at level N – Độ chính xác ở mức lỗi dưới N%

Nhân tố ảnh hưởng đến quy mô dự án
Tổng điểm Story point của một dự án Agile
Độ phức tạp kỹ thuật của thệ thống sử dụng phân tích điểm chức năng
Teaching-learning-based Optimization – Tḥt tốn tới ưu dạy học
Teaching-learining based Artificial Bee Colony – Thuật toán đàn ong nhân
tạo cải tiến sử dụng cơ chế dạy học
Điểm chức năng thô
Vận tốc cơ sở của nhóm phát triển
Vận tốc sau hiệu chỉnh của nhóm phát triển

Mở đầu

vi

MỞ ĐẦU
Tối ưu hóa là một lĩnh vực tối quan trọng có tính ứng dụng cao trong nhiều lĩnh vực
như quy hoạch tài nguyên, thiết kế chế tạo máy, điều khiển tự động, quản trị kinh doanh,
kiến trúc đô thị, công nghệ thông tin, xây dựng các hệ hỗ trợ ra quyết định trong quản lý
và phát triển các hệ thống lớn. Các mục tiêu của tối ưu hóa là cực tiểu tài nguyên và chi
phí sử dụng, cũng như tối đa hóa lợi nhuận, hiệu năng và tính chính xác. Vì thời gian,
tiền bạc và tài nguyên luôn bị giới hạn trong các ứng dụng thực tế nên chúng ta phải tìm
ra giải pháp để sử dụng hiệu quả các nguồn tài nguyên có giá trị này trong điều kiện có
một số ràng buộc nhất định kèm theo. Cùng với sự phát triển của khoa học và công nghệ,
các bài tốn tới ưu phát sinh từ thực tế cuộc sống ngày càng đa dạng và phức tạp khi sớ
chiều của các bài tốn thực tế ngày càng lớn. Bởi vì tính liên hệ và tương quan giữa các
biến với nhau ngày một gia tăng nên các vấn đề này không thể được giải quyết trong giới
hạn thời gian hợp lý và cho ra lời giải chính xác. Kích thước và độ phức tạp của các bài
toán thực tế yêu cầu sự phát triển của các kỹ thuật mới có thể tìm kiếm lời giải chấp nhận
được trong một khoảng thời gian cho phép. Các thuật toán tìm kiếm lời giải chính xác

không thể giải quyết được các bài toán này trong một khoảng thời gian giới hạn. Khi đó
việc sử dụng các thuật toán xấp xỉ là một lựa chọn phù hợp để tìm thấy các lời giải gần
tối ưu. Qua nhiều thập kỷ, các khái niệm, kỹ thuật và các ứng dụng tính toán được lấy
cảm hứng từ tự nhiên đã được phát triển để giải quyết các bài tốn tới ưu một cách hiệu
quả. Tính tốn lấy cảm hứng từ tự nhiên có thể giải quyết các bài toán trong hầu hết các
lĩnh vực từ mạng cảm biến khơng dây, mạng máy tính, an tồn thơng tin, công nghiệp rô
bốt, công nghệ y sinh, các hệ thống điều khiển, xử lý song song, khai phá dữ liệu, các hệ
thống quản lý và tiêu thụ năng lượng, xử lý ảnh và nhiều lĩnh vực khác. Thiết kế các
thuật toán lấy cảm hứng từ tự nhiên liên quan đến việc chọn các phương pháp biểu diễn
phù hợp cho bài toán, đánh giá chất lượng của các lời giải thông qua hàm mục tiêu, và
định nghĩa các phương pháp để sinh ra lời giải mới cho bài toán. Các tḥt tốn này mơ
phỏng các cấu trúc và hành vi của các hệ thống phức tạp trong tự nhiên. Vì các nguồn
cảm hứng từ tự nhiên rất đa dạng nên có nhiều thuật toán khác nhau đã được đề xuất. Tuy
nhiên, những cách phân loại nguồn cảm hứng trong các nghiên cứu vẫn chưa thống nhất
và bao phủ hết những thuật toán hiện có. Cùng với đó, hiện nay vẫn chưa có nghiên cứu
nào ở Việt Nam thực hiện việc phân loại này và các thuật toán lấy cảm hứng từ tự nhiên
vẫn là một nghiên cứu khá mới mẻ trong nước. Bởi thế, một yêu cầu bức thiết là phải có
một phương pháp phân loại các nguồn cảm hứng này một cách phù hợp. Trong nghiên
cứu này, chúng tôi sẽ đề xuất một hướng phân loại mới cho các thuật toán lấy cảm hứng
từ tự nhiên cũng như giới thiệu tởng quan về một sớ tḥt tốn mới trong lĩnh vực này để
đóng góp một nguồn tài liệu tham khảo có giá trị phục vụ cho các nghiên cứu về sau.
Quy trình ước lượng nỗ lực và chi phí là một thành phần rất quan trọng trong các dự
án công nghệ phần mềm. Sự thành công hay thất bại của dự án phụ thuộc rất nhiều vào
tính chính xác của việc ước lượng nỗ lực và tiến độ dự án. Nếu chi phí ước lượng quá
thấp so với chi phí thực tế sẽ có ảnh hướng bất lợi về chất lượng của sản phẩm phần mềm
cuối cùng, làm ảnh hưởng đến uy tín và tính cạnh tranh của doanh nghiệp. Nếu chi phí
ước lượng quá cao so với chi phí thực tế sẽ ảnh hưởng tới nguồn lực được phân bổ cho
các dự án khác hoặc làm giảm doanh thu của doanh nghiệp khi không đủ nhân lực trong

Mở đầu

vii

kế hoạch để đấu thầu các dự án mới. Tập đồn Standish đã tun bớ rằng 44% của các dự
án phần mềm được chuyển giao trễ hạn hoặc vượt quá ngân quỹ cho phép. Điều này cho
thấy tầm quan trọng của việc quản trị dự án. Hiệp hội quốc tế về phân tích đầu vào cho
các dự án (ISPA) đã nêu ra ba nguyên nhân chính dẫn đến sự thất bại của các dự án bao
gồm: thiếu hụt các ước lượng về kỹ năng của nhân viên, thiếu hụt các hiểu biết về yêu
cầu của dự án, và ước lượng kích cỡ dự án không chính xác. Một nghiên cứu khác được
thực hiện bởi tập đoàn Standish để xác định các nhân tố chính dẫn đến sự thất bại của các
dự án đã tìm ra các nguyên nhân sau: sự không chắc chắn trong yêu cầu của hệ thống, sự
giới hạn về ngân quỹ, thiếu kỹ năng ước lượng dự án, ước lượng không chính xác nỗ lực
cần phân bổ cho dự án, bỏ qua các dữ liệu lịch sử về các dự án đã phát triển. Từ đó có thể
thấy rằng, nguyên nhân chủ yếu dẫn đến sự thất bại của các dự án phần mềm là do ước
lượng không chính xác về kích cỡ phần mềm và nỗ lực cần có để thực hiện dự án. Do
vậy, việc áp dụng các tḥt tốn tới ưu lấy cảm hứng từ tự nhiên để nâng cao tính chính
xác cho bài toán ước lượng dự án phần mềm có ý nghĩa đặt biệt quan trọng đối với doanh
nghiệp và nhà đầu tư.
Trong những năm gần đây, quy trình phần mềm Agile trở thành một lựa chọn mới
được nhiều doanh nghiệp áp dụng để quản lý toàn bộ quy trình phát triển phần mềm. Tuy
nhiên, các nghiên cứu về lĩnh vực này trên thế giới vẫn còn rất ít và ở Việt Nam hầu như
chưa tìm thấy một nghiên cứu nào. Trong khi đó, việc sử dụng các phương pháp truyền
thống để ước lượng nỗ lực cho các dự án Agile cho kết quả ước lượng không chính xác.
Trong thực tế, tính phức tạp và kích thước của các phần mềm ngày một gia tăng, các dự
án vượt quá vài chục triệu dòng lệnh đã không còn xa lạ. Các tổ chức phát triển phần
mềm yêu cầu nhiều nhân viên kỹ thuật hơn và các chi phí của phần mềm có thể lên tới
hàng triệu đô la. Sai sót trong ước lượng chi phí có thể dẫn đến những hậu quả rất nghiêm
trọng. Điều đó đòi hỏi phải phát triển một kỹ thuật nhằm nâng cao tính hiệu quả của các
phương pháp ước lượng phần mềm truyền thống cũng như đề xuất một phương pháp ước

lượng phần mềm mới cho quy trình Agile. Đề tài này hướng tới mục đích áp dụng các
tḥt tốn tới ưu hóa như một kỹ tḥt tính toán mềm để nâng cao tính chính xác của quy
trình ước lượng nỗ lực phát triển phần mềm truyền thống và phần mềm sử dụng quy trình
Agile.
Các đóng góp mới trong nghiên cứu này gồm có:
-

Phân lớp các nguồn cảm hứng từ tự nhiên được sử dụng để xây dựng nên các tḥt
tốn tới ưu.

-

Đề x́t các cải tiến quan trọng cho các tḥt tốn tới ưu thường được sử dụng bao
gờm: tḥt tốn đàn ong nhân tạo, tḥt tốn dạy học, và tḥt tốn tới ưu bầy đàn.

-

Nghiên cứu tởng quan về bài tốn ước lượng nỡ lực phát triển phần mềm, khảo sát
các phương pháp đang được sử dụng.

-

Cải tiến các mô hình ước lượng nỗ lực truyền thống như COCOMO, Sheta-Uysal
bằng cách tối ưu các tham số cho các mô hình ước lượng này sử dụng các thuật
toán cải tiến đề xuất.

Mở đầu

viii

-

Xây dựng một phương trình ước lượng nỗ lực mới dựa trên các yếu tố cần thiết cho
một dự án phần mềm sử dụng quy trình Agile. Các tham số của công thức ước
lượng nỗ lực đề xuất được xây dựng động sử dụng các tḥt tốn tới ưu.

-

Đánh giá, so sánh toàn diện các phương pháp đề xuất với các nghiên cứu khác.

-

Xây dựng một phần mềm hỗ trợ cho ra các kết quả ước lượng dựa trên các yếu tố
đầu vào của các mô hình.

Báo cáo này được chia thành các phần chính như sau:
Chương 1: trình bày về các thuật toán lấy cảm hứng từ tự nhiên.
Chương 2: giới thiệu các mô hình ước lượng nỗ lực phát triển phần mềm truyền thống
và ước lượng nỗ lực cho các phần mềm sử dụng quy trình phát triển Agile.
Chương 3: mô tả các kết quả của việc áp dụng các tḥt tốn tới ưu để nâng cao tính
chính xác của các kết quả ước lượng và trình bày các bước về phân tích và thiết kế
chương trình ước lượng nỗ lực mà chúng tôi đã xây dựng.
Những xuất bản trong quá trình nghiên cứu đề tài:
[1] Thanh Tung Khuat, My Hanh Le, "A novel hybrid ABC-PSO algorithm for effort
estimation of software projects using Agile methodologies," Journal of Intelligent
Systems, 2017 (Online First), DOI: 10.1515/jisys-2016-0294, (Scopus and ESCI
indexed)
[2] Thanh Tung Khuat, My Hanh Le, "Optimizing Parameters of Software Effort
Estimation Models using Directed Artificial Bee Colony Algorithm," Informatica,

vol. 40(4), 12/2016 (Scopus and ESCI indexed)
[3] Thanh Tung Khuat, My Hanh Le, "Applying Teaching-Learning to Artificial Bee
Colony for Parameter Optimization of Software Effort Estimation Model,"
Journal of Engineering Science and Technology (JESTEC), vol. 12, no. 5, 2017
(Scopus and ESCI indexed)
[4] Thanh Tung Khuat and My Hanh Le, "A Novel Technique of Optimization for the
COCOMO II Model Parameters using Teaching-Learning based Optimization
Algorithm," Journal of Telecommunications and Information Technology, vol.
1/2016, pp. 84-89, 2016 (Scopus indexed)

Chương 1: Các thuật toán tối ưu lấy cảm hứng từ tự nhiên

1

Chương 1. CÁC THUẬT TOÁN TỐI ƯU LẤY CẢM HỨNG
TỪ TỰ NHIÊN
Chương này giới thiệu tổng quan về tḥt tốn tới ưu, độ phức tạp của nó từ đó hướng
đến việc tìm hiểu các thuật toán gần đúng lấy cảm hứng từ tự nhiên để tìm lời giải xấp xỉ
cho các bài tốn tới ưu trong thực tế. Các nguồn cảm hứng từ tự nhiên sẽ được phân loại
làm tiền đề để nhóm các thuật toán hiện có trong lĩnh vực này vào từng nguồn cảm hứng
cụ thể. Ći cùng, ba tḥt tốn tới ưu phở biến được nghiên cứu trong đề tài này được
mô tả cụ thể.
1.1. Giới thiệu vấn đề
Các hiện tượng trong tự nhiên là một nguồn cảm hứng để thiết kế ra các quy luật và
xây dựng các hàm toán học cho các thuật toán metaheuristic để hướng dẫn quy trình tìm
kiếm hướng đến một lời giải tớt cho một bài tốn. Nghiên cứu này hướng đến việc phân
loại các nguồn cảm hứng, giới thiệu một sớ tḥt tốn điểm hình trong mỡi ng̀n cảm
hứng và ứng dụng một sớ tḥt tốn để giải qút một bài tốn trong thực tế là “Ước
lượng nỡ lực cần cho quy trình phát triển các sản phẩm phần mềm”.

1.2. Tính phức tạp của bài toán tối ưu
1.3. Phân lớp các nguồn cảm hứng từ tự nhiên để xây dựng thuật toán tối ưu
Trong nghiên cứu này, chúng tôi chia các nguồn cảm hứng thành ba nhóm lớn: vật lý,
hóa học và sinh học. Các nhóm con của từng nhóm được mô tả như trong Hình 1.

Hình 1. Phân loại các nguồn cảm hứng từ tự nhiên

1.4. Tổng quan về các thuật toán tối ưu từ tự nhiên
1.5. Giới thiệu chung về các thuật toán được sử dụng trong đề tài
Trong các thuật toán được trinh bày ở phần trước, có ba thuật toán thường được ứng
dụng rộng rãi để giải qút các bài tốn tới ưu trong thực tế là thuật toán đàn ong nhân
tạo, thuật toán dạy học và thuật toán trí tuệ bầy đàn. Tuy nhiên những thuật toán này vẫn

Chương 1: Các thuật toán tối ưu lấy cảm hứng từ tự nhiên

2

có các điểm yếu của nó trong việc tìm ra các lời giải có chất lượng cao. Vì vậy, chúng tơi
sẽ tập trung vào ba tḥt tốn chính này và giới thiệu các thuật toán cải tiến của chúng để
áp dụng vào bài tốn cụ thể là tới ưu nỗ lực phát triển phần mềm.
Chúng tôi hướng đến việc đề xuất một phiên bản cải tiến của thuật toán đàn ong nhân
tạo và ứng dụng nó vào việc nâng cao tính chính xác của một mô hình ước lượng phần
mềm cụ thể. Đề tài cũng sẽ áp dụng các nguyên lý trong thuật toán đàn ong nhân tạo để
lai ghép với tḥt tốn dạy học, tḥt tốn tới ưu bầy đàn để tạo ra một thuật toán mới
hiệu quả hơn trong việc đưa ra các dự đốn nỡ lực cần cung cấp cho một dự án phần
mềm. Trong đề tài này chúng tôi cũng đề xuất một phương trình ước lượng nỗ lực mới
dựa trên các nhân tố cần thiết cho một dự án phần mềm sử dụng các phương pháp phát
triển linh hoạt Agile. Các tham số của phương trình toán học mới này được xây dựng
bằng cách sử dụng các tḥt tốn tới ưu lấy cảm hứng từ tự nhiên được cải tiến theo

hướng hiệu quả hơn. Phần còn lại của chương này sẽ tập trung mơ tả chi tiết về ba tḥt
tốn được sử dụng trong nghiên cứu này.
1.6. Thuật toán đàn ong nhân tạo
1.7. Thuật toán dạy-học
1.8. Thuật toán đàn ong nhân tạo kết hợp dạy học
1.9. Thuật toán tối ưu bầy đàn
1.10. Thuật toán lai giữa đàn ong nhân tạo và tối ưu bầy đàn (ABC-PSO)

Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

3

Chương 2. BÀI TOÁN ƯỚC LƯỢNG NỖ LỰC PHÁT TRIỂN
PHẦN MỀM
Chương này trình bày tởng quan về bài tốn ước lượng nỗ lực phát triển phần mềm,
cũng như khảo sát các phương pháp đang được sử dụng trong việc sinh ra kết quả ước
lượng trong thực tế. Cuối chương sẽ trình bày về các mô hình ước lượng nỗ lực trùn
thớng dựa trên phương trình tốn học và một mô hình ước lượng nỗ lực mới cho các dự
án sử dụng quy trình Agile.
2.1. Giới thiệu bài toán
Ước lượng dự án phần mềm hiệu quả là một hoạt động quan trọng, đồng thời cũng là
một thách thức trong quá trình phát triển phần mềm. Ước lượng là một trong những nền
tảng cho việc lập kế hoạch dự án một cách hiệu quả. Nhiều tổ chức phải đối mặt với việc
thâm hụt ngân quỹ, đánh mất lợi thế cạnh tranh và chậm trễ trong việc giao sản phẩm cho
khách hàng dẫn đến mất uy tín.
Việc xác định chính xác nỗ lực và chi phí cần thiết cho một dự án phần mềm là một
yêu cầu tối quan trọng để đảm bảo dự án thành công trong thời gian và kinh phí cho
phép.
2.2. Tổng quan về các kỹ thuật ước lượng nỗ lực phần mềm

Các kỹ thuật ước lượng nỗ lực phần mềm có thể được phân nhóm theo nhiều cách
khác nhau. Một cách chia các kỹ thuật này thành sáu nhóm chính được mô tả bởi Chulani
và các cộng sự và được mô tả như Hình 2.
Các kỹ thuật ước lượng nỗ lực phần mềm
Dựa vào mô hình toán học: SLIM, COCOMO, SEER
Dựa vào kiến thức chuyên gia và tập luật
Các kỹ thuật học và suy luận
Dựa trên tính động của dự án
Dựa trên hồi quy
Hỗn hợp
Hình 2. Phân loại các kỹ thuật ước lượng nỗ lực phát triển phần mềm

Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

4

2.3. Các phương pháp ước lượng nỗ lực dựa trên phương tình toán học
2.3.1. Mô hình ước lượng giá cấu thành COCOMO
2.3.1.1. Các phương thức phát triển phần mềm trong mô hình COCOMO
COCOMO phân biệt ba phương thức phát triển dự án phần mềm là organic, semidetached và embedded.
-

Trong phương thức organic, những dự án tương đối nhỏ và đơn giản được phát
triển bởi những đội nhỏ trong những môi trường quen thuộc với những yêu cầu
không quá cứng nhắc và có thể linh động thay đổi, do đó việc phát triển có thể
được hỗ trợ bởi các dự án đã phát triển trước đó.

-

semi-detached: cho những dự án có mức độ trung bình về kích cỡ và độ phức
tạp được phát triển bởi đội phát triển có trình độ khác nhau với những ràng
buộc mạnh mẽ hơn so với organic. Tuy nhiên vẫn có một số linh động, tức là dự
án vẫn có thể được hỗ trợ từ những dự án đã làm trước đây nhưng ở mức độ ít

-

embedded: cho những dự án có những ràng buộc chặt chẽ về phần cứng, phần
mềm, và thi hành, … Dự án phải được phát triển từ đầu và không được sự hỗ
trợ từ dữ liệu của các dự án trong quá khứ.

2.3.1.2. Mô hình COCOMO cơ sở
2.3.1.3. Mô hình COCOMO trung cấp
2.3.1.4. Mô hình COCOMO nâng cao
2.3.1.5. Mô hình COCOMO II
Khi công nghệ phần mềm thay đổi, Boehm tiếp tục phát triển mô hình COCOMO và
COCOMO II ra đời. COCOMO II cho phép sử dụng số dòng mã và điểm chức năng như
các tham số tham chiếu để tính toán kích thước của dự án. Có ba biến thể của mô hình
COCOMO II là Applications Composition, Early Design và Post Architecture.
Đề tài này tập trung vào mô hình COCOMO II. Các bước ước lượng nỗ lực sử dụng
mô hình COCOMO II gồm có:
1. Xác định kích thước dự án qua tổng điểm chức năng của tất cả các thành phần và
quy đổi sang nghìn dòng lệnh (KLOC) ứng với ngôn ngữ triển khai: Size
2. Xác định các yếu tố điều chỉnh chi phí của mô hình COCOMO II: EM
Có 17 yếu tố liên quan đến việc điều chỉnh chi phí của dự án sử dụng mô hình
COCOMO II như được cho trong Bảng 1. EM được xác định là tích các điểm số của 17
nhân tố này.
Bảng 1. Các yếu tố hiệu chính chi phí của mô hình COCOMO II
Các yếu tố

Rất thấp

Thấp

Mức ảnh hưởng
Bình thường Cao

Rất cao

Đặc biệt cao

Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm
Sản phẩm
Độ ổn định
của
phần
mềm
(RELY)
Kích thước
của cơ sở dữ
liệu
ứng
dụng
(DATA)
Độ phức tạp
của sản phẩm
(CPLX)
Khả năng sử
dụng

lại(RUSE)

Sự phù hợp
của tài liệu
với các nhu
cầu vòng đời
sản
phẩm
(DOCU)
Phần cứng
Ràng buộc
hiệu
năng
thời
gian
thực (TIME)

Ràng buộc
bộ nhớ chính
(STOR)
Tính
biến
động
của
phần
cứng
(PVOL)

Nhân lực
Khả

năng
phân
tích
(ACAP)

Khả năng lập
trình (PCAP)

Sự thay thế
nhân
lực
trong dự án

Sự bất tiện
rất thấp

−
Rất thấp

Sự bất tiện
thấp, những
khuyết tật dễ
sửa chữa
Kích thước
cơ sở dữ liệu
/ số dòng
lệnh < 10
Thấp

Không

dụng lại

sử

−

Nhiều
nhu
cầu về vòng
đời sản phẩm
không được
mô tả

−

Một số nhu
cầu về vòng
đời sản phẩm
không được
mô tả

−

−

−

−

Tối thiểu mỗi

tháng phần
cứng có thay
đổi nhỏ và
tối thiểu 12
tháng có thay
đổi lớn

15% thành
viên
trong
đội dự án có
kinh nghiệm
phân tích và
thiết kế
15% thành
viên
trong
đội dự án có
kinh nghiệm
lập trình
Thay
48%
nhân
lực
trong đội dự

35% thành
viên
trong
đội dự án có

kinh nghiệm
phân tích và
thiết kế
35% thành
viên
trong
đội dự án có
kinh nghiệm
lập trình
Thay
24%
nhân
lực
trong đội dự

5

Sự bất tiện
trung bình,
những khuyết
tật dễ sửa
chữa
10 đến dưới
100

Có khả năng
gây tổn thất
lớn

Sự tổn thất

và các nguy
cơ rủi ro rất
cao

Từ 100 đến
dưới 1000

Từ 1000 trở
lên

Bình thường

Cao

Rất cao

Đặc biệt cao

Sử dụng như
một
thành
phần trong
một
ứng
dụng độc lập
khác
Nhu cầu về
vòng đời sản
phẩm được
yêu cầu với

kích
thước
hợp lý

Sử dụng cho
nhiều dự án
của một công
ty

Sử dụng lại
cho
nhiều
công ty

Sử dụng lại
cho nhiều sản
phẩm thương
mại
của
nhiều công ty

Nhu cầu về
vòng đời sản
phẩm lớn

Nhu cầu về
vòng đời sản
phẩm rất lớn

Phần

mềm
chiếm dưới
50%
thời
gian thực thi
sẵn có mà
phần
cứng
cung cấp
Phần mềm sử
dụng
dưới
50% bộ nhớ
sẵn có
Cứ 2 tuần
phần cứng có
thay đổi nhỏ
và sau 6
tháng có thay
đổi lớn

Phần
mềm
chiếm
khoảng 70%
thời
gian
thực thi sẵn
có mà phần
cứng

cung
cấp
Phần mềm sử
dụng khoảng
70% bộ nhớ
sẵn có
Cứ 1 tuần
phần cứng có
thay đổi nhỏ
và sau 2
tháng có thay
đổi lớn

Phần
mềm
chiếm
khoảng 85%
thời
gian
thực thi sẵn
có mà phần
cứng
cung
cấp
Phần mềm sử
dụng khoảng
85% bộ nhớ
sẵn có
Cứ 2 ngày
phần cứng có

thay đổi nhỏ
và sau 2 tuần
có thay đổi
lớn

55% thành
viên
trong
đội dự án có
kinh nghiệm
phân tích và
thiết kế
55% thành
viên
trong
đội dự án có
kinh nghiệm
lập trình
Thay
12%
nhân
lực
trong đội dự

75% thành
viên
trong
đội dự án có
kinh nghiệm
phân tích và

thiết kế
75% thành
viên
trong
đội dự án có
kinh nghiệm
lập trình
Thay
6%
nhân
lực
trong đội dự

90% thành
viên
trong
đội dự án có
kinh nghiệm
phân tích và
thiết kế
90% thành
viên
trong
đội dự án có
kinh nghiệm
lập trình
Thay
3%
nhân
lực

trong đội dự

−

−

−

Phần
mềm
chiếm
khoảng 95%
thời
gian
thực thi sẵn
có mà phần
cứng
cung
cấp
Phần mềm sử
dụng khoảng
95% bộ nhớ
sẵn có

−

−

−

−

Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm
(PCON)
Kinh nghiệm
xây
dựng
ứng
dụng
(APEX)

án mỗi năm
Kinh nghiệm
phát
triển
ứng
dụng
tương tự của
đội dự án
dưới 2 tháng

Kinh nghiệm
sử dụng phần
cứng (PLEX)

Kinh nghiệm
sử dụng phần
cứng mà dự
án yêu cầu

dưới 2 tháng

Kinh nghiệm
về ngôn ngữ
lập trình và
công
cụ
(LTEX)

Kinh nghiệm
sử dụng ngôn
ngữ lập trình
mà dự án yêu
cầu dưới 2
tháng

Dự án
Sử dụng các
công cụ phần
mềm có sẵn
(TOOL)

Sự cộng tác
để phát triển
dự án ở nhiều
vị trí khác
nhau (SITE)
Yêu cầu đối
với lịch trình
phát triển dự

án (SCED)

6

án mỗi năm
Kinh nghiệm
phát
triển
ứng
dụng
tương tự của
đội dự án
khoảng
6
tháng
Kinh nghiệm
sử dụng phần
cứng mà dự
án yêu cầu
khoảng
6
tháng
Kinh nghiệm
sử dụng ngôn
ngữ lập trình
mà dự án yêu
cầu khoảng 6
tháng

án mỗi năm

Kinh nghiệm
phát
triển
ứng
dụng
tương tự của
đội dự án
khoảng
1
năm
Kinh nghiệm
sử dụng phần
cứng mà dự
án yêu cầu
khoảng
1
năm
Kinh nghiệm
sử dụng ngôn
ngữ lập trình
mà dự án yêu
cầu khoảng 1
năm

án mỗi năm
Kinh nghiệm
phát
triển
ứng
dụng

tương tự của
đội dự án
khoảng
3
năm
Kinh nghiệm
sử dụng phần
cứng mà dự
án yêu cầu
khoảng
3
năm
Kinh nghiệm
sử dụng ngôn
ngữ lập trình
mà dự án yêu
cầu khoảng 3
năm

án mỗi năm
Kinh nghiệm
phát
triển
ứng
dụng
tương tự của
đội dự án
khoảng
6
năm

Kinh nghiệm
sử dụng phần
cứng mà dự
án yêu cầu
khoảng
6
năm
Kinh nghiệm
sử dụng ngôn
ngữ lập trình
mà dự án yêu
cầu khoảng 6
năm

Sử
dụng
thêm
các
công cụ tích
hợp quy mô
nhỏ, công cụ
hỗ
trợ
backend,
frontend đơn
giản

Sử
dụng
thêm

các
công cụ tích
hợp quy mô
trung bình,
công cụ quản
lý vòng đời
sản phẩm cơ
bản

Sử
dụng
thêm
các
công cụ tích
hợp quy mô
trung bình,
công cụ quản
lý vòng đời
sản phẩm bền
vững, đa tính
năng

Cộng
tác
tồn cầu

Cộng
tác
nhiều cơng ty
và

nhiều
thành phớ

Cộng
tác
nhiều cơng ty
hoặc nhiều
thành phớ

Cộng
tác
trong cùng
khu
vực
thành phố

Sử dụng các
công cụ tích
hợp quy mô
lớn,
với
nhiều
quy
trình, phương
pháp, tái sử
dụng, công
cụ quản lý
vòng đời sản
phẩm
tích

cực,
bền
vững, đa tính
năng
Cộng
tác
trong cùng
tòa nhà

Chỉ đạt 75%
tốc độ so với
mức yêu cầu
của lịch trình
phát triển

Chỉ đạt 85%
tốc độ so với
mức yêu cầu
của lịch trình
phát triển

Đạt 100% tốc
độ so với
mức yêu cầu
của lịch trình
phát triển

Đạt 130% tốc
độ so với
mức yêu cầu

của lịch trình
phát triển

Chỉ sử dụng
các công cụ
sử đổi, viết
mã và gỡ lỗi

−

−

−

−

Cộng
tác
trong chính
đội phát triển
ở nơi làm
việc

Đạt 160% tốc
độ so với
mức yêu cầu
của lịch trình
phát triển

−

Điểm của mỗi thành phần được cho trong Bảng 2.
Bảng 2. Thang điểm các yếu tố hiệu chỉnh chi phí mô hình COCOMO II

Các yếu tố

Ký hiệu

Rất thấp

Thấp

Bình thường

Rất cao

Cực kỳ cao

RELY

EM1

0.82

0.92

1.00

1.10

1.26

−

DATA

EM2

−

0.90

1.00

1.14

1.28

−

CPLX

EM3

0.73

0.87

1.00

1.17

1.34

1.74

RUSE

EM4

−

0.95

1.00

1.07

1.15

1.24

DOCU

EM5

0.81

0.91

1.00

1.11

1.23

−

Cao

Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

7

TIME

EM6

−

−

1.00

1.11

1.29

1.63

STOR

EM7

−

−

1.00

1.05

1.17

1.46

PVOL

EM8

−

0.87

1.00

1.15

1.30

−

ACAP

EM9

1.42

1.19

1.00

0.85

0.71

−

PCAP

EM10

1.34

1.15

1.00

0.88

0.76

−

PCON

EM11

1.29

1.12

1.00

0.90

0.81

−

APEX

EM12

1.22

1.10

1.00

0.88

0.81

−

PLEX

EM13

1.19

1.09

1.00

0.91

0.85

−

LTEX

EM14

1.20

1.09

1.00

0.91

0.84

−

TOOL

EM15

1.17

1.09

1.00

0.90

0.78

−

SITE

EM16

1.22

1.09

1.00

0.93

0.86

0.80

SCED

EM17

1.43

1.14

1.00

1.00

1.00

−

3. Tính điểm các nhân tố ảnh hưởng đến quy mô của dự án: SF
Có năm nhân tố chính ảnh hưởng đến quy mơ dự án:
• Tính tương tự với dự án đã phát triển (PREC)

• Tính linh hoạt trong phát triển (FLEX)
• Mức độ tỉ mỉ trong thiết kế và kế hoạch dự trù rủi ro (RESL)
• Tính gắn kết trong đội ngũ phát triển (TEAM)
• Năng lực sản xuất của doanh nghiệp phầm mềm (PMAT)
Điểm của mỗi nhân tố ảnh hưởng đến quy mô dự án được cho trong Bảng 3. Giá trị SF
là tích điểm số của cả năm nhân tố này.
Bảng 3. Thang điểm các nhân tố ảnh hưởng đến quy mô dự án

Nhân tố

Ký hiệu

Rất thấp

Thấp

Bình thường

Cao

Rất cao

Đặc biệt cao

PREC

SF1

6.20

4.96

3.72

2.48

1.24

0.00

FLEX

SF2

5.07

4.05

3.04

2.03

1.01

0.00

RESL

SF3

7.07

5.65

4.24

2.83

1.41

0.00

TEAM

SF4

5.48

4.38

3.29

2.19

1.10

0.00

PMAT

SF5

7.80

6.24

4.68

3.12

1.56

0.00

4. Tính tốn nỡ lực và thời gian hồn thành của dự án:
- Nỡ lực được tính theo đơn vị người-tháng theo công thức sau:
Eff = A  SizeB + 0.01  SF  EM
Thời gian phát triển được tính theo đơn vị tháng theo công thức sau:

Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

8

TDEV = C  EffD + 0.002  SF
trong đó: A = 2.94, B = 0.91, C = 3.67 và D = 0.28
- Từ đó tính được số người trung trình mà đội phát triển cần:
NumPeople = Eff / TDEV
Mặc dù COCOMO II là một mô hình ước lượng nỗ lực hiệu quả nhưng những hệ số
trong công thức ước lượng Eff và TDEV được trình bày ở trên được suy ra từ một số dự

án sử dụng phương pháp hồi quy nên chúng vẫn chưa được tối ưu. Do đó, đề tài này
hướng đến sử dụng các thuật toán lấy cảm hứng từ tự nhiên để tối ưu bốn tham số A, B,
C và D trong phương trình ước lượng này.
2.3.2. Phương pháp điểm chức năng
Các bước ước lượng nỗ lực sử dụng mô hình điểm chức năng như sau:
1. Xác định số lượng điểm chức năng thô: UFPs
UFP = tổng điểm số của độ phức tạp
2. Đánh giá độ phức tạp của kỹ thuật của hệ thống: TCF
Tính độ phức tạp kỹ thuật theo công thức:
TCF = 0.65 + 0.01 (tổng điểm của 14 yếu tố kỹ thuật)
3. Tính tổng điểm chức năng cuối cùng:
FPs = UFPs  TCF
2.3.3. Kết hợp COCOMO II và điểm chức năng để ước lượng nỗ lực
2.4. Phương pháp ước lượng nỗ lực cho quy trình phần mềm Agile
2.4.1. Quy trình phát triển phần mềm Agile
2.4.1.1. Các nguyên tắc của quy trình Agile
2.4.1.2. Các đặc trưng của quy trình Agile
2.4.2. Phương pháp ước lượng nỗ lực phát triển phần mềm sử dụng quy trình Agile
Trong nghiên cứu này chúng tôi sử dụng các nhân tố của một mô hình ước lượng nỗ
lực và thời gian phát triển cho một dự án phần mềm sử dụng quy trình Agile được đề xuất
bởi Zia và các cộng sự. Tuy nhiên pháp sử dụng hồi quy tuyến tính để ước lượng nỗ lực
từ các yếu tố ảnh hưởng đến thời gian sản xuất phần mềm trong mô hình này vẫn chưa
cho ra kết quả tối ưu. Vì vậy, nghiên cứu này chúng tôi sẽ đề xuất một công thức để ước
lượng nỗ lực phát triển phần mềm sử dụng quy trình Agile dựa trên các yếu tố đầu vào.
Những nội dung này sẽ được trình bày trong chương 3. Trong phần này chúng tôi giới
thiệu các yếu tố ảnh hưởng và các bước thực hiện ước lượng sử dụng mô hình ước lượng
nỗ lực được Zia đề xuất.

Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

9

2.4.2.1. Các yếu tố đầu vào của mô hình ước lượng
Để phục vụ cho quá trình ước lượng nỗ lực cho một sản phẩm phần mềm phát triển
theo mô hình Agile cần phải có các yếu tố sau:
-

Các user stories của dự án.

-

Với mỗi user story cần phải xác định điểm chức năng của nó. Để xác định điểm chức
năng của mỗi user story cần phải xác định được kích thước của user story và độ phức
tạp của nó.

-

Xác định vận tốc thực hiện của nhóm phát triển sản phẩm:
o Xác định vận tốc cơ sở của nhóm phát triển bằng cách tính trung bình có bao
nhiêu product backlog (hiểu đơn giản là chức năng được yêu cầu hay user story)
đã hoàn thành trong một khoảng thời gian xác định (Sprint) cho các dự án
tương tự trước đó. Nếu chưa có vận tốc này thì lấy giá trị trung bình của tất cả
dự án mà cách thành viên trong nhóm đã phát triển.
o Xác định tính chất các nhân tố thường xuyên xuất hiện làm ảnh hưởng đến tốc
độ phát triển của toàn nhóm phát triển: thành phần của nhóm phát triển (đã chọn
đúng người với các kỹ năng phù hợp cần cho dự án hay chưa), quy trình phát
triển sản phẩm, các nhân tố ảnh hưởng đến môi trường làm việc của nhóm, tính
gắn kết của nhóm phát triển.
o Xác định tính chất các nhân tố ảnh hưởng đến năng suất của mỗi thành viên

trong nhóm phát triển: thay đổi thành viên trong nhóm (thêm, bớt thành viên,
thay đổi vai trò và trách nhiệm của các thành viên), yêu cầu phải nghiên cứu và
sử dụng công cụ mới cho dự án, các lỗi trong phần mềm của bên thứ ba, các
thành viên trong nhóm phải đảm nhận nhiều dự án cùng lúc, các vấn đề cá nhân
của các thành viên trong nhóm, phản hồi từ khách hàng cho các thắc mắc của
nhóm phát triển, tính nhập nhằng trong yêu cầu của dự án, sự thay đổi trong đặc
tả yêu cầu của sản phẩm, thay đổi nơi làm việc của nhóm phát triển.
o Xác định vận tốc cuối cùng của nhóm phát triển dưới sự ảnh hưởng của các
nhân tớ trên.

-

Xác định lương trung bình hàng tháng cho tồn nhóm phát triển

-

Xác định các chi phí bên ngoài lương của nhóm phát triển. Tính tỉ lệ của nó so với
chi phí dành cho trả lương hàng tháng cho nhóm phát triển

-

Tính tốn thời gian và chi phí cho tồn dự án
o Dự đoán thời gian phát triển từ vận tốc và story point (đơn vị ngày): T
o Xác định mức độ tin cậy đối với các ước lượng của các nhân tố theo đơn vị
phần trăm: CL
o Từ đó min và max cho thời gian phát triển được tính như sau:

Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

𝑚𝑖𝑛 = [1 −

(100 − 𝐶𝐿)
]×𝑇
100

𝑚𝑎𝑥 = [1 +

(100 − 𝐶𝐿)
]×𝑇
100

10

o Xác định sớ ngày làm việc trung bình trong một tháng của nhóm phát triển để
quy đổi thời gian sang tháng. Từ đó tính chi phí cho toàn dự án dựa trên thời
gian phát triển, lương trung bình hàng tháng và hệ số từ lương và các nhân tớ
ngồi lương theo cơng thức:
Cost = hệ sớ  Lương hàng tháng  Số tháng
o Xác định min và max cho chi phí theo công thức sau:
𝑚𝑖𝑛 = [1 −

(100 − 𝐶𝐿)
] × 𝐶𝑜𝑠𝑡
100

𝑚𝑎𝑥 = [1 +

(100 − 𝐶𝐿)
] × 𝐶𝑜𝑠𝑡

100

hệ số = 1 + tỉ trọng các yếu tố ngoài lương.

2.4.2.2. Xác định story point cho dự án
-

Xác định điểm quy mô cho mỗi user story của dự án sử dụng Bảng 4.
Bảng 4. Điểm quy mô cho các user story

Mô tả

Giá trị

5

4
3
2
1

-

Kích thước story cực kỳ lớn
Quá lớn để ước lượng chính xác
Có thể cần đến vài tháng để hoàn thành
Cần phải chia nhỏ thành các story nhỏ hơn
Có thể hình thành cả dự án mới từ story này
Kích thước story rất lớn
Yêu cầu phát triển trong thời gian dài, có thể hơn một tuần làm việc

Nên chia thành các story nhỏ hơn
Kích thước story vừa phải
Cần từ 2 đến 5 ngày để hoàn thành
Cần 1 đến 2 ngày để hoàn thành
Kích thước story nhỏ
Chỉ cần một vài giờ để hoàn thành

-

Xác định điểm độ phức tạp cho mỗi user story.

-

Xác định story point của mỗi user story theo công thức:
ES = Độ phức tạp  Kích thước

Để tính tổng điểm story point SP của cả dự án thì lấy tổng điểm của tất cả story cần
phải thực hiện cho toàn dự án.

Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

11

2.4.2.3. Xác định vận tốc của nhóm phát triển
Vận tớc ći cùng của nhóm phát triển được tính tốn dựa vào cơng thức (16).
𝑉 = 𝑉𝑖𝐹𝑅×𝐷𝐹

(16)

Với FR là giá trị hệ số giảm tốc thường xuyên, DF là giá trị độ lớn của yếu tố biến động.
2.4.2.4. Xác định thời gian và chi phí dự án
Từ hai yếu tố đầu vào là story point của toàn bộ dự án và vận tốc của đội ngũ phát
triển, Zia và các cộng sự đã sử dụng mô hình hồi quy tuyến tính cùng với những dữ liệu
của các dự án lịch sử để tính toán ra thời gian phát triển T của toàn bộ dự án. Sau khi đã
có được thời gian chúng ta có thể xác định được cận dưới và cận trên cần thiết cho dự án.
Cũng như có thể tính toán được chi phí phát triển áp dụng các công thức và các yếu tố đã
trình bày trong phần 2.4.2.1.

Chương 3: Cài đặt, thử nghiệm và đánh giá kết quả

12

Chương 3. CÀI ĐẶT, THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ
Chương này trình bày các kết quả phân tích và thiết kế chương trình ước lượng nỗ lực
phát triển phần mềm, cũng như ứng dụng của các tḥt tốn tới ưu đã trình bày ở chương
1 vào các mô hình ước lượng nỗ lực phần mềm cụ thể bao gồm các mô hình truyền thống
và một phương trình ước lượng nỗ lực mới do chúng tôi đề xuất cho các dự án sử dụng
quy trình Agile. Các kết quả thu được minh chứng cho tính hiệu quả của vệc áp dụng các
tḥt tốn tới ưu để nâng cao tính chính xác của kết quả ước lượng. Trong chương này
chúng tôi cũng trình bày về các bước phân tích và thiết kế cho công cụ phần mềm mà
chúng tôi đã xây dựng.
3.1. Đặt vấn đề
Trong các mô hình ước lượng nỗ lực truyền thống thì các mô hình dựa trên phương
trình tốn học nỡi lên như một trong những phương pháp ước lượng hiệu quả dựa trên tập
dữ liệu của các dự án lịch sử và COCOMO II là một trong những mô hình như vậy. Tuy
nhiên mô hình này vẫn có các yếu điểm là nó dựa trên bốn hằng số cố định A= 2.94,
B = 0.91, C = 3.67 và D = 0.28 cho các công thức ước lượng. Các hằng số này được suy
luận ra từ một tập của 93 dự án đã triển khai của NASA và không thay đổi khi áp dụng

vào các dự án mới. Đây là một nhược điểm lớn của mô hình này. Trong nghiên cứu này
chúng tôi hướng đến việc cải tiến mơ hình này bằng cách sử dụng một tḥt tốn kết hợp
giữa ABC và dạy học để tối ưu các tham số của mô hình trên tập dữ liệu dự án lịch sử.
Tất nhiên quy trình tối ưu để tìm ra các tham số này có thể được thực hiện liên tục khi tập
dữ liệu lịch sử bị thay đổi bằng cách thêm vào nhiều dự án mới. Khi đó chỉ cần thực hiện
thuật toán thì nó sẽ cho ra một bộ giá trị tham số tối ưu mới.
Để ứng phó với tính hay thay đổi trong yêu cầu phần mềm, các phương pháp phát triển
phần mềm linh hoạt Agile được sử dụng vì những ưu điểm vượt trội của nó như tính lặp
và gia tăng, thời gian chuyển giao nhanh, giảm thiểu rủi ro, và cho phép các tổ chức thích
ứng nhanh với những thay đổi yêu cầu trong quá trình phát triển. Từ đó làm phát sinh vấn
đề làm thế nào để ước lượng nỗ lực cho các dự án sử dụng quy trình phát triển mới này.
Số dòng mã nguồn trong phần mềm là nhân tố chính được sử dụng cho các mô hình
truyền thống nhưng trong Agile thì lại sử dụng các user story làm nhân tố chính. Bởi vậy,
điểm chức năng story point trở thành một phép đo để xác định kích thước của dự án cũng
như độ khó mỗi mỗi chức năng trong đặc tả u cầu. Ngồi story point thì vận tớc của
nhóm phát triển dự án cũng là một yếu tố ảnh hưởng đến nỗ lực. Dựa vào story point và
vận tốc chúng ta có thể tạo một công thức để ước lượng nỗ lực cho một dự án phần mềm
sử dụng quy trình Agile. Nghiên cứu này tập trung vào việc đề xuất một công thức ước
lượng như vậy và các tham số trong công thức sẽ được tối ưu bằng cách sử dụng một
tḥt tốn lai giữa tới ưu bầy đàn và đàn ong nhân tạo. Hiệu quả của các phương pháp đề
xuất sẽ được trình bày trong chương này.

Chương 3: Cài đặt, thử nghiệm và đánh giá kết quả

13

3.2. Các tiêu chuẩn đánh giá kết quả ước lượng nỗ lực
-

Độ lớn trung bình của lỗi tương đối (Mean Magnitude of Relative Error –
MMRE)

-

Độ lớn trung vị của lỗi tương đối (Median Magnitude of Relative Error –
MdMRE)

-

Độ chính xác ở mức N (PRED(N))
1

𝑀𝑀𝑅𝐸 = × ∑𝐿𝑖=1 𝑀𝑅𝐸𝑖

(17)

𝐿

trong đó L là tổng số dựa án, i là chỉ số của một dự án trong tập L dự án và MRE là độ
lớn của lỗi tương đối được diễn tả như công thức (18).
|𝐴𝑖 −𝑃𝑖 |

𝑀𝑅𝐸𝑖 =

(18)

𝐴𝑖

với Ai và Pi lần lượt là giá trị nỗ lực thực sự và giá trị nỡ lực được dự đốn của dữ liệu

thứ i trong tập dữ liệu dự án sử dụng một mô hình ước lượng nào đó.
𝑃𝑅𝐸𝐷 (𝑁) =

100
𝐿

×

∑𝐿𝑖=1 {

𝑁

1

nếu 𝑀𝑅𝐸𝑖 ≤

0

nếu ngược lai

100

(19)

Hệ số tương quan bình phương (R2) được tính tốn như cơng thức (20) cũng là một
phép đo tính tốt của mô hình ước lượng phần mềm. Giá trị của R2 càng cao thì kết quả
ước lượng càng chính xác.
2
∑𝐿
𝑖=1(𝐴𝑖 −𝑃𝑖 )

𝑅2 = 1 − ∑𝐿

𝑖=1(𝐴𝑖 −𝐴𝑚𝑒𝑎𝑛 )

2

(20)

ở đây Amean là giá trị trung bình của nỗ lực thực sự.
Shepperd và MacDonell đã đề xuất một phép đo gọi là số dư tuyệt đối trung bình
(mean absolute residual – MAR) như được cho trong công thức (21).
𝑀𝐴𝑅 =

∑L
i=1 |𝐴𝑖 −𝑃𝑖 |
𝐿

(21)

3.3. Tối ưu tham số mô hình COCOMO bằng thuật toán TLABC
3.3.1. Hàm thích nghi
Để đánh giá chất lượng của mỗi nguồn thức ăn (lời giải) tìm được chúng ta cần sử có
một hàm thích nghi. Trong phần này chúng tơi sẽ áp dụng tḥt tốn lai giữa tḥt toán
đàn ong nhân tạo và thuật toán dạy học để tối ưu bốn giá trị tham số A, B, C, và D của
mô hình ước lượng COCOMO II. Từ các công thức ước lượng nỗ lực của mô hình
COCOMO II, chúng ta nhận thấy hai tham số A và B nằm trong công thức liên quan đến
nỗ lực, hai tham số còn lại nằm trong công thức liên quan đến giá trị thời gian có mối liên
hệ với nỗ lực. Vì vậy, chúng tôi xây dựng một hàm thích nghi như công thức (22) là sự
kết hợp của cả nỗ lực và thời gian để đánh giá tính tốt của mỗi lời giải thu được (bộ 4

tham số A, B, C và D) trong quá trình tìm kiếm lời giải.

Chương 3: Cài đặt, thử nghiệm và đánh giá kết quả

𝑓=

100
𝐿

× ∑𝐿𝑖=1[

14

|𝐴𝐸𝑖 −𝑃𝐸𝑖 |
𝐴𝐸𝑖

+

|𝐴𝑇𝑖 −𝑃𝑇𝑖 |
𝐴𝑇𝑖

]

(22)

trong đó: L là tởng số dự án được sử dụng trong tập huấn luyện, AEi và PEi lần lượt là giá
trị nỗ lực thực sự và giá trị nỗ lực được ước lượng của dự án thứ i trong tập huấn luyện,
ATi và PTi lần lượt là giá trị thời gian thực sự và giá trị thời gian được ước lượng của dự
án thứ i.

3.3.2. Kết quả thực nghiệm
Bảng 5. Kết quả ước lượng nỗ lực sử dụng thuật toán ABC, TLABC, COCOMO II

Tiêu chí
đánh giá
MMRE
PRED(10)
PRED(20)
PRED(30)
PRED(40)

Nỗ lực
ABC
(%)

TLABC
(%)

21.68
42.86
62.29
75.00
82.14

Thời gian
COCOMO II
(%)

21.57
42.86

64.29
78.57
82.14

27.50
17.86
50.00
67.86
82.14

ABC
(%)

8.66
64.29
96.43
99.10
100

TLABC
(%)

8.29
71.43
96.43
100
100

COCOMO II
(%)

14.71
17.86
50.00
67.86
82.14

Từ Bảng 5. chúng ta nhận thấy rằng kết quả ước lượng nỗ lực của mô hình COCOMO
II với các tham số đã được tối ưu tốt hơn nhiều so với mô hình ban đầu về cả độ chính
xác của nỗ lực và thời gian. Cụ thể, giá trị MMRE đã giảm khoảng 6% khi các tham số
của mô hình được tối ưu bởi thuật toán ABC và TLABC. Chúng ta cũng thấy rằng kết
quả sử dụng tḥt tốn TLABC là tớt hơn kết quả của ABC. Điều này được nhận thấy rõ
nhất trên tiêu chí đánh giá PRED(10) đối với thời gian.
3.4. Phương trình toán học mới cho bài toán ước lượng nỗ lực phát triển cho các
phần mềm sử dụng quy trình Agile
3.4.1. Phương trình tốn học đề x́t
Dựa vào hai ́u tớ đầu vào đặc trưng của các phần mềm sử dụng quy trình Agile là
vận tốc của nhóm phát triển và tổng điểm story point, chúng tôi đề xuất một công thức để
ước lượng nỗ lực cho các phần mềm này như (23).
𝐸𝑓𝑓 =

𝐴×𝑆𝑃
𝐵×𝑉

+ 𝐶 × ln(𝑆𝑃 ) + 𝐷 × ln(𝑉 ) + 𝐸

(23)

trong đó: Eff giá trị nỗ lực được ước lượng trong đơn vị ngày, SP là giá trị của tổng điểm
story point, và V là vận tốc sau hiệu chỉnh của nhóm phát triển.

Mục đích của chúng tôi là xác định các giá trị A, B, C, D và E để cho kết quả ước
lượng gần nhất với kết quả nỗ lực thực tế. Dựa vào tập dữ liệu h́n luyện và các tḥt
tốn tới ưu, chúng ta có thể xác định được các giá trị cho các tham số này. Sau khi đã có
giá trị cho bộ tham số, với một dự án mới, chúng ta chỉ cần nhập Story point và vận tốc
vào công thức (23) sẽ có được kết quả ước lượng.
3.4.2. Tìm tham số tối ưu cho công thức ước lượng Agile sử dụng thuật toán ABC-PSO

Chương 3: Ứng dụng các thuật toán tối ưu vào bài toán ước lượng nỗ lực phát triển phần mềm 15

3.4.2.1. Biểu diễn cá thể của thuật toán và hàm thích nghi
Trong nghiên cứu này, mỗi cá thể được sử dụng trong thuật toán được biểu diễn như
sau: Xi = {Ai, Bi, Ci, Di, Ei}.
Sau khi thuật toán kết thúc nó sẽ trả về cá thể tốt nhất chứa các tham số mà kết quả
ước lượng của công thức (23) gần nhất với nỗ lực thực tế trên tập dữ liệu huấn luyện. Để
đánh giá tính tốt của mỗi cá thể trong śt q trình thực thi tḥt tốn, chúng ta sử dụng
hàm thích nghi như công thức (24).
𝑓 (𝑋𝑖 ) = 𝑀𝑀𝑅𝐸 (𝑋𝑖 ) + 𝑀𝐴𝑅(𝑋𝑖 )

(24)

trong đó: MMRE(Xi) và MAR(Xi) lần lượt là độ lớn trung bình của lỗi tương đối và số dư
tuyệt đối trung bình của cá thể Xi trên L dự án trong tập huấn luyện. Trong nghiên cứu
này chúng ta sẽ sử dụng 21 dự án Agile trong nghiên cứu của Zia [31] để đánh giá tính
hiệu quả của phương pháp đề xuất.
3.4.2.2. Kết quả thực nghiệm
Bảng 6. Kết quả ước lượng của các thuật toán tối ưu trên các tiêu chí đánh giá

MMRE (%)

MdMRE (%)

PRED(8) (%)

R2

MAR

ABC-PSO

5.69

3.33

66.67

0.9734

3.12

ABC

5.84

5.18

61.9

0.9732

3.15

PSO

6.69

7.14

61.9

0.9626

3.66

Hời quy của Zia

7.19

7.14

57.14

0.9638

4

Tḥt toán

3.5. Phân tích chức năng của chương trình
Dựa trên những kết quả lý thuyết đã đạt được, chúng tôi tiến hành xây dựng một phần

mềm hỗ trợ ước lượng nỗ lực cho các dự án phần mềm sử dụng quy trình truyền thống
CoCoMo và quy trình Agile. Chương trình xây dựng có các chức năng cơ bản sau:
+ Xem thông tin các dự án gồm cả CoCoMo và Agile, dự án đang triển khai và các dự
án đã kết thúc.
+ Tìm kiếm một dự án mới sử dụng các tiêu chí lọc kết quả khác nhau.
+ Tạo mới dự án, thay đổi thông tin dự án hoặc xóa các dự án khỏi cơ sở dữ liệu.
+ Ước lượng nỗ lực cần có của dự án dựa trên các yếu tố đầu vào.
+ Thiết lập cấu hình tham số cho các mô hình ước lượng nỗ lực một cách thủ công.
+ Tối ưu tự động các tham số của mô hình ước lượng.Thiết kế chương trình

Chương 3: Cài đặt, thử nghiệm và đánh giá kết quả

3.5.1. Biểu đồ ca sử dụng (Use case)

Hình 3. Biểu đồ Ca sử dụng (Use case)

16

Chương 3: Cài đặt, thử nghiệm và đánh giá kết quả

3.5.2. Biểu đồ tuần tự và hoạt động

Hình 4. Biểu đồ phân rã chức năng xem dự án

Hình 5. Biểu đồ tuần tự của chức năng ước lượng dự án

17

Báo cáo tóm tắt đề tài khoa học và công nghệ: Nghiên cứu một số thuật toán lấy cảm hứng từ tự nhiên và ứng dụng vào bài toán tối ưu nỗ lực, chi phí phát triển phần mềm

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về