Tải bản đầy đủ (.pdf) (30 trang)

Báo cáo tóm tắt đề tài khoa học và công nghệ: Nghiên cứu một số thuật toán lấy cảm hứng từ tự nhiên và ứng dụng vào bài toán tối ưu nỗ lực, chi phí phát triển phần mềm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.23 MB, 30 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

BÁO CÁO TÓM TẮT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP ĐẠI HỌC ĐÀ NẴNG

NGHIÊN CỨU MỘT SỐ THUẬT TOÁN LẤY CẢM HỨNG
TỪ TỰ NHIÊN VÀ ỨNG DỤNG VÀO BÀI TỐN
TỐI ƯU NỠ LỰC, CHI PHÍ PHÁT TRIỂN PHẦN MỀM
Mã số: B2016-ĐN02-06

Chủ nhiệm đề tài: TS. Lê Thị Mỹ Hạnh
Thành viên : KS. Khuất Thanh Tùng
KS. Ngô Thành Phát

Đà nẵng, 5/2018


Mục lục

ii

MỤC LỤC
MỤC LỤC .................................................................................................................................. I
DANH SÁCH HÌNH VẼ ........................................................................................................ IV
DANH SÁCH BẢNG ............................................................................................................. IV
CHƯƠNG 1. CÁC THUẬT TOÁN TỐI ƯU LẤY CẢM HỨNG TỪ TỰ NHIÊN ............... 1
1.1. Giới thiệu vấn đề ....................................................................................................... 1
1.2. Tính phức tạp của bài tốn tới ưu .............................................................................. 1
1.3. Phân lớp các ng̀n cảm hứng từ tự nhiên để xây dựng tḥt tốn tới ưu ................ 1
1.4. Tởng quan về các tḥt tốn tới ưu từ tự nhiên ......................................................... 1


1.5. Giới thiệu chung về các thuật toán được sử dụng trong đề tài .................................. 1
1.6. Thuật toán đàn ong nhân tạo ..................................................................................... 2
1.7. Thuật toán dạy-học .................................................................................................... 2
1.8. Thuật toán đàn ong nhân tạo kết hợp dạy học ........................................................... 2
1.9. Tḥt tốn tới ưu bầy đàn .......................................................................................... 2
1.10. Thuật toán lai giữa đàn ong nhân tạo và tối ưu bầy đàn (ABC-PSO) ....................... 2
CHƯƠNG 2. BÀI TOÁN ƯỚC LƯỢNG NỖ LỰC PHÁT TRIỂN PHẦN MỀM .................. 3
2.1. Giới thiệu bài tốn ..................................................................................................... 3
2.2. Tởng quan về các kỹ thuật ước lượng nỗ lực phần mềm .......................................... 3
2.3. Các phương pháp ước lượng nỗ lực dựa trên phương tình tốn học ......................... 4
2.3.1.
Mơ hình ước lượng giá cấu thành COCOMO ............................................... 4
2.3.1.1. Các phương thức phát triển phần mềm trong mô hình COCOMO ......... 4
2.3.1.2. Mô hình COCOMO cơ sở ........................................................................ 4
2.3.1.3. Mô hình COCOMO trung cấp ................................................................. 4
2.3.1.4. Mô hình COCOMO nâng cao .................................................................. 4
2.3.1.5. Mô hình COCOMO II .............................................................................. 4
2.3.2.
Phương pháp điểm chức năng ....................................................................... 8
2.3.3.
Kết hợp COCOMO II và điểm chức năng để ước lượng nỗ lực ................... 8
2.4. Phương pháp ước lượng nỗ lực cho quy trình phần mềm Agile ............................... 8
2.4.1.
Quy trình phát triển phần mềm Agile............................................................ 8
2.4.1.1. Các nguyên tắc của quy trình Agile......................................................... 8
2.4.1.2. Các đặc trưng của quy trình Agile .......................................................... 8
2.4.2.
Phương pháp ước lượng nỗ lực phát triển phần mềm sử dụng quy trình Agile8
2.4.2.1. Các yếu tố đầu vào của mô hình ước lượng ............................................ 9
2.4.2.2. Xác định story point cho dự án .............................................................. 10

2.4.2.3. Xác định vận tốc của nhóm phát triển ................................................... 11
2.4.2.4. Xác định thời gian và chi phí dự án ...................................................... 11
CHƯƠNG 3. CÀI ĐẶT, THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ ................................. 12
3.1. Đặt vấn đề................................................................................................................ 12
3.2. Các tiêu chuẩn đánh giá kết quả ước lượng nỗ lực ................................................. 13
3.3. Tới ưu tham sớ mơ hình COCOMO bằng tḥt tốn TLABC ................................ 13
3.3.1.
Hàm thích nghi ............................................................................................ 13
3.3.2.
Kết quả thực nghiệm ................................................................................... 14
3.4. Phương trình toán học mới cho bài toán ước lượng nỗ lực phát triển cho các phần mềm
sử dụng quy trình Agile ...................................................................................................... 14
3.4.1.
Phương trình toán học đề xuất .................................................................... 14


Mục lục
iii
3.4.2.
Tìm tham số tối ưu cho công thức ước lượng Agile sử dụng thuật toán ABCPSO
..................................................................................................................... 14
3.4.2.1. Biểu diễn cá thể của thuật toán và hàm thích nghi ............................... 15
3.4.2.2. Kết quả thực nghiệm .............................................................................. 15
3.5. Phân tích chức năng của chương trình .................................................................... 15
3.6. Thiết kế chương trình .............................................................................................. 15
3.6.1.
Biểu đồ ca sử dụng (Use case) .................................................................... 16
3.6.2.
Biểu đồ tuần tự và hoạt động ...................................................................... 17
3.6.3.

Biểu đồ lớp .................................................................................................. 18
3.7. Một số hình ảnh của hệ thống ước lượng nỗ lực ..................................................... 19
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .............................................................................. 21


Danh sách hình vẽ và bảng

iv

DANH SÁCH HÌNH VẼ
Hình 1.
Hình 2.
Hình 3.
Hình 4.
Hình 5.
Hình 6.
Hình 7.
Hình 8.
Hình 9.
Hình 10.
Hình 11.

Phân loại các nguồn cảm hứng từ tự nhiên ....................................................... 1
Phân loại các kỹ thuật ước lượng nỗ lực phát triển phần mềm ......................... 3
Biểu đồ Ca sử dụng (Use case) ....................................................................... 16
Biểu đồ phân rã chức năng xem dự án ............................................................ 17
Biểu đồ tuần tự của chức năng ước lượng dự án ............................................. 17
Biểu đồ hoạt động của chức năng thiết lập tham số mô hình ước lượng ........ 18
Biểu đồ lớp của hệ thống ước lượng nỗ lực .................................................... 18
Giao diện chức năng chính của phần mềm ước lượng nỗ lực ......................... 19

Giao diện khi một dự án đã kết thúc ............................................................... 19
Giao diện chức năng tạo mới một dự án COCOMO ....................................... 20
Giao diện chức năng thiết lập cấu hình tham số.............................................. 20

DANH SÁCH BẢNG
Bảng 1.
Bảng 2.
Bảng 3.
Bảng 4.
Bảng 5.
Bảng 6.
Bảng 7.

Các yếu tố hiệu chính chi phí của mô hình COCOMO II ................................. 4
Thang điểm các yếu tố hiệu chỉnh chi phí mô hình COCOMO II .................... 6
Các nhân tố ảnh hưởng đến quy mô dự án ........................................................ 7
Thang điểm các nhân tố ảnh hưởng đến quy mô dự án..................................... 7
Điểm quy mô cho các user story ..................................................................... 10
Kết quả ước lượng nỗ lực sử dụng thuật toán ABC, TLABC, COCOMO II .. 14
Kết quả ước lượng của các tḥt tốn tới ưu trên các tiêu chí đánh giá.......... 15


Danh sách từ viết tắt

v

DANH SÁCH TỪ VIẾT TẮT
Từ viết tắt
ABC
ABC-PSO

CCNN
CoBRA
COCOMO
D
DF
EAF
Eff
ES
FP
FR
GMDHPNN
GRNN
KLOC
MAR
MdMRE
ME
MMRE
MRE
NE
NP
PNN
PSO
PRED(N)
SF
SP
TCF
TLBO
TLABC
UFP
Vi

V

Ý nghĩa
Artificial Bee Colony – Thuật toán đàn ong nhân tạo
Hybrid Artificial Bee Colony and Particle Swarm Optimization – Thuật tốn
lai giữa đàn ong nhân tạo và tới ưu bầy đàn
Cascade-Correlation Neural Networks – Mạng nơ-ron tương quan xếp tầng
Phương pháp ước lượng chi phí, chuẩn hóa và phân tích rủi ro
COnstructive COst MOdel – Mô hình ước lượng giá cấu thành
Sớ chiều của bài tốn
Hệ sớ giảm tớc của các yếu tố hay biến động trong dự án Agile
Effort adjustment factor – Yếu tố hiệu chỉnh nỗ lực
Effort – Nỗ lực
Điểm cho mỗi user story
Function Point – Điểm chức năng
Hệ số giảm vận tốc thường xuyên trong dự án Agile
Group Method of Data Handling Polynomial Neural Network – Mạng nơ-ron
với phương pháp nhóm xử lý dữ liệu tuyến tính
General Regression Neural Networks – Mạng nơ-ron hồi quy tổng quát
Ngàn dòng lệnh
Mean Absolute Residual – số dư tuyệt đối trung bình
Median Magnitude of Relative Error – Độ lớn trung vị của lỗi tương đối
Methodology – Nhân tố phương pháp luận trong mô hình Sheta-Uysal
Mean Magnitude of Relative Error – Độ lớn trung bình của lỗi tương đối
Magnitude of Relative Error – Độ lớn của lỗi tương đối
Số ong thợ trong tḥt tốn ABC
Sớ cá thể trong tḥt tốn tới ưu bầy đàn
Probabilistic Neural Networks – Mạng nơ-ron xác suất
Particle Swarm Optimization – Tḥt tốn tới ưu bầy đàn
Precision at level N – Độ chính xác ở mức lỗi dưới N%

Nhân tố ảnh hưởng đến quy mô dự án
Tổng điểm Story point của một dự án Agile
Độ phức tạp kỹ thuật của thệ thống sử dụng phân tích điểm chức năng
Teaching-learning-based Optimization – Tḥt tốn tới ưu dạy học
Teaching-learining based Artificial Bee Colony – Thuật toán đàn ong nhân
tạo cải tiến sử dụng cơ chế dạy học
Điểm chức năng thô
Vận tốc cơ sở của nhóm phát triển
Vận tốc sau hiệu chỉnh của nhóm phát triển


Mở đầu

vi

MỞ ĐẦU
Tối ưu hóa là một lĩnh vực tối quan trọng có tính ứng dụng cao trong nhiều lĩnh vực
như quy hoạch tài nguyên, thiết kế chế tạo máy, điều khiển tự động, quản trị kinh doanh,
kiến trúc đô thị, công nghệ thông tin, xây dựng các hệ hỗ trợ ra quyết định trong quản lý
và phát triển các hệ thống lớn. Các mục tiêu của tối ưu hóa là cực tiểu tài nguyên và chi
phí sử dụng, cũng như tối đa hóa lợi nhuận, hiệu năng và tính chính xác. Vì thời gian,
tiền bạc và tài nguyên luôn bị giới hạn trong các ứng dụng thực tế nên chúng ta phải tìm
ra giải pháp để sử dụng hiệu quả các nguồn tài nguyên có giá trị này trong điều kiện có
một số ràng buộc nhất định kèm theo. Cùng với sự phát triển của khoa học và công nghệ,
các bài tốn tới ưu phát sinh từ thực tế cuộc sống ngày càng đa dạng và phức tạp khi sớ
chiều của các bài tốn thực tế ngày càng lớn. Bởi vì tính liên hệ và tương quan giữa các
biến với nhau ngày một gia tăng nên các vấn đề này không thể được giải quyết trong giới
hạn thời gian hợp lý và cho ra lời giải chính xác. Kích thước và độ phức tạp của các bài
toán thực tế yêu cầu sự phát triển của các kỹ thuật mới có thể tìm kiếm lời giải chấp nhận
được trong một khoảng thời gian cho phép. Các thuật toán tìm kiếm lời giải chính xác

không thể giải quyết được các bài toán này trong một khoảng thời gian giới hạn. Khi đó
việc sử dụng các thuật toán xấp xỉ là một lựa chọn phù hợp để tìm thấy các lời giải gần
tối ưu. Qua nhiều thập kỷ, các khái niệm, kỹ thuật và các ứng dụng tính toán được lấy
cảm hứng từ tự nhiên đã được phát triển để giải quyết các bài tốn tới ưu một cách hiệu
quả. Tính tốn lấy cảm hứng từ tự nhiên có thể giải quyết các bài toán trong hầu hết các
lĩnh vực từ mạng cảm biến khơng dây, mạng máy tính, an tồn thơng tin, công nghiệp rô
bốt, công nghệ y sinh, các hệ thống điều khiển, xử lý song song, khai phá dữ liệu, các hệ
thống quản lý và tiêu thụ năng lượng, xử lý ảnh và nhiều lĩnh vực khác. Thiết kế các
thuật toán lấy cảm hứng từ tự nhiên liên quan đến việc chọn các phương pháp biểu diễn
phù hợp cho bài toán, đánh giá chất lượng của các lời giải thông qua hàm mục tiêu, và
định nghĩa các phương pháp để sinh ra lời giải mới cho bài toán. Các tḥt tốn này mơ
phỏng các cấu trúc và hành vi của các hệ thống phức tạp trong tự nhiên. Vì các nguồn
cảm hứng từ tự nhiên rất đa dạng nên có nhiều thuật toán khác nhau đã được đề xuất. Tuy
nhiên, những cách phân loại nguồn cảm hứng trong các nghiên cứu vẫn chưa thống nhất
và bao phủ hết những thuật toán hiện có. Cùng với đó, hiện nay vẫn chưa có nghiên cứu
nào ở Việt Nam thực hiện việc phân loại này và các thuật toán lấy cảm hứng từ tự nhiên
vẫn là một nghiên cứu khá mới mẻ trong nước. Bởi thế, một yêu cầu bức thiết là phải có
một phương pháp phân loại các nguồn cảm hứng này một cách phù hợp. Trong nghiên
cứu này, chúng tôi sẽ đề xuất một hướng phân loại mới cho các thuật toán lấy cảm hứng
từ tự nhiên cũng như giới thiệu tởng quan về một sớ tḥt tốn mới trong lĩnh vực này để
đóng góp một nguồn tài liệu tham khảo có giá trị phục vụ cho các nghiên cứu về sau.
Quy trình ước lượng nỗ lực và chi phí là một thành phần rất quan trọng trong các dự
án công nghệ phần mềm. Sự thành công hay thất bại của dự án phụ thuộc rất nhiều vào
tính chính xác của việc ước lượng nỗ lực và tiến độ dự án. Nếu chi phí ước lượng quá
thấp so với chi phí thực tế sẽ có ảnh hướng bất lợi về chất lượng của sản phẩm phần mềm
cuối cùng, làm ảnh hưởng đến uy tín và tính cạnh tranh của doanh nghiệp. Nếu chi phí
ước lượng quá cao so với chi phí thực tế sẽ ảnh hưởng tới nguồn lực được phân bổ cho
các dự án khác hoặc làm giảm doanh thu của doanh nghiệp khi không đủ nhân lực trong



Mở đầu

vii

kế hoạch để đấu thầu các dự án mới. Tập đồn Standish đã tun bớ rằng 44% của các dự
án phần mềm được chuyển giao trễ hạn hoặc vượt quá ngân quỹ cho phép. Điều này cho
thấy tầm quan trọng của việc quản trị dự án. Hiệp hội quốc tế về phân tích đầu vào cho
các dự án (ISPA) đã nêu ra ba nguyên nhân chính dẫn đến sự thất bại của các dự án bao
gồm: thiếu hụt các ước lượng về kỹ năng của nhân viên, thiếu hụt các hiểu biết về yêu
cầu của dự án, và ước lượng kích cỡ dự án không chính xác. Một nghiên cứu khác được
thực hiện bởi tập đoàn Standish để xác định các nhân tố chính dẫn đến sự thất bại của các
dự án đã tìm ra các nguyên nhân sau: sự không chắc chắn trong yêu cầu của hệ thống, sự
giới hạn về ngân quỹ, thiếu kỹ năng ước lượng dự án, ước lượng không chính xác nỗ lực
cần phân bổ cho dự án, bỏ qua các dữ liệu lịch sử về các dự án đã phát triển. Từ đó có thể
thấy rằng, nguyên nhân chủ yếu dẫn đến sự thất bại của các dự án phần mềm là do ước
lượng không chính xác về kích cỡ phần mềm và nỗ lực cần có để thực hiện dự án. Do
vậy, việc áp dụng các tḥt tốn tới ưu lấy cảm hứng từ tự nhiên để nâng cao tính chính
xác cho bài toán ước lượng dự án phần mềm có ý nghĩa đặt biệt quan trọng đối với doanh
nghiệp và nhà đầu tư.
Trong những năm gần đây, quy trình phần mềm Agile trở thành một lựa chọn mới
được nhiều doanh nghiệp áp dụng để quản lý toàn bộ quy trình phát triển phần mềm. Tuy
nhiên, các nghiên cứu về lĩnh vực này trên thế giới vẫn còn rất ít và ở Việt Nam hầu như
chưa tìm thấy một nghiên cứu nào. Trong khi đó, việc sử dụng các phương pháp truyền
thống để ước lượng nỗ lực cho các dự án Agile cho kết quả ước lượng không chính xác.
Trong thực tế, tính phức tạp và kích thước của các phần mềm ngày một gia tăng, các dự
án vượt quá vài chục triệu dòng lệnh đã không còn xa lạ. Các tổ chức phát triển phần
mềm yêu cầu nhiều nhân viên kỹ thuật hơn và các chi phí của phần mềm có thể lên tới
hàng triệu đô la. Sai sót trong ước lượng chi phí có thể dẫn đến những hậu quả rất nghiêm
trọng. Điều đó đòi hỏi phải phát triển một kỹ thuật nhằm nâng cao tính hiệu quả của các
phương pháp ước lượng phần mềm truyền thống cũng như đề xuất một phương pháp ước

lượng phần mềm mới cho quy trình Agile. Đề tài này hướng tới mục đích áp dụng các
tḥt tốn tới ưu hóa như một kỹ tḥt tính toán mềm để nâng cao tính chính xác của quy
trình ước lượng nỗ lực phát triển phần mềm truyền thống và phần mềm sử dụng quy trình
Agile.
Các đóng góp mới trong nghiên cứu này gồm có:
-

Phân lớp các nguồn cảm hứng từ tự nhiên được sử dụng để xây dựng nên các tḥt
tốn tới ưu.

-

Đề x́t các cải tiến quan trọng cho các tḥt tốn tới ưu thường được sử dụng bao
gờm: tḥt tốn đàn ong nhân tạo, tḥt tốn dạy học, và tḥt tốn tới ưu bầy đàn.

-

Nghiên cứu tởng quan về bài tốn ước lượng nỡ lực phát triển phần mềm, khảo sát
các phương pháp đang được sử dụng.

-

Cải tiến các mô hình ước lượng nỗ lực truyền thống như COCOMO, Sheta-Uysal
bằng cách tối ưu các tham số cho các mô hình ước lượng này sử dụng các thuật
toán cải tiến đề xuất.


Mở đầu

viii


-

Xây dựng một phương trình ước lượng nỗ lực mới dựa trên các yếu tố cần thiết cho
một dự án phần mềm sử dụng quy trình Agile. Các tham số của công thức ước
lượng nỗ lực đề xuất được xây dựng động sử dụng các tḥt tốn tới ưu.

-

Đánh giá, so sánh toàn diện các phương pháp đề xuất với các nghiên cứu khác.

-

Xây dựng một phần mềm hỗ trợ cho ra các kết quả ước lượng dựa trên các yếu tố
đầu vào của các mô hình.

Báo cáo này được chia thành các phần chính như sau:
Chương 1: trình bày về các thuật toán lấy cảm hứng từ tự nhiên.
Chương 2: giới thiệu các mô hình ước lượng nỗ lực phát triển phần mềm truyền thống
và ước lượng nỗ lực cho các phần mềm sử dụng quy trình phát triển Agile.
Chương 3: mô tả các kết quả của việc áp dụng các tḥt tốn tới ưu để nâng cao tính
chính xác của các kết quả ước lượng và trình bày các bước về phân tích và thiết kế
chương trình ước lượng nỗ lực mà chúng tôi đã xây dựng.
Những xuất bản trong quá trình nghiên cứu đề tài:
[1] Thanh Tung Khuat, My Hanh Le, "A novel hybrid ABC-PSO algorithm for effort
estimation of software projects using Agile methodologies," Journal of Intelligent
Systems, 2017 (Online First), DOI: 10.1515/jisys-2016-0294, (Scopus and ESCI
indexed)
[2] Thanh Tung Khuat, My Hanh Le, "Optimizing Parameters of Software Effort
Estimation Models using Directed Artificial Bee Colony Algorithm," Informatica,

vol. 40(4), 12/2016 (Scopus and ESCI indexed)
[3] Thanh Tung Khuat, My Hanh Le, "Applying Teaching-Learning to Artificial Bee
Colony for Parameter Optimization of Software Effort Estimation Model,"
Journal of Engineering Science and Technology (JESTEC), vol. 12, no. 5, 2017
(Scopus and ESCI indexed)
[4] Thanh Tung Khuat and My Hanh Le, "A Novel Technique of Optimization for the
COCOMO II Model Parameters using Teaching-Learning based Optimization
Algorithm," Journal of Telecommunications and Information Technology, vol.
1/2016, pp. 84-89, 2016 (Scopus indexed)


Chương 1: Các thuật toán tối ưu lấy cảm hứng từ tự nhiên

1

Chương 1. CÁC THUẬT TOÁN TỐI ƯU LẤY CẢM HỨNG
TỪ TỰ NHIÊN
Chương này giới thiệu tổng quan về tḥt tốn tới ưu, độ phức tạp của nó từ đó hướng
đến việc tìm hiểu các thuật toán gần đúng lấy cảm hứng từ tự nhiên để tìm lời giải xấp xỉ
cho các bài tốn tới ưu trong thực tế. Các nguồn cảm hứng từ tự nhiên sẽ được phân loại
làm tiền đề để nhóm các thuật toán hiện có trong lĩnh vực này vào từng nguồn cảm hứng
cụ thể. Ći cùng, ba tḥt tốn tới ưu phở biến được nghiên cứu trong đề tài này được
mô tả cụ thể.
1.1. Giới thiệu vấn đề
Các hiện tượng trong tự nhiên là một nguồn cảm hứng để thiết kế ra các quy luật và
xây dựng các hàm toán học cho các thuật toán metaheuristic để hướng dẫn quy trình tìm
kiếm hướng đến một lời giải tớt cho một bài tốn. Nghiên cứu này hướng đến việc phân
loại các nguồn cảm hứng, giới thiệu một sớ tḥt tốn điểm hình trong mỡi ng̀n cảm
hứng và ứng dụng một sớ tḥt tốn để giải qút một bài tốn trong thực tế là “Ước
lượng nỡ lực cần cho quy trình phát triển các sản phẩm phần mềm”.

1.2. Tính phức tạp của bài toán tối ưu
1.3. Phân lớp các nguồn cảm hứng từ tự nhiên để xây dựng thuật toán tối ưu
Trong nghiên cứu này, chúng tôi chia các nguồn cảm hứng thành ba nhóm lớn: vật lý,
hóa học và sinh học. Các nhóm con của từng nhóm được mô tả như trong Hình 1.

Hình 1. Phân loại các nguồn cảm hứng từ tự nhiên

1.4. Tổng quan về các thuật toán tối ưu từ tự nhiên
1.5. Giới thiệu chung về các thuật toán được sử dụng trong đề tài
Trong các thuật toán được trinh bày ở phần trước, có ba thuật toán thường được ứng
dụng rộng rãi để giải qút các bài tốn tới ưu trong thực tế là thuật toán đàn ong nhân
tạo, thuật toán dạy học và thuật toán trí tuệ bầy đàn. Tuy nhiên những thuật toán này vẫn


Chương 1: Các thuật toán tối ưu lấy cảm hứng từ tự nhiên

2

có các điểm yếu của nó trong việc tìm ra các lời giải có chất lượng cao. Vì vậy, chúng tơi
sẽ tập trung vào ba tḥt tốn chính này và giới thiệu các thuật toán cải tiến của chúng để
áp dụng vào bài tốn cụ thể là tới ưu nỗ lực phát triển phần mềm.
Chúng tôi hướng đến việc đề xuất một phiên bản cải tiến của thuật toán đàn ong nhân
tạo và ứng dụng nó vào việc nâng cao tính chính xác của một mô hình ước lượng phần
mềm cụ thể. Đề tài cũng sẽ áp dụng các nguyên lý trong thuật toán đàn ong nhân tạo để
lai ghép với tḥt tốn dạy học, tḥt tốn tới ưu bầy đàn để tạo ra một thuật toán mới
hiệu quả hơn trong việc đưa ra các dự đốn nỡ lực cần cung cấp cho một dự án phần
mềm. Trong đề tài này chúng tôi cũng đề xuất một phương trình ước lượng nỗ lực mới
dựa trên các nhân tố cần thiết cho một dự án phần mềm sử dụng các phương pháp phát
triển linh hoạt Agile. Các tham số của phương trình toán học mới này được xây dựng
bằng cách sử dụng các tḥt tốn tới ưu lấy cảm hứng từ tự nhiên được cải tiến theo

hướng hiệu quả hơn. Phần còn lại của chương này sẽ tập trung mơ tả chi tiết về ba tḥt
tốn được sử dụng trong nghiên cứu này.
1.6. Thuật toán đàn ong nhân tạo
1.7. Thuật toán dạy-học
1.8. Thuật toán đàn ong nhân tạo kết hợp dạy học
1.9. Thuật toán tối ưu bầy đàn
1.10. Thuật toán lai giữa đàn ong nhân tạo và tối ưu bầy đàn (ABC-PSO)


Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

3

Chương 2. BÀI TOÁN ƯỚC LƯỢNG NỖ LỰC PHÁT TRIỂN
PHẦN MỀM
Chương này trình bày tởng quan về bài tốn ước lượng nỗ lực phát triển phần mềm,
cũng như khảo sát các phương pháp đang được sử dụng trong việc sinh ra kết quả ước
lượng trong thực tế. Cuối chương sẽ trình bày về các mô hình ước lượng nỗ lực trùn
thớng dựa trên phương trình tốn học và một mô hình ước lượng nỗ lực mới cho các dự
án sử dụng quy trình Agile.
2.1. Giới thiệu bài toán
Ước lượng dự án phần mềm hiệu quả là một hoạt động quan trọng, đồng thời cũng là
một thách thức trong quá trình phát triển phần mềm. Ước lượng là một trong những nền
tảng cho việc lập kế hoạch dự án một cách hiệu quả. Nhiều tổ chức phải đối mặt với việc
thâm hụt ngân quỹ, đánh mất lợi thế cạnh tranh và chậm trễ trong việc giao sản phẩm cho
khách hàng dẫn đến mất uy tín.
Việc xác định chính xác nỗ lực và chi phí cần thiết cho một dự án phần mềm là một
yêu cầu tối quan trọng để đảm bảo dự án thành công trong thời gian và kinh phí cho
phép.
2.2. Tổng quan về các kỹ thuật ước lượng nỗ lực phần mềm

Các kỹ thuật ước lượng nỗ lực phần mềm có thể được phân nhóm theo nhiều cách
khác nhau. Một cách chia các kỹ thuật này thành sáu nhóm chính được mô tả bởi Chulani
và các cộng sự và được mô tả như Hình 2.
Các kỹ thuật ước lượng nỗ lực phần mềm
Dựa vào mô hình toán học: SLIM, COCOMO, SEER
Dựa vào kiến thức chuyên gia và tập luật
Các kỹ thuật học và suy luận
Dựa trên tính động của dự án
Dựa trên hồi quy
Hỗn hợp
Hình 2. Phân loại các kỹ thuật ước lượng nỗ lực phát triển phần mềm


Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

4

2.3. Các phương pháp ước lượng nỗ lực dựa trên phương tình toán học
2.3.1. Mô hình ước lượng giá cấu thành COCOMO
2.3.1.1. Các phương thức phát triển phần mềm trong mô hình COCOMO
COCOMO phân biệt ba phương thức phát triển dự án phần mềm là organic, semidetached và embedded.
-

Trong phương thức organic, những dự án tương đối nhỏ và đơn giản được phát
triển bởi những đội nhỏ trong những môi trường quen thuộc với những yêu cầu
không quá cứng nhắc và có thể linh động thay đổi, do đó việc phát triển có thể
được hỗ trợ bởi các dự án đã phát triển trước đó.

-


semi-detached: cho những dự án có mức độ trung bình về kích cỡ và độ phức
tạp được phát triển bởi đội phát triển có trình độ khác nhau với những ràng
buộc mạnh mẽ hơn so với organic. Tuy nhiên vẫn có một số linh động, tức là dự
án vẫn có thể được hỗ trợ từ những dự án đã làm trước đây nhưng ở mức độ ít

-

embedded: cho những dự án có những ràng buộc chặt chẽ về phần cứng, phần
mềm, và thi hành, … Dự án phải được phát triển từ đầu và không được sự hỗ
trợ từ dữ liệu của các dự án trong quá khứ.

2.3.1.2. Mô hình COCOMO cơ sở
2.3.1.3. Mô hình COCOMO trung cấp
2.3.1.4. Mô hình COCOMO nâng cao
2.3.1.5. Mô hình COCOMO II
Khi công nghệ phần mềm thay đổi, Boehm tiếp tục phát triển mô hình COCOMO và
COCOMO II ra đời. COCOMO II cho phép sử dụng số dòng mã và điểm chức năng như
các tham số tham chiếu để tính toán kích thước của dự án. Có ba biến thể của mô hình
COCOMO II là Applications Composition, Early Design và Post Architecture.
Đề tài này tập trung vào mô hình COCOMO II. Các bước ước lượng nỗ lực sử dụng
mô hình COCOMO II gồm có:
1. Xác định kích thước dự án qua tổng điểm chức năng của tất cả các thành phần và
quy đổi sang nghìn dòng lệnh (KLOC) ứng với ngôn ngữ triển khai: Size
2. Xác định các yếu tố điều chỉnh chi phí của mô hình COCOMO II: EM
Có 17 yếu tố liên quan đến việc điều chỉnh chi phí của dự án sử dụng mô hình
COCOMO II như được cho trong Bảng 1. EM được xác định là tích các điểm số của 17
nhân tố này.
Bảng 1. Các yếu tố hiệu chính chi phí của mô hình COCOMO II
Các yếu tố


Rất thấp

Thấp

Mức ảnh hưởng
Bình thường Cao

Rất cao

Đặc biệt cao


Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm
Sản phẩm
Độ ổn định
của
phần
mềm
(RELY)
Kích thước
của cơ sở dữ
liệu
ứng
dụng
(DATA)
Độ phức tạp
của sản phẩm
(CPLX)
Khả năng sử
dụng

lại(RUSE)

Sự phù hợp
của tài liệu
với các nhu
cầu vòng đời
sản
phẩm
(DOCU)
Phần cứng
Ràng buộc
hiệu
năng
thời
gian
thực (TIME)

Ràng buộc
bộ nhớ chính
(STOR)
Tính
biến
động
của
phần
cứng
(PVOL)

Nhân lực
Khả

năng
phân
tích
(ACAP)

Khả năng lập
trình (PCAP)

Sự thay thế
nhân
lực
trong dự án

Sự bất tiện
rất thấp


Rất thấp

Sự bất tiện
thấp, những
khuyết tật dễ
sửa chữa
Kích thước
cơ sở dữ liệu
/ số dòng
lệnh < 10
Thấp

Không

dụng lại

sử



Nhiều
nhu
cầu về vòng
đời sản phẩm
không được
mô tả



Một số nhu
cầu về vòng
đời sản phẩm
không được
mô tả









Tối thiểu mỗi

tháng phần
cứng có thay
đổi nhỏ và
tối thiểu 12
tháng có thay
đổi lớn

15% thành
viên
trong
đội dự án có
kinh nghiệm
phân tích và
thiết kế
15% thành
viên
trong
đội dự án có
kinh nghiệm
lập trình
Thay
48%
nhân
lực
trong đội dự

35% thành
viên
trong
đội dự án có

kinh nghiệm
phân tích và
thiết kế
35% thành
viên
trong
đội dự án có
kinh nghiệm
lập trình
Thay
24%
nhân
lực
trong đội dự

5

Sự bất tiện
trung bình,
những khuyết
tật dễ sửa
chữa
10 đến dưới
100

Có khả năng
gây tổn thất
lớn

Sự tổn thất

và các nguy
cơ rủi ro rất
cao

Từ 100 đến
dưới 1000

Từ 1000 trở
lên

Bình thường

Cao

Rất cao

Đặc biệt cao

Sử dụng như
một
thành
phần trong
một
ứng
dụng độc lập
khác
Nhu cầu về
vòng đời sản
phẩm được
yêu cầu với

kích
thước
hợp lý

Sử dụng cho
nhiều dự án
của một công
ty

Sử dụng lại
cho
nhiều
công ty

Sử dụng lại
cho nhiều sản
phẩm thương
mại
của
nhiều công ty

Nhu cầu về
vòng đời sản
phẩm lớn

Nhu cầu về
vòng đời sản
phẩm rất lớn

Phần

mềm
chiếm dưới
50%
thời
gian thực thi
sẵn có mà
phần
cứng
cung cấp
Phần mềm sử
dụng
dưới
50% bộ nhớ
sẵn có
Cứ 2 tuần
phần cứng có
thay đổi nhỏ
và sau 6
tháng có thay
đổi lớn

Phần
mềm
chiếm
khoảng 70%
thời
gian
thực thi sẵn
có mà phần
cứng

cung
cấp
Phần mềm sử
dụng khoảng
70% bộ nhớ
sẵn có
Cứ 1 tuần
phần cứng có
thay đổi nhỏ
và sau 2
tháng có thay
đổi lớn

Phần
mềm
chiếm
khoảng 85%
thời
gian
thực thi sẵn
có mà phần
cứng
cung
cấp
Phần mềm sử
dụng khoảng
85% bộ nhớ
sẵn có
Cứ 2 ngày
phần cứng có

thay đổi nhỏ
và sau 2 tuần
có thay đổi
lớn

55% thành
viên
trong
đội dự án có
kinh nghiệm
phân tích và
thiết kế
55% thành
viên
trong
đội dự án có
kinh nghiệm
lập trình
Thay
12%
nhân
lực
trong đội dự

75% thành
viên
trong
đội dự án có
kinh nghiệm
phân tích và

thiết kế
75% thành
viên
trong
đội dự án có
kinh nghiệm
lập trình
Thay
6%
nhân
lực
trong đội dự

90% thành
viên
trong
đội dự án có
kinh nghiệm
phân tích và
thiết kế
90% thành
viên
trong
đội dự án có
kinh nghiệm
lập trình
Thay
3%
nhân
lực

trong đội dự







Phần
mềm
chiếm
khoảng 95%
thời
gian
thực thi sẵn
có mà phần
cứng
cung
cấp
Phần mềm sử
dụng khoảng
95% bộ nhớ
sẵn có











Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm
(PCON)
Kinh nghiệm
xây
dựng
ứng
dụng
(APEX)

án mỗi năm
Kinh nghiệm
phát
triển
ứng
dụng
tương tự của
đội dự án
dưới 2 tháng

Kinh nghiệm
sử dụng phần
cứng (PLEX)

Kinh nghiệm
sử dụng phần
cứng mà dự
án yêu cầu

dưới 2 tháng

Kinh nghiệm
về ngôn ngữ
lập trình và
công
cụ
(LTEX)

Kinh nghiệm
sử dụng ngôn
ngữ lập trình
mà dự án yêu
cầu dưới 2
tháng

Dự án
Sử dụng các
công cụ phần
mềm có sẵn
(TOOL)

Sự cộng tác
để phát triển
dự án ở nhiều
vị trí khác
nhau (SITE)
Yêu cầu đối
với lịch trình
phát triển dự

án (SCED)

6

án mỗi năm
Kinh nghiệm
phát
triển
ứng
dụng
tương tự của
đội dự án
khoảng
6
tháng
Kinh nghiệm
sử dụng phần
cứng mà dự
án yêu cầu
khoảng
6
tháng
Kinh nghiệm
sử dụng ngôn
ngữ lập trình
mà dự án yêu
cầu khoảng 6
tháng

án mỗi năm

Kinh nghiệm
phát
triển
ứng
dụng
tương tự của
đội dự án
khoảng
1
năm
Kinh nghiệm
sử dụng phần
cứng mà dự
án yêu cầu
khoảng
1
năm
Kinh nghiệm
sử dụng ngôn
ngữ lập trình
mà dự án yêu
cầu khoảng 1
năm

án mỗi năm
Kinh nghiệm
phát
triển
ứng
dụng

tương tự của
đội dự án
khoảng
3
năm
Kinh nghiệm
sử dụng phần
cứng mà dự
án yêu cầu
khoảng
3
năm
Kinh nghiệm
sử dụng ngôn
ngữ lập trình
mà dự án yêu
cầu khoảng 3
năm

án mỗi năm
Kinh nghiệm
phát
triển
ứng
dụng
tương tự của
đội dự án
khoảng
6
năm

Kinh nghiệm
sử dụng phần
cứng mà dự
án yêu cầu
khoảng
6
năm
Kinh nghiệm
sử dụng ngôn
ngữ lập trình
mà dự án yêu
cầu khoảng 6
năm

Sử
dụng
thêm
các
công cụ tích
hợp quy mô
nhỏ, công cụ
hỗ
trợ
backend,
frontend đơn
giản

Sử
dụng
thêm

các
công cụ tích
hợp quy mô
trung bình,
công cụ quản
lý vòng đời
sản phẩm cơ
bản

Sử
dụng
thêm
các
công cụ tích
hợp quy mô
trung bình,
công cụ quản
lý vòng đời
sản phẩm bền
vững, đa tính
năng

Cộng
tác
tồn cầu

Cộng
tác
nhiều cơng ty


nhiều
thành phớ

Cộng
tác
nhiều cơng ty
hoặc nhiều
thành phớ

Cộng
tác
trong cùng
khu
vực
thành phố

Sử dụng các
công cụ tích
hợp quy mô
lớn,
với
nhiều
quy
trình, phương
pháp, tái sử
dụng, công
cụ quản lý
vòng đời sản
phẩm
tích

cực,
bền
vững, đa tính
năng
Cộng
tác
trong cùng
tòa nhà

Chỉ đạt 75%
tốc độ so với
mức yêu cầu
của lịch trình
phát triển

Chỉ đạt 85%
tốc độ so với
mức yêu cầu
của lịch trình
phát triển

Đạt 100% tốc
độ so với
mức yêu cầu
của lịch trình
phát triển

Đạt 130% tốc
độ so với
mức yêu cầu

của lịch trình
phát triển

Chỉ sử dụng
các công cụ
sử đổi, viết
mã và gỡ lỗi









Cộng
tác
trong chính
đội phát triển
ở nơi làm
việc

Đạt 160% tốc
độ so với
mức yêu cầu
của lịch trình
phát triển




Điểm của mỗi thành phần được cho trong Bảng 2.
Bảng 2. Thang điểm các yếu tố hiệu chỉnh chi phí mô hình COCOMO II

Các yếu tố

Ký hiệu

Rất thấp

Thấp

Bình thường

Rất cao

Cực kỳ cao

RELY

EM1

0.82

0.92

1.00

1.10


1.26



DATA

EM2



0.90

1.00

1.14

1.28



CPLX

EM3

0.73

0.87

1.00


1.17

1.34

1.74

RUSE

EM4



0.95

1.00

1.07

1.15

1.24

DOCU

EM5

0.81

0.91


1.00

1.11

1.23



Cao


Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

7

TIME

EM6





1.00

1.11

1.29

1.63


STOR

EM7





1.00

1.05

1.17

1.46

PVOL

EM8



0.87

1.00

1.15

1.30




ACAP

EM9

1.42

1.19

1.00

0.85

0.71



PCAP

EM10

1.34

1.15

1.00

0.88


0.76



PCON

EM11

1.29

1.12

1.00

0.90

0.81



APEX

EM12

1.22

1.10

1.00


0.88

0.81



PLEX

EM13

1.19

1.09

1.00

0.91

0.85



LTEX

EM14

1.20

1.09


1.00

0.91

0.84



TOOL

EM15

1.17

1.09

1.00

0.90

0.78



SITE

EM16

1.22


1.09

1.00

0.93

0.86

0.80

SCED

EM17

1.43

1.14

1.00

1.00

1.00



3. Tính điểm các nhân tố ảnh hưởng đến quy mô của dự án: SF
Có năm nhân tố chính ảnh hưởng đến quy mơ dự án:
• Tính tương tự với dự án đã phát triển (PREC)

• Tính linh hoạt trong phát triển (FLEX)
• Mức độ tỉ mỉ trong thiết kế và kế hoạch dự trù rủi ro (RESL)
• Tính gắn kết trong đội ngũ phát triển (TEAM)
• Năng lực sản xuất của doanh nghiệp phầm mềm (PMAT)
Điểm của mỗi nhân tố ảnh hưởng đến quy mô dự án được cho trong Bảng 3. Giá trị SF
là tích điểm số của cả năm nhân tố này.
Bảng 3. Thang điểm các nhân tố ảnh hưởng đến quy mô dự án

Nhân tố

Ký hiệu

Rất thấp

Thấp

Bình thường

Cao

Rất cao

Đặc biệt cao

PREC

SF1

6.20


4.96

3.72

2.48

1.24

0.00

FLEX

SF2

5.07

4.05

3.04

2.03

1.01

0.00

RESL

SF3


7.07

5.65

4.24

2.83

1.41

0.00

TEAM

SF4

5.48

4.38

3.29

2.19

1.10

0.00

PMAT


SF5

7.80

6.24

4.68

3.12

1.56

0.00

4. Tính tốn nỡ lực và thời gian hồn thành của dự án:
- Nỡ lực được tính theo đơn vị người-tháng theo công thức sau:
Eff = A  SizeB + 0.01  SF  EM
Thời gian phát triển được tính theo đơn vị tháng theo công thức sau:


Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

8

TDEV = C  EffD + 0.002  SF
trong đó: A = 2.94, B = 0.91, C = 3.67 và D = 0.28
- Từ đó tính được số người trung trình mà đội phát triển cần:
NumPeople = Eff / TDEV
Mặc dù COCOMO II là một mô hình ước lượng nỗ lực hiệu quả nhưng những hệ số
trong công thức ước lượng Eff và TDEV được trình bày ở trên được suy ra từ một số dự

án sử dụng phương pháp hồi quy nên chúng vẫn chưa được tối ưu. Do đó, đề tài này
hướng đến sử dụng các thuật toán lấy cảm hứng từ tự nhiên để tối ưu bốn tham số A, B,
C và D trong phương trình ước lượng này.
2.3.2. Phương pháp điểm chức năng
Các bước ước lượng nỗ lực sử dụng mô hình điểm chức năng như sau:
1. Xác định số lượng điểm chức năng thô: UFPs
UFP = tổng điểm số của độ phức tạp
2. Đánh giá độ phức tạp của kỹ thuật của hệ thống: TCF
Tính độ phức tạp kỹ thuật theo công thức:
TCF = 0.65 + 0.01 (tổng điểm của 14 yếu tố kỹ thuật)
3. Tính tổng điểm chức năng cuối cùng:
FPs = UFPs  TCF
2.3.3. Kết hợp COCOMO II và điểm chức năng để ước lượng nỗ lực
2.4. Phương pháp ước lượng nỗ lực cho quy trình phần mềm Agile
2.4.1. Quy trình phát triển phần mềm Agile
2.4.1.1. Các nguyên tắc của quy trình Agile
2.4.1.2. Các đặc trưng của quy trình Agile
2.4.2. Phương pháp ước lượng nỗ lực phát triển phần mềm sử dụng quy trình Agile
Trong nghiên cứu này chúng tôi sử dụng các nhân tố của một mô hình ước lượng nỗ
lực và thời gian phát triển cho một dự án phần mềm sử dụng quy trình Agile được đề xuất
bởi Zia và các cộng sự. Tuy nhiên pháp sử dụng hồi quy tuyến tính để ước lượng nỗ lực
từ các yếu tố ảnh hưởng đến thời gian sản xuất phần mềm trong mô hình này vẫn chưa
cho ra kết quả tối ưu. Vì vậy, nghiên cứu này chúng tôi sẽ đề xuất một công thức để ước
lượng nỗ lực phát triển phần mềm sử dụng quy trình Agile dựa trên các yếu tố đầu vào.
Những nội dung này sẽ được trình bày trong chương 3. Trong phần này chúng tôi giới
thiệu các yếu tố ảnh hưởng và các bước thực hiện ước lượng sử dụng mô hình ước lượng
nỗ lực được Zia đề xuất.


Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm


9

2.4.2.1. Các yếu tố đầu vào của mô hình ước lượng
Để phục vụ cho quá trình ước lượng nỗ lực cho một sản phẩm phần mềm phát triển
theo mô hình Agile cần phải có các yếu tố sau:
-

Các user stories của dự án.

-

Với mỗi user story cần phải xác định điểm chức năng của nó. Để xác định điểm chức
năng của mỗi user story cần phải xác định được kích thước của user story và độ phức
tạp của nó.

-

Xác định vận tốc thực hiện của nhóm phát triển sản phẩm:
o Xác định vận tốc cơ sở của nhóm phát triển bằng cách tính trung bình có bao
nhiêu product backlog (hiểu đơn giản là chức năng được yêu cầu hay user story)
đã hoàn thành trong một khoảng thời gian xác định (Sprint) cho các dự án
tương tự trước đó. Nếu chưa có vận tốc này thì lấy giá trị trung bình của tất cả
dự án mà cách thành viên trong nhóm đã phát triển.
o Xác định tính chất các nhân tố thường xuyên xuất hiện làm ảnh hưởng đến tốc
độ phát triển của toàn nhóm phát triển: thành phần của nhóm phát triển (đã chọn
đúng người với các kỹ năng phù hợp cần cho dự án hay chưa), quy trình phát
triển sản phẩm, các nhân tố ảnh hưởng đến môi trường làm việc của nhóm, tính
gắn kết của nhóm phát triển.
o Xác định tính chất các nhân tố ảnh hưởng đến năng suất của mỗi thành viên

trong nhóm phát triển: thay đổi thành viên trong nhóm (thêm, bớt thành viên,
thay đổi vai trò và trách nhiệm của các thành viên), yêu cầu phải nghiên cứu và
sử dụng công cụ mới cho dự án, các lỗi trong phần mềm của bên thứ ba, các
thành viên trong nhóm phải đảm nhận nhiều dự án cùng lúc, các vấn đề cá nhân
của các thành viên trong nhóm, phản hồi từ khách hàng cho các thắc mắc của
nhóm phát triển, tính nhập nhằng trong yêu cầu của dự án, sự thay đổi trong đặc
tả yêu cầu của sản phẩm, thay đổi nơi làm việc của nhóm phát triển.
o Xác định vận tốc cuối cùng của nhóm phát triển dưới sự ảnh hưởng của các
nhân tớ trên.

-

Xác định lương trung bình hàng tháng cho tồn nhóm phát triển

-

Xác định các chi phí bên ngoài lương của nhóm phát triển. Tính tỉ lệ của nó so với
chi phí dành cho trả lương hàng tháng cho nhóm phát triển

-

Tính tốn thời gian và chi phí cho tồn dự án
o Dự đoán thời gian phát triển từ vận tốc và story point (đơn vị ngày): T
o Xác định mức độ tin cậy đối với các ước lượng của các nhân tố theo đơn vị
phần trăm: CL
o Từ đó min và max cho thời gian phát triển được tính như sau:


Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm


𝑚𝑖𝑛 = [1 −

(100 − 𝐶𝐿)
]×𝑇
100

𝑚𝑎𝑥 = [1 +

(100 − 𝐶𝐿)
]×𝑇
100

10

o Xác định sớ ngày làm việc trung bình trong một tháng của nhóm phát triển để
quy đổi thời gian sang tháng. Từ đó tính chi phí cho toàn dự án dựa trên thời
gian phát triển, lương trung bình hàng tháng và hệ số từ lương và các nhân tớ
ngồi lương theo cơng thức:
Cost = hệ sớ  Lương hàng tháng  Số tháng
o Xác định min và max cho chi phí theo công thức sau:
𝑚𝑖𝑛 = [1 −

(100 − 𝐶𝐿)
] × 𝐶𝑜𝑠𝑡
100

𝑚𝑎𝑥 = [1 +

(100 − 𝐶𝐿)
] × 𝐶𝑜𝑠𝑡

100

hệ số = 1 + tỉ trọng các yếu tố ngoài lương.

2.4.2.2. Xác định story point cho dự án
-

Xác định điểm quy mô cho mỗi user story của dự án sử dụng Bảng 4.
Bảng 4. Điểm quy mô cho các user story

Mô tả

Giá trị

5

4
3
2
1

-

Kích thước story cực kỳ lớn
Quá lớn để ước lượng chính xác
Có thể cần đến vài tháng để hoàn thành
Cần phải chia nhỏ thành các story nhỏ hơn
Có thể hình thành cả dự án mới từ story này
Kích thước story rất lớn
Yêu cầu phát triển trong thời gian dài, có thể hơn một tuần làm việc

Nên chia thành các story nhỏ hơn
Kích thước story vừa phải
Cần từ 2 đến 5 ngày để hoàn thành
Cần 1 đến 2 ngày để hoàn thành
Kích thước story nhỏ
Chỉ cần một vài giờ để hoàn thành

-

Xác định điểm độ phức tạp cho mỗi user story.

-

Xác định story point của mỗi user story theo công thức:
ES = Độ phức tạp  Kích thước

Để tính tổng điểm story point SP của cả dự án thì lấy tổng điểm của tất cả story cần
phải thực hiện cho toàn dự án.


Chương 2: Bài toán ước lượng nỗ lực phát triển phần mềm

11

2.4.2.3. Xác định vận tốc của nhóm phát triển
Vận tớc ći cùng của nhóm phát triển được tính tốn dựa vào cơng thức (16).
𝑉 = 𝑉𝑖𝐹𝑅×𝐷𝐹

(16)


Với FR là giá trị hệ số giảm tốc thường xuyên, DF là giá trị độ lớn của yếu tố biến động.
2.4.2.4. Xác định thời gian và chi phí dự án
Từ hai yếu tố đầu vào là story point của toàn bộ dự án và vận tốc của đội ngũ phát
triển, Zia và các cộng sự đã sử dụng mô hình hồi quy tuyến tính cùng với những dữ liệu
của các dự án lịch sử để tính toán ra thời gian phát triển T của toàn bộ dự án. Sau khi đã
có được thời gian chúng ta có thể xác định được cận dưới và cận trên cần thiết cho dự án.
Cũng như có thể tính toán được chi phí phát triển áp dụng các công thức và các yếu tố đã
trình bày trong phần 2.4.2.1.


Chương 3: Cài đặt, thử nghiệm và đánh giá kết quả

12

Chương 3. CÀI ĐẶT, THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ
Chương này trình bày các kết quả phân tích và thiết kế chương trình ước lượng nỗ lực
phát triển phần mềm, cũng như ứng dụng của các tḥt tốn tới ưu đã trình bày ở chương
1 vào các mô hình ước lượng nỗ lực phần mềm cụ thể bao gồm các mô hình truyền thống
và một phương trình ước lượng nỗ lực mới do chúng tôi đề xuất cho các dự án sử dụng
quy trình Agile. Các kết quả thu được minh chứng cho tính hiệu quả của vệc áp dụng các
tḥt tốn tới ưu để nâng cao tính chính xác của kết quả ước lượng. Trong chương này
chúng tôi cũng trình bày về các bước phân tích và thiết kế cho công cụ phần mềm mà
chúng tôi đã xây dựng.
3.1. Đặt vấn đề
Trong các mô hình ước lượng nỗ lực truyền thống thì các mô hình dựa trên phương
trình tốn học nỡi lên như một trong những phương pháp ước lượng hiệu quả dựa trên tập
dữ liệu của các dự án lịch sử và COCOMO II là một trong những mô hình như vậy. Tuy
nhiên mô hình này vẫn có các yếu điểm là nó dựa trên bốn hằng số cố định A= 2.94,
B = 0.91, C = 3.67 và D = 0.28 cho các công thức ước lượng. Các hằng số này được suy
luận ra từ một tập của 93 dự án đã triển khai của NASA và không thay đổi khi áp dụng

vào các dự án mới. Đây là một nhược điểm lớn của mô hình này. Trong nghiên cứu này
chúng tôi hướng đến việc cải tiến mơ hình này bằng cách sử dụng một tḥt tốn kết hợp
giữa ABC và dạy học để tối ưu các tham số của mô hình trên tập dữ liệu dự án lịch sử.
Tất nhiên quy trình tối ưu để tìm ra các tham số này có thể được thực hiện liên tục khi tập
dữ liệu lịch sử bị thay đổi bằng cách thêm vào nhiều dự án mới. Khi đó chỉ cần thực hiện
thuật toán thì nó sẽ cho ra một bộ giá trị tham số tối ưu mới.
Để ứng phó với tính hay thay đổi trong yêu cầu phần mềm, các phương pháp phát triển
phần mềm linh hoạt Agile được sử dụng vì những ưu điểm vượt trội của nó như tính lặp
và gia tăng, thời gian chuyển giao nhanh, giảm thiểu rủi ro, và cho phép các tổ chức thích
ứng nhanh với những thay đổi yêu cầu trong quá trình phát triển. Từ đó làm phát sinh vấn
đề làm thế nào để ước lượng nỗ lực cho các dự án sử dụng quy trình phát triển mới này.
Số dòng mã nguồn trong phần mềm là nhân tố chính được sử dụng cho các mô hình
truyền thống nhưng trong Agile thì lại sử dụng các user story làm nhân tố chính. Bởi vậy,
điểm chức năng story point trở thành một phép đo để xác định kích thước của dự án cũng
như độ khó mỗi mỗi chức năng trong đặc tả u cầu. Ngồi story point thì vận tớc của
nhóm phát triển dự án cũng là một yếu tố ảnh hưởng đến nỗ lực. Dựa vào story point và
vận tốc chúng ta có thể tạo một công thức để ước lượng nỗ lực cho một dự án phần mềm
sử dụng quy trình Agile. Nghiên cứu này tập trung vào việc đề xuất một công thức ước
lượng như vậy và các tham số trong công thức sẽ được tối ưu bằng cách sử dụng một
tḥt tốn lai giữa tới ưu bầy đàn và đàn ong nhân tạo. Hiệu quả của các phương pháp đề
xuất sẽ được trình bày trong chương này.


Chương 3: Cài đặt, thử nghiệm và đánh giá kết quả

13

3.2. Các tiêu chuẩn đánh giá kết quả ước lượng nỗ lực
-


Độ lớn trung bình của lỗi tương đối (Mean Magnitude of Relative Error –
MMRE)

-

Độ lớn trung vị của lỗi tương đối (Median Magnitude of Relative Error –
MdMRE)

-

Độ chính xác ở mức N (PRED(N))
1

𝑀𝑀𝑅𝐸 = × ∑𝐿𝑖=1 𝑀𝑅𝐸𝑖

(17)

𝐿

trong đó L là tổng số dựa án, i là chỉ số của một dự án trong tập L dự án và MRE là độ
lớn của lỗi tương đối được diễn tả như công thức (18).
|𝐴𝑖 −𝑃𝑖 |

𝑀𝑅𝐸𝑖 =

(18)

𝐴𝑖

với Ai và Pi lần lượt là giá trị nỗ lực thực sự và giá trị nỡ lực được dự đốn của dữ liệu

thứ i trong tập dữ liệu dự án sử dụng một mô hình ước lượng nào đó.
𝑃𝑅𝐸𝐷 (𝑁) =

100
𝐿

×

∑𝐿𝑖=1 {

𝑁

1

nếu 𝑀𝑅𝐸𝑖 ≤

0

nếu ngược lai

100

(19)

Hệ số tương quan bình phương (R2) được tính tốn như cơng thức (20) cũng là một
phép đo tính tốt của mô hình ước lượng phần mềm. Giá trị của R2 càng cao thì kết quả
ước lượng càng chính xác.
2
∑𝐿
𝑖=1(𝐴𝑖 −𝑃𝑖 )


𝑅2 = 1 − ∑𝐿

𝑖=1(𝐴𝑖 −𝐴𝑚𝑒𝑎𝑛 )

2

(20)

ở đây Amean là giá trị trung bình của nỗ lực thực sự.
Shepperd và MacDonell đã đề xuất một phép đo gọi là số dư tuyệt đối trung bình
(mean absolute residual – MAR) như được cho trong công thức (21).
𝑀𝐴𝑅 =

∑L
i=1 |𝐴𝑖 −𝑃𝑖 |
𝐿

(21)

3.3. Tối ưu tham số mô hình COCOMO bằng thuật toán TLABC
3.3.1. Hàm thích nghi
Để đánh giá chất lượng của mỗi nguồn thức ăn (lời giải) tìm được chúng ta cần sử có
một hàm thích nghi. Trong phần này chúng tơi sẽ áp dụng tḥt tốn lai giữa tḥt toán
đàn ong nhân tạo và thuật toán dạy học để tối ưu bốn giá trị tham số A, B, C, và D của
mô hình ước lượng COCOMO II. Từ các công thức ước lượng nỗ lực của mô hình
COCOMO II, chúng ta nhận thấy hai tham số A và B nằm trong công thức liên quan đến
nỗ lực, hai tham số còn lại nằm trong công thức liên quan đến giá trị thời gian có mối liên
hệ với nỗ lực. Vì vậy, chúng tôi xây dựng một hàm thích nghi như công thức (22) là sự
kết hợp của cả nỗ lực và thời gian để đánh giá tính tốt của mỗi lời giải thu được (bộ 4

tham số A, B, C và D) trong quá trình tìm kiếm lời giải.


Chương 3: Cài đặt, thử nghiệm và đánh giá kết quả

𝑓=

100
𝐿

× ∑𝐿𝑖=1[

14

|𝐴𝐸𝑖 −𝑃𝐸𝑖 |
𝐴𝐸𝑖

+

|𝐴𝑇𝑖 −𝑃𝑇𝑖 |
𝐴𝑇𝑖

]

(22)

trong đó: L là tởng số dự án được sử dụng trong tập huấn luyện, AEi và PEi lần lượt là giá
trị nỗ lực thực sự và giá trị nỗ lực được ước lượng của dự án thứ i trong tập huấn luyện,
ATi và PTi lần lượt là giá trị thời gian thực sự và giá trị thời gian được ước lượng của dự
án thứ i.

3.3.2. Kết quả thực nghiệm
Bảng 5. Kết quả ước lượng nỗ lực sử dụng thuật toán ABC, TLABC, COCOMO II

Tiêu chí
đánh giá
MMRE
PRED(10)
PRED(20)
PRED(30)
PRED(40)

Nỗ lực
ABC
(%)

TLABC
(%)

21.68
42.86
62.29
75.00
82.14

Thời gian
COCOMO II
(%)

21.57
42.86

64.29
78.57
82.14

27.50
17.86
50.00
67.86
82.14

ABC
(%)

8.66
64.29
96.43
99.10
100

TLABC
(%)

8.29
71.43
96.43
100
100

COCOMO II
(%)


14.71
17.86
50.00
67.86
82.14

Từ Bảng 5. chúng ta nhận thấy rằng kết quả ước lượng nỗ lực của mô hình COCOMO
II với các tham số đã được tối ưu tốt hơn nhiều so với mô hình ban đầu về cả độ chính
xác của nỗ lực và thời gian. Cụ thể, giá trị MMRE đã giảm khoảng 6% khi các tham số
của mô hình được tối ưu bởi thuật toán ABC và TLABC. Chúng ta cũng thấy rằng kết
quả sử dụng tḥt tốn TLABC là tớt hơn kết quả của ABC. Điều này được nhận thấy rõ
nhất trên tiêu chí đánh giá PRED(10) đối với thời gian.
3.4. Phương trình toán học mới cho bài toán ước lượng nỗ lực phát triển cho các
phần mềm sử dụng quy trình Agile
3.4.1. Phương trình tốn học đề x́t
Dựa vào hai ́u tớ đầu vào đặc trưng của các phần mềm sử dụng quy trình Agile là
vận tốc của nhóm phát triển và tổng điểm story point, chúng tôi đề xuất một công thức để
ước lượng nỗ lực cho các phần mềm này như (23).
𝐸𝑓𝑓 =

𝐴×𝑆𝑃
𝐵×𝑉

+ 𝐶 × ln(𝑆𝑃 ) + 𝐷 × ln(𝑉 ) + 𝐸

(23)

trong đó: Eff giá trị nỗ lực được ước lượng trong đơn vị ngày, SP là giá trị của tổng điểm
story point, và V là vận tốc sau hiệu chỉnh của nhóm phát triển.

Mục đích của chúng tôi là xác định các giá trị A, B, C, D và E để cho kết quả ước
lượng gần nhất với kết quả nỗ lực thực tế. Dựa vào tập dữ liệu h́n luyện và các tḥt
tốn tới ưu, chúng ta có thể xác định được các giá trị cho các tham số này. Sau khi đã có
giá trị cho bộ tham số, với một dự án mới, chúng ta chỉ cần nhập Story point và vận tốc
vào công thức (23) sẽ có được kết quả ước lượng.
3.4.2. Tìm tham số tối ưu cho công thức ước lượng Agile sử dụng thuật toán ABC-PSO


Chương 3: Ứng dụng các thuật toán tối ưu vào bài toán ước lượng nỗ lực phát triển phần mềm 15

3.4.2.1. Biểu diễn cá thể của thuật toán và hàm thích nghi
Trong nghiên cứu này, mỗi cá thể được sử dụng trong thuật toán được biểu diễn như
sau: Xi = {Ai, Bi, Ci, Di, Ei}.
Sau khi thuật toán kết thúc nó sẽ trả về cá thể tốt nhất chứa các tham số mà kết quả
ước lượng của công thức (23) gần nhất với nỗ lực thực tế trên tập dữ liệu huấn luyện. Để
đánh giá tính tốt của mỗi cá thể trong śt q trình thực thi tḥt tốn, chúng ta sử dụng
hàm thích nghi như công thức (24).
𝑓 (𝑋𝑖 ) = 𝑀𝑀𝑅𝐸 (𝑋𝑖 ) + 𝑀𝐴𝑅(𝑋𝑖 )

(24)

trong đó: MMRE(Xi) và MAR(Xi) lần lượt là độ lớn trung bình của lỗi tương đối và số dư
tuyệt đối trung bình của cá thể Xi trên L dự án trong tập huấn luyện. Trong nghiên cứu
này chúng ta sẽ sử dụng 21 dự án Agile trong nghiên cứu của Zia [31] để đánh giá tính
hiệu quả của phương pháp đề xuất.
3.4.2.2. Kết quả thực nghiệm
Bảng 6. Kết quả ước lượng của các thuật toán tối ưu trên các tiêu chí đánh giá

MMRE (%)


MdMRE (%)

PRED(8) (%)

R2

MAR

ABC-PSO

5.69

3.33

66.67

0.9734

3.12

ABC

5.84

5.18

61.9

0.9732


3.15

PSO

6.69

7.14

61.9

0.9626

3.66

Hời quy của Zia

7.19

7.14

57.14

0.9638

4

Tḥt toán

3.5. Phân tích chức năng của chương trình
Dựa trên những kết quả lý thuyết đã đạt được, chúng tôi tiến hành xây dựng một phần

mềm hỗ trợ ước lượng nỗ lực cho các dự án phần mềm sử dụng quy trình truyền thống
CoCoMo và quy trình Agile. Chương trình xây dựng có các chức năng cơ bản sau:
+ Xem thông tin các dự án gồm cả CoCoMo và Agile, dự án đang triển khai và các dự
án đã kết thúc.
+ Tìm kiếm một dự án mới sử dụng các tiêu chí lọc kết quả khác nhau.
+ Tạo mới dự án, thay đổi thông tin dự án hoặc xóa các dự án khỏi cơ sở dữ liệu.
+ Ước lượng nỗ lực cần có của dự án dựa trên các yếu tố đầu vào.
+ Thiết lập cấu hình tham số cho các mô hình ước lượng nỗ lực một cách thủ công.
+ Tối ưu tự động các tham số của mô hình ước lượng.Thiết kế chương trình


Chương 3: Cài đặt, thử nghiệm và đánh giá kết quả

3.5.1. Biểu đồ ca sử dụng (Use case)

Hình 3. Biểu đồ Ca sử dụng (Use case)

16


Chương 3: Cài đặt, thử nghiệm và đánh giá kết quả

3.5.2. Biểu đồ tuần tự và hoạt động

Hình 4. Biểu đồ phân rã chức năng xem dự án

Hình 5. Biểu đồ tuần tự của chức năng ước lượng dự án

17



×