Tải bản đầy đủ (.pdf) (8 trang)

Dự báo thời gian sống sót của bệnh nhân ung thư vú di căn bằng mạng nơron và cây hồi quy một tiếp cận mới doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (203.04 KB, 8 trang )

dự BáO thời gian sống sót của bệnh nhân ung
th vú di căn bằng mạng nơron và cây hồi quy -
một tiếp cận mới
Trịnh Quốc Anh
2
, Bernard Assenlain
1
, Thu Hoàng
2

1
Institut Curie, Paris, France,
2
Université René Descartes, Paris, France

Chúng tôi đã phân tích số liệu thu đợc từ 1477 bệnh nhân nữ trên 18 tuổi bị ung th
vú biểu mô có di căn đợc điều trị bằng nhiều liệu pháp khác nhau tại Viện Curie, Paris
(Pháp) từ năm 1977 đến 1998 để nghiên cứu khả năng sống sót và sử dụng cây hồi quy
và mô hình mạng nơ ron trong đó có 15 nơ ron tiếp nhận thông tin từ 14 yếu tố đợc
chọn và có yếu tố thời gian để xác định nguy cơ tử vong thevooooôo thời gian của bệnh
nhân. Việc kết hợp hai phơng pháp thống kê để nghiên cứu thời gian sống sót của bệnh
nhân cho kết quả tốt hơn mô hình Cox và cho thấy mối liên quan tiềm ẩn giữa các yếu tố
tiên lợng bệnh.

I. Đặt vấn đề
Nghiên cứu về sự sống sót (survival
analysis) là một nghiên cứu quan trọng
trong điều trị bệnh, nhất là đối với những
bệnh hiểm nghèo vì nó giúp ngời thầy
thuốc có đợc những cải tiến hợp lý trong
quá trình điều trị bệnh nhằm kéo dài thời


gian sống của bệnh nhân. Ung th vú từ
lâu nay đã đợc xem là một căn bệnh
điển hình cần nghiên cứu sống sót và
ngày càng đợc quan tâm nhiều hơn, thể
hiện qua số lợng các công trình nghiên
cứu không ngừng tăng lên. Thống kê trên
toàn thế giới của National Library of
Medicine (Mỹ) theo chủ đề "Surival
analysis"và "breast cancer" cho thấy từ
năm 1998 đến năm 2001 số bài báo đã
tăng lên hơn 1,5 lần, từ 262 đến 418 bài.
Khó khăn lớn thờng gặp trong nghiên
cứu sống sót là việc mất thông tin về
bệnh nhân trong quá trình theo dõi điều trị
bởi các nguyên nhân khách quan không
mong muốn; ví dụ bệnh nhân bị tai nạn
giao thông hay chuyển chỗ ở. Một điều trị
có tỷ lệ mất thông tin cao sẽ gây ra sai
lệch lớn về ớc đoán thời gian sống sót
của bệnh nhân và do đó đánh giá sai hiệu
quả của điều trị.
Các nghiên cứu về sự sống sót thờng
sử dụng mô hình hồi quy của Cox (1) để
ớc lợng nguy cơ tử vong của bệnh nhân
(hazard) và từ đó dự báo thời gian sống
sót. Tuy nhiên, mô hình này khó thể hiện
đợc sự tác động qua lại tự nhiên giữa
các yếu tố nguy cơ của bệnh (risk factors)
và do vậy không đánh giá đợc chính xác
khả năng sống sót của bệnh nhân.

Với mục đích ứng dụng toán học và tin
học vào nghiên cứu sự sống sót của bệnh
nhân ung th vú biểu mô di căn, chúng tôi
tiến hành nghiên cứu này nằm giải quyết
các mục tiêu sau đây:
- Phân tích mối liên quan đơn biến và
đa biến giữa một số yếu tố với thời gian
sống sót của bệnh nhân ung th vú biểu
mô di căn.
- Mô tả mối liên quan tiềm ẩn giữa một
số yếu tố với sự sống sót bằng mạng nơ
ron.
- Xây dựng cây hồi quy dự báo thời
gian sống sót của bệnh nhân.

82
II. Đối tợng và phơng pháp
nghiên cứu
1. Số liệu:
Các số liệu đợc thu thập từ 1477
bệnh nhân nữ trên 18 tuổi bị ung th vú
biểu mô có di căn đợc điều trị tại Viện
Curie, Paris (Pháp) từ năm 1977 - 1998,
loại trừ các bệnh nhân sau:
- Bệnh nhân có số lợng bạch cầu đạt
dới 1,5 x 10
9
/L hay có số lợng tiểu cầu
dới 100 x 10
9

/L; trừ khi hiện tợng ức
chế tuỷ xơng là do chính tuỷ xơng.
- Bệnh nhân có nồng độ bilirubin cao
hơn ít nhất 1,5 lần nồng độ bình thờng,
có tiền sử bị suy tim ứ huyết, chỉ có di căn
ở não là bằng chứng có ung th lan toả.
Viện Curie đã sử dụng 8 thử nghiệm
khác nhau của hoá trị liệu cơ bản có
anthrracyclin để điều trị bệnh nhân bị ung
th vú biểu mô [7]. Các bệnh nhân đợc
đánh giá trớc khi đợc điều trị dựa trên
các kiểm tra kỹ lỡng về lâm sàng nh đo
các tổn thơng có thể sờ thấy đợc, đếm
các tế bào máu, thăm dò chức năng gan,
định lợng nồng độ các điện giải và canxi,
chụp X quang phổi, xơng. Trớc mỗi đợt
điều trị, các thông số của từng bệnh nhân
lại đợc cập nhật nhằm phát hiện các
triệu chứng mới hoặc triệu chứng bệnh
nhân lên đòi hỏi phải điều chỉnh liều. Các
tạng có thể bị di căn đợc chụp cắt lớp và
chụp X quang vào các tháng thứ 4, 8, 12,
18.
Hiệu quả của các thử nghiệm điều trị
đợc đánh giá theo các tiêu chuẩn của tổ
chức chống ung th quốc tế, nh:
- Điều trị đợc coi là có đáp ứng toàn
phần nếu các di căn đã đợc phát hiện
không còn nữa và là có đáp ứng một phần
nếu tích số của hai kích thớc dài nhất

vuông góc nhau của tổn thơng đo đợc
giảm đi ít nhất 50%.
- Nếu kích thớc khối di căn đo đợc
(trừ ở xơng) giảm dới 50% thì cho là
ung th ổn định, còn nếu kích thớc đo
đợc tăng lên trên 25% hoặc xuất hiện
tổn thơng mới thì cho là có ung th tiến
triển.
- Thời gian bệnh tiến triển đợc tính từ
lúc bệnh nhân đợc chọn ngẫu nhiên tới
lúc có ung th tiến triển hoặc tới ngày
theo dõi cuối cùng. Thời gian sống sót là
thời gian từ lúc đợc chọn ngẫu nhiên cho
đến lúc chết hoặc đến ngày cuối cùng
đợc theo dõi. Nếu chết trớc khi đợc
đánh giá đáp ứng thì đợc coi là ung th
tiến triển.
2. Điều trị ban đầu gồm có 900 ngời
đợc phẫu thuật (chiếm 63% tổng số
bệnh nhân) trong đó 281 ngời đợc cắt
bỏ tuyến vú, 619 ngời đợc cắt bỏ tuyến
vú và bóc phần ngực (lumpectomy). có
364 (25%) bệnh nhân không đợc mổ và
đợc điều trị bảo tồn bằng xạ trị hay điều
trị ngắn ngày. Tổng cộng có 115 (78%)
bệnh nhân dùng chiếu xạ nh là một điều
trị chính hay là một bổ trợ của điều trị. Có
166 (12%) bệnh nhân không đợc điều trị
tại chỗ vì có di căn sớm. Số bệnh nhân
đợc hoá trị liệu trớc là 446 (31%). Bệnh

nhân đợc lựa chọn theo trị liệu trớc dựa
trên đánh giá của thầy thuốc về nguy cơ
tái phát. Hoá trị liệu trớc bao gồm kết
hợp 5 - FU, foxorubicin,
cyclophosphamide ở 165 (39,4%) bệnh
nhân; CMF (cyclophosphamide,
methotrexate, 5-FU) ở 92 ngời (21,9%);
cyclophosphamide, melphalan,
methotrexate ở 98 ngời (23,4%). Có 64
bệnh nhân đợc điều trị bằng phối hợp
thuốc khác không có anthracycline
(15,3%) và 27 bệnh nhân đợc dùng hóa
trị liệu không theo kiểu đặc hiệu nào. Có
78 bệnh nhân cha dùng hoá trị liệu bổ
sung đã đ
ợc dùng tamoxifen.
3. Các yếu tố chính ảnh hởng đến
sự sống sót
Trên số liệu ung th kể trên, chúng tôi
chọn ra 14 yếu tố có ảnh hởng quan

83
trọng đến khả năng sống sót của bệnh
nhân ung th vú di căn. Các yếu tố này
(xem bảng 1) đợc số hoá theo các trị số
rời rạc trừ nồng độ LHD (trùng với kết quả
của Pierga et al. [7]:
- Các đặc điểm của bệnh nhân: tuổi
trên/dới 50, có/ không mãn kinh
(menopause) chỉ số Karnovsky trên/dới

60
- 10 thông số của bệnh bao gồm: thời
gian từ lúc chẩn đoán ung th đầu tới lúc
có di căn kí hiệu là DFI (disease free
interval) trong/ngoài khoảng 6 - 24 tháng,
có/không dùng xạ trị hoặc hoá trị trớc,
kích thớc của hạch lớn/nhỏ (nodal
involvement), cơ quan di căn (ở phổi,
màng phổi, gan, xơng, da) và số vị trí di
căn.
- Nồng độ LDH (lactic dehydrogenase)
Khả năng sống sót của bệnh nhân
đợc đo bằng thời gian sống sót. Đối với
một yếu tố có trị số rời rạc, kiểm định toàn
cục Wald đợc áp dụng để kiểm tra ảnh
hởng của các trị số khác nhau này lên
khả năng sống sót của bệnh nhân là có ý
nghĩa thống kê hay không và hệ số nguy
cơ tơng đối (Relative Risk - RR) là tỷ số
so sánh nguy cơ tử vong của bệnh nhân
khi nhận các giá trị rời rạc khác nhau đó.
4. Phơng pháp xây dựng mạng nơ
ron và cây hồi quy
Chúng tôi sử dụng mô hình mạng nơ
ron gồm 15 nơ ron tiếp nhận thông tin từ
14 yếu tố đã đợc chọn (bảng 1) và có
thêm yếu tố thời gian t để xác định nguy
cơ tử vong theo thời gian của bệnh nhân
[9]
III. Kết quả và bàn luận

1. Phân tích mối liên quan đơn biến
theo mô hình của Cox [1]
Các kết quả phân tích đợc trình bày ở
bảng 1.

Bảng 1: Phân tích đơn biến khả năng sống sót trên 1477 bệnh nhân bị ung th vú di
căn
Các yếu tố
(tên viết tắt)
Số quan
sát
Tỷ lệ %
Thời gian sống
sót (tính theo
trung vị)
Hệ số nguy cơ
tơng đối (với
khoảng tin cậy
95)
P
Tuổi theo năm lúc chẩn đoán ung th vú di căn (age)
< 50 625 42% 26 1,00
> 50 852 58% 23 1,12 (1,06-1,19) <,001
Mãn kinh (meno)
Không 761 52% 26 1,00
Có 707 48% 22 1,28 (1,15-1,43) <,001
Chỉ số Karnovsky (kar)
< 60 247 17% 26 1,00
> 60 1185 83% 11 2,11 (1,79 - 2,49) <,001



84

Hoá trị liệu bổ sung (chem)
Không 992 67% 26 1,00
Có 485 33% 20 1,39 (1,24 - 1,56) <,001
Xạ trị (irr)
Không 317 21% 26 1,00
Có 1160 79% 23 1,16 (1,01 - 1,32) ,029
Khoảng thời gian từ lúc chẩn đoán đến lúc có di căn (dfi) 32 (0-289)
> 24 tháng
hoặc < 6
tháng
1118 76% 27 1,00 <,001
Từ > 6 tháng
đến < 24
tháng
359 24% 16 1,85 (1,61 - 2,13) <,001
Mức độ xâm lấn của hạch (nodes)
N = 0 582 39% 29 1,00 ,68
N = 1a 181 12% 26 1,02 (0,93 - 1,11) <,001
N = 1b 481 33% 20 1,14 (1,09 - 1,19) ,28
N = 2 51 3% 17 1,05 (0,96 - 1,15) ,21
N = 3 49 3% 16 1,05 (0,97 - 1,14) <,001
Số vị trí bị di căn (nbs)
1 522 35% 30 1,00
2 410 28% 24 1,19 (1,12 - 1,27) <,001
>3 542 37% 18 1,12 (1,08 - 1,17) <,001
Di căn vào da (ski)
Không 1127 76% 24 1,00 <,001

Có 350 24% 22 0,88 (0,93 - 1,06) <,001
Di căn vào xơng (os)
Không 687 47% 24 1,00
Có 790 53%) 24 0,99 (0,93 - 1,06) 0,78
Di căn vào màng phổi (plev)
Không 1148 78% 25 1,00
Có 329 22% 19 1,11 (1,04 - 1,19) 0,003
Di căn vào phổi (lun)
Không 1126 76% 26 1,00
Có 351 24% 18 1,10 (1,03 - 1,18) 0,006
Di căn vào gan (liver)
Không 982 66% 28 1,00
Có 495 34% 17 1,36 (1,28 - 1,44) <,001
Nồng độ LDH, UI/l (ldh)
Giá trị liên tục 24 <,001

85
Trung vị của thời gian sống sót là 24
tháng kể từ ngày đợc chọn ngẫu nhiên cho
điều trị cơ bản. Thời gian theo dõi trung
bình là 155 tháng. Khoảng thời gian thông
thờng để có ung th tiến triển là sau 12
tháng. Độ tuổi bị tái phát ung th thờng
gặp là 53 tuổi (trong khoảng 23 - 79);
khoảng thời gian trung bình từ lúc chuẩn bị
ung th đầu tới lúc tái phát ung th là 32
tháng. Có 24% (351) bệnh nhân bị ung th
di căn ở phổi và trong số này có 150 bệnh
nhân (11%) bị di căn ở 2 chỗ.
2. Phân tích mối liên quan đa biến

(bảng 2)
Các kết quả trình bày trong bảng 2
chứng tỏ có mối liên quan rõ rệt (qua giá trị
p - value) giữa cơ quan bị di căn và số
lợng di căn nên khả năng sống sót của
bệnh nhân. Thật vậy, nếu chỉ có một cơ
quan bị di căn thì hệ số nguy cơ (RR) chỉ
phụ thuộc vào cơ quan đó và di căn vào
gan là yếu tố có ý nghĩa ảnh hởng đến khả
năng sống của bệnh nhân (RR = 1,76; p =
0,02). Trờng hợp có 2 nơi bị di căn thì hệ
số nguy cơ còn cao hơn nữa nếu có một vị
trí bị di căn là gan (RR = 2,58 p < 0,001 đối
lập với RR = 1,65; p = 0,028). Với trờng
hợp có 3 nơi bị di căn, ta cũng thu đợc kết
quả khác biệt tơng tự khi có 1 di căn ở gan
(RR = 3,43; p < 0,001) và khi không có di
căn nào ở gan (RR = 1,7; p = 0,02).

Bảng 2: Tác động của mối quan hệ vị trí - số lợng lên khả năng sống sót của
bệnh nhân ung th vú di căn
Vị trí di căn
Số
quan
sát
Tỷ lệ
%
Thời gian
sống sót
(tính theo

trung vị)
Hệ số nguy cơ
tơng đối (với
khoảng tin cậy
95)
P
< 0,01
Chỉ có di căn ở da 30 2% 30.5 1,00 ,02
Chỉ có di căn ở gan 93 7% 25 1,76 (1,09 - 2,85) ,17
Chỉ có di căn ở phổi 79 6% 25 1,42 (0,86 - 2,33) ,98
Chỉ có di căn ở màng
phổi
48 3% 51 0,99 (0,61 - 1,63) ,10
Chỉ có di căn ở xơng 207 15% 30 1,45 (0,93 - 2,28) ,028
Di căn ở 2 nơi, không bị ở
gan
260 18% 28 1,65 (1,06 - 2,59) <,001
Di căn ở 2 nơi, có di căn ở
gan
150 11% 17 2,58 (1,62 - 4,11) ,02
Di căn ở > 3 nơi, không bị
ở gan
290 21% 23 1,71 (1,09 - 2,69) <,001
Di căn ở > 3 nơi, có di
căn ở gan
252 18% 13 3,43 (2,16 - 5,43)

86
TCNCYH 24 (4) 2003


Kiểm định toàn cục Wald với p < 0,001 chỉ
ra rằng quan hệ bậc 2 vị trí - số lợng của di
căn là có ý nghĩa trong sự sống sót của bệnh
nhân. Các nghiên cứu khác của chúng tôi cũng
chứng minh rằng còn có nhiều mối quan hệ
khác giữa các yếu tố bệnh (trong bảng 1) ảnh
hởng lên khả năng sống sót của bệnh nhân.
Nh vậy, quan hệ vị trí - số lợng của di căn
ảnh hởng rất rõ đến nguy cơ tử vong của
bệnh nhân ung th vú biểu mô di căn. Ngoài
ra, Cutler et al [2] còn nêu lên tầm quan trọng
của vị trí bị di căn đầu tiên đối với tiên lợng
bệnh. Nhiều tác giả khác đã khẳng định rằng di
căn ở gan, ở tạng và ở não ít có giá trị tiên
lợng và di căn ở xơng có giá trị tiên lợng
hơn [6, 11]. Trong phân tích của chúng tôi thì
nồng độ LDH là một yếu tố tiên lợng chính.
Thông số này không đợc nói đến nhiều trong
các nghiên cứu trớc đây về tiên lợng ung th
vú nhng ý nghĩa lâm sàng của nó đã đợc đề
cập [10].
3. Mạng nơ ron và cây hồi quy trong
nghiên cứu về sự sống sót
Các kết quả thống kê trên (bảng 1, 2) cho
thấy rằng, khả năng sống sót của bệnh nhân
ung th vú di căn phụ thuộc vào rất nhiều yếu
tố và nhất là vào các quan hệ phức tạp khác
nhau của những yếu tố này. Ngoài ra cũng
phải kể đến mối tơng tác giữa một yếu tố với
một quan hệ để tạo thành một quan hệ mới

cấp cao hơn. Các phơng pháp thống kê
thờng sử dụng hiện nay trong nghiên cứu
sống sót nh mô hình của Cox, mô hình hồi
quy logistic [8] đều không có khả năng tự tìm
kiếm và phát hiện các tơng tác giữa các yếu
tố và chúng ta thờng phải dùng các mô hình
đó cùng với các quan hệ định trớc đợc lựa
chọn theo chủ quan của các thầy thuốc. Cách
làm này không thể đánh giá đợc toàn diện về
ăn bệnh nhất là với thời gian, khi giá trị của các
yếu tố không thể đa ra đợc kịp thời những
cải tiến điều trị theo sự phát triển của bệnh hay
tìm ra đợc một phơng pháp điều trị mới hiệu
quả nếu họ vẫn bị ràng buộc bởi những mô
hình cứng nhắc, chủ quan. Một mạng nơ ron
nhân tạo có thể khắc phục đợc các nhợc
điểm này.
Mô hình mạng nơ ron nhân tạo (artificial
neural network model) lần đầu đợc đa ra bởi
Mc Culloch và Pitts vào năm 1943 dựa trên ý
tởng của một mạng nơ ron sinh học: một nơ
ron thần kinh nhận các tín hiệu điện kích thích,
biến đổi và truyền chúng cho các nơ ron kế
cận để cuối cùng cơ thể cảm nhận đợc kích
thích và có phản ứng phù hợp. Mô hình nơ ron
McCulloch và Pitts (hình 1) mô tả mối quan hệ
giữa p kích thích tố x
1
, x
p

có độ mạnh yếu
tơng ứng là w
1
, ,w
p
với đáp ứng y của nơ ron.
Hình 1: mô hình nơ ron của McCulloch và
Pitts (1943) với hàm kích hoạt bậc thang
Nh vậy, nếu xem đáp ứng y là thông tin đi
ra (kết quả xử lý thông tin) của nơ ron thì y
cũng là tổ hợp của tất cả các thông tin và quan
hệ của p kích thích đầu vào x
1
, , x
p
. Nếu coi p
đầu vào này là p yếu tố bệnh và đầu ra y là
khả năng sống sót của bệnh nhân thì các
thông số của mạng nơ ron w
1
, w
2
cho ta biết
mức độ ảnh hởng của các yếu tố bệnh và
quan hệ giữa chúng đối với sự sống sót của
bệnh nhân. Ví dụ đơn giản này cho thấy rằng,
mạng nơ ron hoàn toàn có thể mô tả đợc
quan hệ phức tạp giữa các yếu tố bệnh (đầu
vào x) với khả năng sống sót của bệnh nhân
(đầu ra y) [3].

Để việc đánh giá thống kê đợc chính xác,
chúng tôi đã loại bỏ 269 bệnh nhân không có
đầy đủ các giá trị quan sát trên 14 yếu tố đã
nêu và còn lại 1028j bệnh nhân có ung th vú
di căn. Mạng nơ ron đợc học bằng phơng
pháp học Bayes (Bayesian learning) nhằm thu
đợc tất cả các thông tin cần thiết từ mọi bệnh
nhân, kể cả các bệnh nhân bị mất theo dõi
trong quá trình điều trị hay bị chết vì nguyên
nhân khác (censored cases). Để kiểm tra độ
chính xác của mạng nơ ron trong việc dự báo
thời gian sống sót, chúng tôi chia ngẫu nhiên
số bệnh nhân thành 2 tập: tập học (training
set) gồm 608 bệnh nhân dùng cho việc xác

87
TCNCYH 24 (4) 2003
định mạng nơ ron và tập thử (test set) gồm 600
bệnh nhân còn lại đợc dùng để kiểm nghiệm
kết quả dự đoán. Để đánh giá sự chính xác của
dự báo, chúng tôi sử dụng chỉ số c - index của
Harrell đo tỷ lệ dự báo đúng với kết quả quan
sát [4]. Các kết quả thu đợc chứng tỏ rằng mô
hình dạng nơ ron (0,664
< c-index < 0,690) cho
kết quả dự báo thời gian sống sót chính xác
hơn so với kết quả của mô hình Cox (0,657 <
c-index < 0,659) [5]
Mặt khác, để giúp thầy thuốc có thể xác
định đợc nguy cơ của từng bệnh nhân ngay từ

lúc điều trị ban đầu, chúng tôi đã xây dựng cây
hồi quy dự đoán thời gian sống sót dựa trên
các kết quả thu đợc từ mô hình mạng nơ ron
(hình 2)
Dựa trên cây hồi quy (hình 2) chúng tôi xây
dựng 3 nhóm tiên đoán phân loại bệnh nhân.
Nhóm bệnh nhân có thời gian sống sót dài hơn
cả (A) gồm những bệnh nhân không có di căn ở
gan, nồng độ LDH < 322 U/l, chỉ số Karnovsky >
60, không điều trị hoá trị liệu trớc và có thời gian
DFI rất ngắn hoặc rất dài. Nhóm có nguy cơ cao
nhất (C) là những bệnh nhân bị ung th di căn ở
gan, có nồng độ LDH >313 U/l hoặc ít hơn 313
U/l nhng có hơn 2 điểm bị di căn, thời gian DFI
ngắn hoặc dài. Những bệnh nhân còn lại thuộc
nhóm B. Khả năng sống sót của 3 nhóm này trên
tập kiểm định 600 bệnh nhân đợc mô tả bằng
đờng cong xác suất Kaplan Meier (hình 3) với
thời gian sống sót trung bình của nhóm nguy cơ
thấp (A) là 44 tháng, của nhóm nguy cơ cao (C)
là 15 tháng và của nhóm còn lại (B) là 23 tháng.
Ta cũng thu đợc kết quả thời gian sống sót
tơng tự trên tập học 608 bệnh nhân ban đầu: 45
tháng với nhóm A, 13 tháng với nhóm C và 23
tháng đối với nhóm B.
V. Kết luận
- Quan hệ vị trí - số lợng của di căn ảnh
hởng rất rõ đến nguy cơ tử vong của bệnh
nhân bị ung th vú biểu mô di căn.
- Mạng nơ ron dự báo khả năng sống sót tốt

hơn mô hình Cox nhờ khả năng tổ hợp đợc
các quan hệ tiềm ẩn giữa các yếu tố nhng nó
lại không thể hiện đợc tờng minh các quan
hệ này.
- Mô hình cây hồi qui sử dụng các kết quả thu
đợc từ mạng nơ ron cũng chỉ thể hiện đợc
phần nào các tơng tác có ý nghiã.
Chúng tôi hiện đang sử dụng một số mô
hình phân tích khác nh Randon Forest,
Support Vector Machine để so sánh với mô
hình mạng nơ ron.
Bài viết tuy sử dụng các nghiên cứu và số
liệu tại viện Curie (Pháp) nhng hy vọng sẽ giới
thiệu đợc một tiếp cận mới về nghiên cứu
sống sót ở Việt Nam trong nỗ lực nhằm đa
các ứng dụng của Toán học và Tin học vào lĩnh
vực Y tế cụ thể là điều trị bệnh nhân ung th
vú.
Tài liệu tham khảo
1. Cox DR. Regression model and life
tables (with discussion) J.Royal Statistical
Soiety B 1972; 34; 187 - 220.
2. Cutler SJ, Ardyce JA, Taylor SG III
Classification of patients with disseminate cancer
of the breast. Cancer 1969; 24: 861 - 9.
3. Farragi D, Simon R. A neural network
model for survival data. Statistics in Medecine
1995; 14; 73 - 82.
4. Harrell EF, Lee KL, and Mark đặc biệt.
Multivarite prognostic models: Issues in

Developing Models, Evaluating Assumptions
and Adequacy, and Measuring and Reducing
Errors, Statistic in Medecine 15 (1996) 361 -
387.
5. Hoang T, Trinh QA, Asselain B.
Construction and validation of a prognostic
model for metastatic breast cancer using
Bayesian neural network and regression tree.
Intelligent data Analysis in Medecine and
Pharmacology 2002, Workshop Notes, 37 - 43,
www.cs.uu.nl/~lucas/in damap
2002/indamap2002-proc.pdf.
6. Hortobagyi JY, Smith TL, Legha SS,
Swenerton KD, Gehan EA, Yap HY et al.
Multivariate analysis of prognostic factors in

88
TCNCYH 24 (4) 2003

metastatic breast cancer. J. Clin. Oncol 1983;
1: 776 - 86.
7. Pierga JY, Asselain B, Jouve M, et al.
Effect of Adjuvant Chemotherapy on Outome in
Patients with Metastatic Breast Carcinoma
Treated with Firstline Doxorubicin Containing
Chemotherapy. Cancer 2001: 91: 1079 -89.
8. Sargent DJ. Comparison of artificial
neural net work with other statistical
approaches: results from medical data sets.
Cancer 2001: 91 (8 Supp) piii: 1636 - 42.

9. Trinh QA, Hoang T, Asselain B. Neural
Network Models for Survival Analysis using
Bayesian Learning or Backpropagation. In:
Vidal T, Liberatore P, eds. STAIRS 2002 -
Starting Artificial Intelligence Researchers
Symposium. Amsterdam: IOS Press, 2002; pp
167 - 177.
10. Yamamoto N, Watanabe, T, Katsumata
N, et al. Construction and validation of a
practical pognostic index for patients with
metastatic breast cancer, J. Clin. Oncol 1998 ;
16: 2401 - 8.
11. Zinser JW, Hortobagyi GN, Buzdar AU,
et al Clinical course or breast cancer patiens
with lever metastases. J. Clin. Oncol. 1987; 5:
773 -82.

Summary
Survival data of metastasis breast cancer
prognosis by neural net works and regression tree
- a new approach
In this paper, we expose a new approach to metastasis breast cancer prognosis based on a
combination of two statistical learning methods, i.e. neural net works and regression tree, applied
to survival data. The two methods allow for interactions among prognostic factors such as the
number and the sites of the metastases.

89

×