Tải bản đầy đủ (.pdf) (51 trang)

thuật toán trong xử lý ảnh y tế

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (997.13 KB, 51 trang )

Mụclục
LỜIMỞĐẦU
Chương1:Kháiquátvềxửlýảnhvàxửlýảnhytế
1.1. Xửlýảnh
1.1.1. Xửlýảnhlàgì?
1.1.2. Mộtsốvấnđềtrongxửlýảnh
1.1.2.1. Mộtsốkháiniệm
a. Ảnhvàđiểmảnh
b. Mứcxámmàuvàhistogram
1.1.2.2. Nắnchỉnhbiếndạnghìnhhọc
1.1.2.3. Khửnhiễu
1.1.2.4. Chỉnhmứcxám
1.1.2.5. Tríchchọnđặcđiểm
1.1.2.6. Nhậndạng
1.1.2.7. Nénảnh
1.2. Xửlýảnhtrongytế
1.2.1. Giớithiệumộtsốchuẩnápdụngtronghệthốngthôngtinytế
1.2.1.1. ChuẩndữliệuvănbảnHL7
1.2.1.2. ChuẩnIHE
1.2.2. ChuẩnảnhytếDICOM
1.2.2.1. Kháiniệm
1.2.2.2. Lịchsửpháttriển
1.2.2.3. Cấutrúc
1.2.2.4. Tínhthíchnghi
1.2.2.5. GiaothứcDICOM
1.2.2.6. ThôngđiệpDICOM–DICOMMessage
1.2.2.7. MộtsốkháiniệmtrongDICOM
1.3. MộtsốvấnđềtrongxửlýảnhytếDICOM
1.3.1. KháiniệmvàcấutrúcảnhytếDICOM
1.3.2. Tómlượchìnhảnh
1.3.3. Mãhóavàđónggóiphầntửdữliệuđiểmảnh


1.3.4. Lưutrữhìnhảnh
1.3.5. Tổchứcluồngdữliệuđiểmảnh
Chương2:THUẬTTOÁNPHÂNTRONGXỬLÝẢNHYTẾ
2.1. Giớithiệumộtsốthuậttoánphâncụmdữliệu
2.1.1. Kháiniệmphâncụmdữliệu
2.1.2. Phânloạicácthuậttoánphâncụmdữliệu
2.1.3. ThuậttoánKmeans
2.1.3.1. Lịchsử
2.1.3.2. Thuậttoán
2.2. ThuậttoánKmeansứngdụngtrongphânlớpảnhytế
2.2.1. Mộtsốnhậnxét
2.2.2. ThuậttoánKmeansứngdụngtrongphânlớpảnhytế.
2.2.2.1. Đọc,chuẩnhóaảnh,lựachọnsốnhóm.
2.2.2.2. Gomnhóm,phânloạivùng
2.2.2.3. Phânloạixươngvàmạchmáu
2.2.2.4. Xuấtảnhkếtquả
2.2.3. KhókhănkhiápdụngthuậttoánKmeans
2.2.3.1. Đốivớicácbàitoánnóichung
2.2.3.2. Đốivớibàitoánphânlớpảnhytế
Chương3:Chươngtrìnhthửnghiệm
3.1. Bàitoán
3.2. Phântíchbàitoán
3.3. Mộtsốkếtquảchươngtrình
Phụlục:MộtsốkháiniệmtrongphầnthôngtinảnhDICOM
1. Cáckháiniệmcơbản

trongthôngtinảnhDICOM
1.1. Mãđầuvào
1.2. Têntàiliệu
2. Cácnguyêntắcmãhóacơbản

2.1. Phươngphápmãhóa
2.2. CácgiátrịthểhiệnVR
3. Cáckiểugiátrị
3.1. KiểuCONTAINER
3.2. KiểuTEXT
3.3. KiểuCODE
3.4. KiểuNUM
3.5. KiểuPNAME
3.6. KiểuDATE,TIME,vàDATETIME
3.7. KiểuUIDREF
3.8. KiểuCOMPOSITE
3.9. KiểuIMAGE
3.10. KiểuWAVEFORM
3.11. KiểuSCOORD
3.12. KiểuTCOORD
3.13. Cáckiểudữliệukhác.
PHẦNKẾTLUẬN
TÀILIỆUTHAMKHẢO
LỜIMỞĐẦU
Bước vào thế kỉ XXI, Công nghệ thông tin bùng nổ vô cùng mạnh mẽ. Khoa              
học công nghệ cao đóng vai trò quan trọng không chỉ trong phát triển kinh tế mà               
còn trong việc cải thiện nâng cao chất lượng cuộc sống của người dân. Cùng với sự               
gia tăng dân số lên đến 8 tỉ người trên toàn thế giới, các dịch vụ y tế cũng yêu cầu                   
phải được cải thiện và nâng cao. Trong đó, việc áp dụng khoa học công nghệ vào               
lĩnh vực y tế là lựa chọn tốt nhất cho mọi quốc gia, mọi nền kinh tế. Áp dụng khoa                  
học công nghệ vào lĩnh vực y tế trước hết sẽ nâng cao chất lượng phục vụ cũng                
như cải thiện khả năng điều trị cho bệnh nhân. Điều này rút ngắn các thủ tục               
hành chính và thời gian cho bệnh nhân. Từ đây mà tiết kiệm được chi phí,              
giảiquyếtbàitoánkinhtếlớn.(chủngữ,vịngữ)
Do đó, mục đích nghiên cứu của đề tài này là tìm cách đưa ra các chẩn đoán                

nhanh nhất thông qua việc phân lớp ảnh y tế tích hợp chuẩn DICOM. Ở đây, ta sẽ                
tìm hiểu những điều cơ bản về chuẩn DICOM, tổ chức thông tin đính kèm về ảnh               
và thuật toán Kmeans phân lớp ảnh. Các thông tin về chuẩn DICOM sẽ cho ta              
hình dung cơ bản nhất về lịch sử, các qui định được định nghĩa trong tiêu chuẩn và                
tính thích nghi của nó. Ta cũng sẽ tìm hiểu một số vấn đề khi thao tác với ảnh                 
DICOM. Các thông tin được đính kèm ảnh trong định dạng tệp tin DICOM, cách             
tổ chức, kiểu dữ liệu, phương pháp mã hóa, cũng sẽ được đề cập đến. Ở đây,              
thuật toán Kmeans sẽ được áp dụng để phân lớp ảnh y tế. Tại sao lại lựa chọn                
thuật toán Kmeans, áp dụng như thế nào, ưu nhược điểm khi áp dụng thuật toán              
Kmeans cũng sẽ được làm rõ. Dựa trên cơ sở lý thuyết ở trên để đưa ra được                
chươngtrìnhứngdụngđọcảnhytếDICOMvàphânlớpảnhnày.
Cấutrúccủakhóaluậngồm3chươngvàmộtphầnphụlục:
Chương1:Kháiquátvềxửlýảnhvàxửlýảnhytế.
Chương này đưa ra khái niệm những vấn đề chung nhất trong xử lý ảnh             
và đề cập đến các thông tin cơ bản về chuẩn DICOM. Từ đó chỉ ra các vấn                
đềgặpphảitrongviệcthaotácvớiảnhytế.
Chương2:Thuậttoánphâncụmtrongxửlýảnhytế.
Chương này giới thiệu một số thuật toán phân cụm dữ liệu và làm rõ             
phầnápdụngthuậttoánK–meansvàobàitoánphânlớpảnhytế.
Chương3:Chươngtrìnhthửnghiệm.
Chương này nêu ra bài toán, phân tích và xây dựng chương trình ứng            
dụng. Chương trình ứng dụng nhằm giải quyết hai yêu cầu của bài toán là             
đọcảnhDICOMvàphânlớpảnhđọcđược.
Phụlục:MộtsốkháiniệmtrongphầnthôngtinảnhDICOM.
Phần này đề cập đến một số khái niệm, phương thức mã hóa và các             
kiểugiátrịtrongphầnthôngtinảnhDICOM(phầntiêuđềảnh).
Lờicảmơn
Trong suốt quá trình thực hiện đề tài này, em đã nhận được dự giúp đỡ rất               
nhiềutừthầycôvàbạnbè.
Em xin được gửi tới thầy PGS. TS Đỗ Năng Toàn lời cảm ơn chân thành              

và sâu sắc nhất. Em cảm ơn thầy đã luôn tận tình chỉ dạy, hướng dẫn và định                
hướngchoem.
Em xin gửi lời cảm ơn đến gia đình em đã luôn tạo điều kiện tốt nhất cho em                 
họctậpvànghiêncứu.
Em xin gửi lời cảm ơn đến bạn bè em đã giúp đỡ và chia sẻ những khó khăn                 
trongsuốtquatrìnhthựchiệnđềtài.
Chương1:Kháiquátvềxửlýảnhvàxửlýảnhytế
1. Xửlýảnh
1. Xửlýảnhlàgì?
1
Xử lý ảnh là một lĩnh vực trong CNTT nhằm thao tác ảnh đầu vào và              
đưarakếtquảmàtamongmuốn.
Ảnh là một thể hiện của một đối tượng lên máy tính càng giống tật             
càng tốt. Ảnh có nhiều dạng thể hiện khác nhau như đen trắng, màu, video,             
hình ảnh 3D, Mỗi điểm ảnh biểu diễn cường độ sáng hay một dấu hiệu nào              
đó tại một vị trí xác định nào đó của đối tượng trong không gian. Ta có thể                
hiểu,ảnhtrongxửlýảnhlàảnhn–chiều.
Xử lý ảnh là vô cùng quan trọng bởi hơn 80% thông tin chúng ta cần              
xử lý là hình ảnh. Sự phát triển của xử lý ảnh gắn liền với nhu cầu xử lý thông                  
tincủaconngườivàsựpháttriểncủaphầncứngmáytính.
Vậy,mộthệxửlýảnhsẽnhưthếnào?Tasẽxemxétsơđồsau:
1
.PGS.TSĐỗNăngToàn,PhạmViệtBình(2007),GiáotrìnhmônXửlýảnh,Đại
họcTháiNguyên.
● Thunhận:thôngquacácthiếtbịnhưcamera,scanner,sensar,
● Tiềnxửlý:thựchiệnviệcnắnchỉnh,xóanhiễu,
● Hậuxửlý:rútgọn,chínhxáchóa,
2. Mộtsốvấnđềtrongxửlýảnh
1. Mộtsốkháiniệm
a. Ảnhvàđiểmảnh

● Điểm ảnh biểu diễn cường độ sáng hay một dấu hiệu nào đó tại một vị trí               
xácđịnhnàođócủađốitượngtrongkhônggian
● Ảnhlàtâphợpcácđiểmảnh.
Hai mô hình biểu diễn ảnh cơ bản là RASTER và VECTOR, ngoài ra            
còncómôhìnhkếthợp3D.RASTERtốnkémbộnhớhơnVECTOR.
b. Mứcxámmàuvàhistogram
● Với ba màu cơ bản là RED(R), GREEN(G), BLUE(B) (0 ≤ R, G, B ≤             
255) nếu R = G = B thì màu này được gọi là màu xám. Mức xám của một                 
ảnhIlàsốgiátrịcóthểcócủađiểmảnhtrongảnhI.
● Histogram ( biểu đồ tần suất) của mức xám g trong ảnh I là số điểm ảnh               
cócủaIcógiátrịg,kíhiệulàh(g).
2. Nắnchỉnhbiếndạnghìnhhọc
Ảnh thu được sau quá trình thu nhận ảnh thường không tránh được sự            
biến dạng bởi các thiết bị quang hoặc điện tử, đôi khi là do bản thân đối               
tượng. Để biến đổi ảnh thu nhận về ảnh mong muốn, cách thông thường là sử              
dụngcácphépchiếuđượcxâydưngtrêntậpcácđiểmđiềukhiển.
Tacầntìmhàmf:P
i
f(P
i
)saocho:
Giả sử ảnh bị biến đổi chỉ bao gồm bị tịnh tiến, tỉ lệ, xoay, biến dạng, bậc                
nhất.Khiđóhàmfcódạng:
Tacó:
Giải phương trình ta tìm được a
1
, b
1
, c
2

. Tương tự ta tìm được a
2
, b
2
, c
2.
Xác               

địnhđượchàmf.
3. Khửnhiễu
Ảnh thu được sau quá trình thu nhận ảnh không tránh được nhiễu bởi            
các thiết bị quang học hay điện tử. Có hai loại nhiễu cơ bản là nhiễu hệ thống                
vànhiễungẫunhiên.
● Nhiễu hệ thống là những nhiễu sinh ra có tính qui luật do thiết bị hoặc ảnh               
củanguồnsángngoạilai.Loạinhiễunàydễkhửbằngcácphépbiếnđổi.
● Nhiễu ngẫu nhiên là các vết “bẩn” không rõ nguyên nhân. Nhiễu này khó            
khử do nó không có tính qui luật nào. Tùy từng loại ảnh mà ta chọn              
phươngphápkhửphùhợp,phươngphápchunglàsửdụngphéplặp.
4. Chỉnhmứcxám
Chỉnh mức xám nhằm khắc phục tính không đồng đều của hệ thống           
gây ra. Việc chỉnh mức xám bao gồm việc tăng hay giảm mức xám của ảnh              
cho phù hợp với nhu cầu sử dụng. Việc giảm mức xám được thực hiện để              
phụcvụchoviệcinấn,tăngmứcxámsửdụngchokỹthuậtnộisuy.
5. Tríchchọnđặcđiểm
Các đặc điểm của đối tượng được trích chọn tùy thuộc vào yêu nhu            
cầu sử dụng, mục đích nhận dạng trong xử lý ảnh. Ảnh có một số đặc điểm               
sauđây:
● Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ, điểm             
uốn,
● Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực             

hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc            
điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ            
nhật,tamgiác,cungtrònv.v )
● Đặc điểm biên và đường biên: (chủ ngữ)Đặc trưng cho đường biên của           
đối tượng và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất              
biến được dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được             
trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử             
“chéokhông”(zerocrossing)v.v
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các            
đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ               
giảmxuống.(câunàyrấtcụt)
6. Nhậndạng
Gồm3pha:
● Pha1:Biểudiễnđốitượng
● Pha2:Tríchchọnđặcđiểm
● Pha3:Đốisánhvàkếtluận
Bốncáchtiếpcậnkhácnhautronglýthuyếtnhậndạnglà:
● Đốisánhmẫudựatrêncácđặctrưngđượctríchchọn
● Phânloạithốngkê
● Đốisánhcấutrúc
● Phânloạidựatrênmạngnơronnhântạo
Rõ ràng là không thể sử dụng một phương pháp để đưa ra phân loại             
tối ưu, do đó trên thực tế, ta cần đồng thời áp dụng nhiều phương pháp và               
cáchtiếpcận.
7. Nénảnh
Nén ảnh trong máy tính nhằm tiết kiệm bộ nhớ và giảm thời gian xử lý.              
Có thể nén ảnh bảo toàn hoặc không bảo toàn. Nén ảnh bảo toàn thì ảnh sau               
khi nén giống hệt ảnh ban đầu, còn đối với nén ảnh không bảo toàn thì ảnh               
sau khi nén và trước khi nén có sự sai khác trong mức cho phép. Có bốn               
cáchtiếpcậncơbảntrongnénảnh:

● Nénảnhkhônggian
● Nénảnhthốngkê
● Nénảnhsửdụngphépbiếnđổi
● NénảnhFractal
2. Xửlýảnhtrongytế
1. Giớithiệumộtsốchuẩnápdụngtronghệthốngthôngtinytế
1. ChuẩndữliệuvănbảnHL7
HL7 là một chuẩn dữ liệu văn bản. Thuật ngữ Health Level Seven được            
phát triển vào năm 1987, được dùng riêng cho việc trao đổi thông tin y tế,              
giúp cho việc truyền thông tin trong y tế được thuận lợi và đơn giản hơn.              
Chuẩn HL7 được sử dụng rộng rãi ở nhiều quốc gia như Úc, Phần Lan, Đức,              
Hà Lan, Nhật Bản, New Zealand, Áo, Mỹ,… Tháng 6/1994, HL7 được ANSI           
xemxétvàđượccôngnhận,chấpnhậnsửdụngnhưmộtchuẩnchínhthức.
HL7cónhiềuphiênbản:
● Phiên bản 2.2 được đưa ra vào tháng 12/1994, được ANSI chấp nhận vào            
8/2/1996.
● Phiên bản 2.3 được đưa ra vào tháng 4/1997, được ANSI chấp nhận vào            
13/5/1997. Chuẩn HL7 version 2.3 hỗ trợ ADT, văn bản quản trị bênh           
nhân PAD, các yêu cầu, báo cáo kết quả, theo dõi y tê, quản lý báo cáo y                
tế MRM, sao chép, lập kế hoạch, báo cáo trắc nghiệm y tế CTR, báo cáo              
sự kiện có hại AER, tình hình tài chính, các dịch vụ chăm sóc bệnh             
nhân…
● Phiên bản 3.0 được công bố năm 2001. Phiên bản này khắc phục được            
một số nhược điểm của những phiên bản 2.x như tiến trình tích hợp dữ             
liệu phức tạp, có sự xung đột giữa các đặc tính kĩ thuật, khó khăn trong              
việc đánh giá tiến trình thực hiện, việc mở rộng là một tùy chọn, thiếu             
chức năng hỗ trợ cho việc bảo mật, thiếu các chức năng hỗ trợ cho công              
nghệmớinhưWEB,XML.
HL7 cung cấp các phương thức để trao đổi, quản lý và tích hợp dữ             
liệu y tế điện tử thuộc chẩn đoán hoặc quản lý cho dữ liệu không phải hình               

ảnh. HL7 tạo ra “khả năng tương thích giữa các hệ thống quản lý bệnh nhân              
điện tử, hệ thống quản lý phòng khám, hệ thống thông tin phòng xét nghiệm,             
nhà ăn, nhà thuốc, phòng kế toán cũng như hệ thống bản ghi sức khỏe điện              
tử và hệ thống bản ghi y tế điện tử. HL7 có thể cung cấp miễn phí nhưng bản                 
quyềnkhánghiêmngặt.
2. ChuẩnIHE
Trên thực tế, các hệ thông tin trong bệnh viện vô cùng phức tạp. Khi             
áp dụng các hệ thống tiêu chuẩn sẽ gây ra sự không đồng nhất, thậm chí              
xung đột. IHE – Intergrating the Healthcare Enterprise là một giải pháp được           
đưa ra để lấp đi khoảng cách giữa thực tế và lý thuyết trong hệ thống thông               
tin ở bệnh viện. IHE giải quyết tình trạng “đa dạng không đồng nhất” của hệ              
thống thông tin bằng cách làm giảm sự khác biệt, phối hợp các tiêu chuẩn             
hiệncó.
IHE được phát triển bởi RSNA và HIMSS. Bản thân IHE không phải           
là một tiêu chuẩn mà nó chỉ đưa ra những qui trình thực hiện và cách thức               
giao dịch. IHE tích hợp các qui trình giả quyết trong một tổ chức y tế, sử               
dụngtiêuchuẩnDICOMvàHL7.
IHE đưa ra các “proffile” tích hợp hướng dẫn các thông tin qui trình            
làm việc dựa vào các tiêu chuẩn có sẵn như DICOM và HL7. Profile sẽ giúp              
việcứngdụngcáctiêuchuẩnhiệuquảnhất.
2. ChuẩnảnhytếDICOM
1. Kháiniệm
DICOM được viết tắt từ Digital Imaging and Communications in        
Medicine Standars (tiêu chuẩn ảnh số và truyền thông trong y tế) là một hệ             
thống tiêu chuẩn công nghiệp được phát triển nhằm đáp ứng nhu cầu của của             
các nhà sản xuất cũng như người sử dụng trong việc kết nối, lưu trữ, trao đổi,               
in ấn ảnh y tế mà không phụ thuộc vào nhà sản xuất. DICOM định nghĩa ra               
các qui tắc định dạng và trao đổi hình ảnh y tế cũng như các thông tin liên                
quan. Nó tạo ra một ngôn ngữ chung cho phép giao tiếp giữa hình ảnh và các               
thôngtinytếliênquangiữacácthiếtbịvàhệthốngmạngthôngtinytế.

DICOM không phải là một định dạng ảnh hay một định dạng tập tin.            
Nó bao gồm tất cả các qui tắc truyền dẫn, lưu trữ, hiển thị dữ liệu được xây                
dựngvàthiếtkếđểphùhợpvớimọithiếtbịthôngtinytế.
2. Lịchsửpháttriển
Vào những năm 70 của thế kỷ XX, cùng với sự ra đời của máy tạo ảnh               
chẩn đoán và sự phát triển mạnh mẽ của công nghệ thông tin và khoa học              
máy tính, ảnh số trong y tế với nhiều định dạng khác nhau đã yêu cầu cần               
phải có một chuẩn định dạng chung nhằm đảm bảo tốt nhất việc tuyền tải             
thông tin và giao tiếp giữa các thông tin này. Đứng trước yêu cầu đó,             
American College of Radiology – ACR và The National Elictrical        
Manufactures Association – NEMA đã thành lập một ủy ban chung vào năm           
1983 nhằm đưa ra và phát triển một chuẩn ứng dụng trong hệ thống thông tin              
ytếgọilàACR–NEMA.
Chuẩn ACRNEMA ra đời nhằm tạo điều kiện cho các thiết bị tạo ảnh            
của các nhà sản xuất khác nhau có thể trao đổi và chia sẻ thông tin trong môi                
trường thông tin ảnh y tế, đặc biệt là môi trường PACS. Chuẩn này tập trung              
vào kết nối, truyền thông và trao đổi giữa các hệ thống y tế. Phiên bản đầu               
tiên ra đời năm 1985. Phiên bản đầu tiên này đã xác định việc truyền bản tin               
điểm – điểm, định dạng dữ liệu và một số lệnh. Phiên bản thứ hai ra đời năm                
1988 định nghĩa phần cứng và giao thức phần mềm cũng như từ điển dữ liệu              
chuẩn. Nhưng vấn đề kết nối mạng vẫn chưa rõ ràng, đến phiên bản thứ ba              
cótênlàDICOMđãkhắcphụcđượcđiềunày.
Để đảm bảo tính thích ứng giữa các tiêu chuẩn, người ta tập hợp các             
mô đun phần mềm tạo nên thư viện mã hóa. Một thư viện mã hóa ưu việt thì                
cầncócácđặctínhsau:
● Sửdụngchungchocácthiếtbịtạoảnhcủacácnhàsảnxuấtkhácnhau
● Thíchứngvớicácnềnphầncứngkhácnhau
● Kiếntrúcphầnmềmdựctheohướngtiệpcậntopdown
● Ngônngữlậptrìnhchuẩn.
3. Cấutrúc

2
Cấu trúc của DICOM, theo phiên bản được cập nhật năm 2011 gồm           
cácthànhphầnsau:
● Comformance:Quichuẩn.
● InformationObjectDefinitions:Địnhnghĩađốitượngthôngtin.
● ServiceClassSpecifications:Cácđặctảvềlớpdịchvụ.
● DataStructuresandEncoding:Cấutrúcdữliệuvàmãhóa.
● DataDictionary:Từđiểndữliệu.
● MessageExchange:Traođổithôngđiệp.
2
.www.medical.nema.org/dicom.
● Network Communication Support for Message Exchange: Hỗ trợ giao tiếp        
thôngđiệpthôngquamạng.
● Media Storage and File Format for Media Interchange: Thiết bị lưu trữ và           
địnhdạngtệptincho
● MediaStorageApplicationProfiles:Bộứngdụnglưutrữtruyềnthông.
● Media Formats and Physical Media for Media Interchange: Định dạng môi         
trườngvàtruyềnthôngvậtlýchotraođổitruyềnthông.
● GrayscaleStandardDisplayFunction:Hàmhiểnthịchuẩnmứcxám.
● Security and System Management Profiles: Bộ các chuẩn bảo mật và tham          
chiếuđốitượng
● ContentMappingResource:Nguồnthamchiếuđốitượng
● ExplanotaryInformation:Thôngtinchúgiải.
● Web Acesss to DICOM Persistent Objects: Truy cập web đối với đối tượng           
DICOMnhấtquán
● ApplicationHosting:Ứngdụnglưutrữ.
4. Tínhthíchnghi
Một thành phần quan trọng của bất cứ một chuẩn nào là phải định            
nghĩa tính thích nghi với nó, hay nói cách khác là tính tuân thủ những điều              
mà chuẩn đề ra. Trong nhiều trường hợp khác như chuẩn DICOM chẳng hạn,            

sự thích nghi là hoàn toàn tự nguyện. Ủy ban của chuẩn DICOM không tạo             
ra bất cứ sự áp đặt nào. Mặc dù vậy, DICOM vẫn có một phần dành riêng               
đểquyđịnhsựthíchnghi.
Mọi nhà sản xuất có thể kiểm tra hay chứng minh thiết bị phần mềm             
của mình thích nghi với tiêu chuẩn DIOCM bằng một báo cáo thích nghi đơn             
giản do DICOM đề ra. Người sử dụng và nhà sản xuất muốn kiểm tra xem              
hai thiết bị hay phần mềm có ăn khớp với nhau trong chuẩn DICOM hay             
không thì cần đối chiếu hai bản báo cáo thích nghi. Những người làm            
DICOM có thể xác định chính xác khả năng hoạt động đồng thời của hai ứng              
dụng.
CácnộidungcơbảntrongbáocáothíchnghiDICOMgồm:
● Mô hình thực thi ứng dụng: Mô hình thực thi (Implementation Model) của           
ứng dụng là một lược đồ đơn giản thể hiện cách mà một ứng dụng liên kết với                
phạm vi cục bộ trong một thiết bị được đưa ra và từ xa thông qua giao diện                
DICOM. Ví dụ, hoạt đông cục bộ có thể tao ra một đối tượng thông tin ảnh               
DICOM,cònhoạtđộngtừxalàhiểnthịđốitượngđó.
● Ngữ cảnh thể hiện được sử dụng: Bao gồm cú pháp trừu tượng và cú pháp              
chuyển đổi tương ứng. Thuật ngữ cú pháp trừu tượng được sử dụng trong            
phần này vì nó được định nghĩa trong một chuẩn quốc tế khác mà DICOM             
tham chiếu đến. Một bản báo cáo thích nghi DICOM sẽ liệt kê cả ngữ cảnh              
cả ngữ cảnh thể hiện mà ứng dụng đưa ra trong thỏa thuận cũng như khi đã               
đượcchấpthuận.
● Cách liên kết thực hiện: Bản báo cáo thích nghi phải miêu tả sử thực hiện liên               
kết (ví dụ như là khi nào tạo các liên kết và chấp nhận nhiều liên kết) cho                
từng hoạt động trong mô hình. Một số thiết bị như thiết bị lưu trữ trong hệ               
thốngPACSphảiđượchổtrợnhiềuliênkếtnếuchúngđượcchấpnhận.
5. GiaothứcDICOM
3
● Các ứng dụng DICOM giao tiếp thông tin với nhau qua các dịch vụ DICOM             
và sử dụng giao thức DICOM để truyền tải thông tin. Giao thức DICOM dựa             

trênTCP/IPđểtruyềntảidữliệu.
● KiếntrúccủagiaothứcDICOM:
● DịchvụDICOM:
4
3
.NationalElectricalManufacturersAssociation(2011),PS3.72011,Digital
ImagingandCommunicationsinMedicine(DICOM),Part7–Message
Exchange,pp.7.
4
.NationalElectricalManufacturersAssociation(2011),PS3.72011,Digital
ImagingandCommunicationsinMedicine(DICOM),Part7–Message
Exchange,pp.9.
● Đểcácứngdụngcóthểgiaotiếp,traođổithôngtinvớinhauthìcần
thôngquacácdịchvụDICOM.Mỗimộtdịchvụsẽphụcvụchomột
côngviệccụthể,phânbiệt.
● MỗimộtứngdụngDICOMkhitraođổithôngtinquamạngcầnsử
dụngmộtdịchvụdụngtươngứng,dịchvụnàyđượcgọilàService
Provider.ỨngdụngDICOMtraođổidữliệuvớiServiceProviderđể
lấythôngtinhayyêucầuthựchiệnmộtcôngviệccụthể.Service
ProvidercóthểtựthựchiệnyêucầuhoặcchuyểnyêucầuđếnService
Providerkhác,khiđó,ServiceProvidernàyđóngvaitrònhưmộtứng
dụngDICOM.
● HailớpdịchvụcủaDICOM
● DịchvụDIMSEvàAssociation:lànơiứngdụngDICOMtrao
đổidữliệutrựctiếp.
● DịchvụUpperLayer:Chịutráchnhiệmchuyểnthôngtinthành
cácchuỗibyteđểtruyềnquamạngvànhậnchuốibytetừmạng
sauđóđóngthànhthôngtinđểchuyểnđếnAssociationvà
DIMSE.
6. ThôngđiệpDICOM–DICOMMessage

5
Thông tin có trong thông điệp DICOM sẽ được truyền đi qua giao thức            
mạngDICOM.MộtthôngđiệpDICOMcócấutrúcnhưsau:
7. MộtsốkháiniệmtrongDICOM
6
● Data Set: là thành phần cấu trúc cơ bản của một tệp tin DICOM, mỗi một              
DataSetchứanhiềuDataElement.
● Data Element: là một đơn vị thông tin trong DICOM, chứa một thông tin đầy             
đủ. Các field trong Data Element có nhiệm vụ đặc tả đầy đủ một thông tin              
baogồm:ýnghĩa,giátrịđộdài,địnhdạngdữliệu.
● Tag : là một cặp số nguyên không dấu, mỗi số có độ dài 16 bit. Cặp số                
nguyên này xác định ý nghĩa của Data Element như tên bệnh nhân, chiều cao             
5
.NationalElectricalManufacturersAssociation(2011),PS3.72011,Digital
ImagingandCommunicationsinMedicine(DICOM),Part7–Message
Exchange,pp.10.
6
.NationalElectricalManufacturersAssociation(2011),PS3.52011,Digital
ImagingandCommunicationsinMedicine(DICOM),Part5–DataStructures
andEmcoding,pp.1315.
ảnh, số bit màu Một số xác định Group Number, số còn lại xác định             
Element Number. Các thông tin Data Element cùng liên quan đến một nhóm           
ngữnghĩasẽcóchungsốGroupNumber.
● VR – Value Representation: đây là một field tùy chọn, tùy vòa giá trị Tranfer             
Syntax mà VR có mặt trong Data Element hay không. VR cho biết kiểu dữ             
liệuvàđịnhdạnggiátrịcủaDataElement.
● VM – Value Multiplicity: Cho biết số lượng Value của Value Field nếu Value            
Field có nhiều giá trị. Nếu số lượng Value không xác định thì VM sẽ có dạng               
“ab” với a là số giá trị Value nhỏ nhất, b là số giá trị Value lớn nhất có thể có                   
của Data Element. Nếu Value Field có nhiều giá trị thì đối với xâu kí tự “\”               

làm phân cách (chấm phẩy thêm vào), đối với giá trị nhị phân thì không có kí               
tựphâncách.
● VL – Value Length: Là một số nguyên không dấu, có độ dài 16 hay 32 bit.               
Giá trị VL cho biết độ lớn của Value Field. Nếu chiều dài không xác định thì               
ValueLengthlàFFFFFFFh.
● Value Field: là nội dung của Data Element. Kiểu dữ liệu của field này do VR              
quiđịnhvàđộlớntínhtheobytenằmtrongVL.
● Tranfer Syntax: là bộ qui ước định dạng dữ liệu. Giá trị của Tranfer Syntax             
cho biết cách dữ liệu được định dạng và mã hóa trong DICOM đồng thời             
cònchobiếtVRcótồntạitrongDataElementhaykhông.
● IOD – Information Object Definition: IOD đại diện cho một đối tượng chứa           
thôngtinvàđốitượngnàycótồntạitrongthếgiớithực.Có2loạiIOD:
● Composite IOD là đại diện cho những phần khác nhau của các đói           
tượngkhácnhautrongthếgiớithực.
● NormalizeIOD:IODchođốitượngduynhấttrongthếgiớithực.
● SOP – Service Object Pair Class: lớp SOP được tạo ra khi ghép một IOD             
vớiDIMSEServicedànhchoIODđó.CóhailoạiSOP:
● NomarlizedSOP=NormalizedIOD+DIMSEN
● CompositeSOP=CompositeIOD+DIMSEC
● Little Endidan: Thứ tự sắp xếp các byte trong file.(cái này là 1 câu à? hay là               
giải nghĩa cho cái j? Nếu là 1 câu thì k có nghĩa.Nếu là giải thích cho cụm từ                 
đằng trước thì k ai viết như m) Đối với chuỗi nhị phân gồm nhiều byte thì               
byte có trọng số thấp nhất sẽ nằm trước, những byte còn lại có trọng số tăng               
dần nằm tiếp dau đó. Đối với chuỗi kí tự thì các kí tự sẽ xuất hiện theo thứ                 
tựtừtráisangphải.
● Big Endian: Thứ tự sắp xếp các byte trong file. Đối với dãy nhị phân gồm              
nhiều byte thì các byte được sắp xếp theo thứ tự giảm dần của trọng số, byte               
có trọng số lớn nhất sẽ đứng đầu tiên. Đối với chuỗi kí tự, các kí tự sẽ xuất                 
hiệnlầnlượttheothứtựtừtráisangphải.
3. MộtsốvấnđềtrongxửlýảnhytếDICOM

1. KháiniệmvàcấutrúcảnhytếDICOM
● Khái niệm: Một bức ảnh y tế định dạng DICOM không chỉ chứa các            
thông tin về màu, pixel ảnh như các bức ảnh thông thường mà nó còn             
chứa đầy đủ các thông tin nơi chụp, tên bệnh nhân, thiết bị chụp, bộ phận              
đượcchụp,chẩnđoáncủabácsĩ
● Cấutrúc:
DICOMHeader
DICOMData
MộtđịnhdạngảnhDICOMcócácthànhphầnsau:
● Phần tiêu đề chứa toàn bộ các thông tin về bệnh nhân, về thiết bị tạo ra bức                
ảnh và các thông tin quy định các mã hóa dữ liệu. Cấu trúc tiêu đề: Đầu tiên                
là 128 byte File Preamble (offset), các chương trình đọc file DICOM sẽ bỏ            
qua nội dung chứa trong 128 byte đầu tiên này. Tiếp theo là 4 byte chứa              
chuỗi ‘DICM’. Tiếp theo là các thông tin về file (Data Set File Meta            
Information). Các thông tin này được tổ chức thành các nhóm, trong mỗi           
nhóm lại gồm nhiều phần tử. Phương pháp mã hóa, giải mã và các thông tin              
liênquanảnhcũngđượcquyđịnhtrongphầntiêuđề
● Dữ liệu ảnh (DICOM Data Set): Phần này chứa các thông tin hình ảnh. Nó có              
thểchứađựngthôngtintrongkhônggian3D.
PhầntiêuđềHeaderđượclưuthànhfile*.hdrriêngbiệtvớifileảnh*.img.
2. Tómlượchìnhảnh
7
● Trong phần mã nguồn chứa ảnh mã hóa DICOM, việc mã hóa là không thay             
đổi. Các luồng dữ liệu được mã hóa chỉ đơn thuần là phân đoạn và đóng gói               
cho phù hợp với giao thức truyền dữ liệu của DICOM. Sau khi giải nén bản              
tin DICOM, các luồng dữ liệu được mã hóa có thể được khôi phục hoàn             
7
.NationalElectricalManufacturersAssociation(2011),PS3.52011,Digital
ImagingandCommunicationsinMedicine(DICOM),Part5–DataStructures
andEmcoding,pp.8694

toànởnơinhận.
● Một đối tượng trong DICOM là luôn luôn xác định định dạng và các lựa             
chọn khác mà việc thực hiện mã hóa một cách cụ thể có thể cung cấp. Hình               
ảnh mã hóa phải phù hợp với định nghĩa đối tượng, hình ảnh mã hóa là một               
thànhphầntrongđốitượngđó.Chẳnghạnnhư:
● Nếu đối tượng được định nghĩa để chứa dữ liệu điểm ảnh 10 bit thì nó              
sẽ được giả định rằng một trong những tiến trình mã hóa sẽ chấp nhận             
dữ liệu nhỏ nhất là 10bit. Do đó, không cần thiết có Tranfer Syntax.            
Ví dụ như bất kỳ tiến trình mã hóa 12bit nào đều có thể hoạt động              
trong 8bit nếu đối tượng đó được định nghĩa để chứa dữ liệu điểm            
ảnh8bit.
● Nếu hình ảnh mã hóa được đặt xen kẽ thì quá trình mã hóa phải tạo ra               
bộchèn.
● Thông số kĩ thuật trong phần đầu của tệp tin mã hóa phải phù hợp với tiêu đề                
củabảntinDICOM
● Các đặc tả về thứ tự các byte của một tệp tin được mã hóa sẽ không bị thay                 
đổitrongquátrìnhđónggóinótrongbảntinDICOM.
3. Mãhóavàđónggóiphầntửdữliệuđiểmảnh
Trong PS 3.3 đã nói, mỗi dữ liệu điểm ảnh được lưu trữ trong giá trị trị               
của thuộc tính Pixel Data Element (7FE0, 0010). Sự sắp xếp của mỗi pixel            
ảnhtrongmộtảnhđượcmãhóatừtráisangphảivàtừtrênxuốngdưới.
Pixeli+2
Pixeli
Pixeli+1
Mỗi điểm ảnh cố định có thể gồm một hay nhiều mẫu giá trị điểm ảnh như               
màu hoặc hình ảnh đa chiều. Giá trị mỗi mẫu điểm ảnh có thể được thể hiện dưới                
dạng phần bù số nhị phân kiểu 2 hoặc dạng nhị phân của số nguyên không dấu tuân                
theo qui định của phần tử dữ liệu điểm ảnh (0028, 0103). Số bit trong mỗi mẫu giá                
trị điểm ảnh được xác định bởi bit lưu trữ (0028,0101). Bit đánh dấu phần bù số nhị                
phânkiểu2làphầnquantrọngnhấttronggiátrịmẫuđiểmảnh.

Mỗi ô điểm ảnh là một phần chứa một giá trị mẫu điểm ảnh và bit tùy chọn                
bổ sung. Các bit bổ sung có thể được sử dụng cho một mặt phẳng phủ hoặc để đặt                 
điểm ảnh trên ranh giới nhất định nào đó. Một ô điểm ảnh tồn tại trong mỗi giá trị                 
mẫu điểm ảnh riêng lẻ trong dữ liệu điểm ảnh. Kích thước của từng ô điểm ảnh               
được xác định bởi các bit phân bổ (0028,0100) và lớn hơn hoặc bằng bit lưu              
trữ(0028, 0101). Vị trí của các giá trị mẫu điểm ảnh trong ô điểm ảnh được xác định                
bởicácbitcao(0028,01020).
Những hạn chế về đặc tính chứa trong ô điểm ảnh và giá trị mẫu điểm ảnh               
được chỉ rõ trong Định nghĩa thông tin đối tượng chứa các phần tử dữ liệu điểm               
ảnh. Các phần tử dữ liệu điểm ảnh có giá trị thể hiện VR là OW. Việc mã hóa hay                  
đóng gói các dữ liệu điểm ảnh tương tự như việc kết nối liên tục các bit quan trọng                 
nhất của ô điểm ảnh đầu tiên đến cuối cùng. Trong kết nối này, bit quan trọng nhất                
của bất kỳ ô điểm ảnh được đặt sau các bit quan trọng của ô điểm ảnh tiếp theo.                 
Các dữ liệu điểm ảnh sau đó có thể chia thành một chuỗi 16bit, mỗi phần tử trong                
đótùythuộcvàobyteđặtlệnhcủacâulệnhchuyển.
Những trường hợp khác trong câu lệnh chuyển DICOM chỉ rõ cách mã hóa            
của VR. Ở những câu lệnh chuyển này, tất cả các dữ liệu điểm ảnh ở bit phân bổ                 
nhỏ hơn hoặc bằng 8 và được thể hiện bằng OB(hoặc là thêm vị ngữ hoặc là bỏ từ                 
và đi). Trong trường hợp OW, mỗi ô điểm ảnh được đóng gói cùng nhau, nhưng ở               
đây,dữliệuđiểmảnhđượcchianhỏthànhcácchuỗivậtlý8bit.
Dưới đây là hình ảnh mã hóa (đóng gói) một điểm ảnh bất kỳ trong trường              
hợpOW:
Taxétmộtsốvídụ:
Vídụ1:MãhóadữliệuđiểmảnhsủdụnggiátrịthểhiệnOW
● ĐốivớiảnhCT:
Bitphânbố:16Bitđánhdấu:12 Bitcao:11
● Đốivớiđốitượngthôngtinchung:
Bitphânbố:24Bitđánhdấu:18Bitcao:19
Ví dụ 2: Khái niệm của dữ liệu điểm ảnh trong mỗi ô điểm ảnh khi đóng gói                
chúngvàoluồngdữliệu16bit

● ĐốivớiảnhCT
● Đốivớicácđốitượngthôngtinchung:
4. Lưutrữhìnhảnh
Sự sắp xếp các byte dữ liệu trở nên quan trọng khi chúng ta miêu tả các dữ                
liệuđiểmảnhvậtlýtrongbộnhớ,mộttệptinhaytrênmạng.
5. Tổchứcluồngdữliệuđiểmảnh
Mỗi một dữ liệu điểm ảnh có giá trị thể hiện là OW và bao gồm các thuộc                
tính8bitphânbố,8bitlưutrữvàmộtbitcao.
Chương2:THUẬTTOÁNPHÂNTRONGXỬLÝẢNHYTẾ
Trên thực tế, rất nhiều bài toán phân cụm( phân lớp) dữ liệu được đặt ra. Tùy               
thuộc vào yêu cầu và cấu trúc kiểu dữ liệu mà người ta lựa chọn từng thuật toán                
phân cụm dữ liệu cho phù hợp. Đến nay, có rất nhiều thuật toán đã được nghiên               
cứu và kiểm tra tính đúng đắn của nó trong việc giải bài toán phân cụm dữ liệu.                
Trongphầnnày,tasẽxemxétmộtvàithuậttoánđiểnhình.
1. Giớithiệumộtsốthuậttoánphâncụmdữliệu
1. Kháiniệmphâncụmdữliệu
Để hiểu được phân cụm dữ liệu là gì, chúng ta cần tìm hiểu thế nào là               
khai phá dữ liệu. Khai phá dữ liệu (Datamining) là một lĩnh vực mới xuất hiện              
nhằm khai thác thông tin, tri thức tiềm ẩn, có giá trị từ một cơ sở dữ liệu lớn                 
một cách tự động và hiệu quả nhất từ đó nâng cao hiệu suất sử dụng, nâng               
cao năng lực sản xuất và cạnh tranh cho mỗi đơn vị, tổ chức. Khai phá dữ               
liệu tuy mới ra đời nhưng nó đã óc ứng dụng rộng rãi trong nhiều lĩnh vực               
như thương mại, y tế, tài chính, viễn thông, Kĩ thuật chính trong phân cụm             
dữ liệu chủ yếu dựa trên các lĩnh vực trí tuệ nhân tạo, xác suất thống kê, cơ                
sở dữ kiệu, lý thuyết thông tin, tính toán hiệu năng cao. Vì sự phát triển mạnh               
mẽ cảu khai phá dữ liệu và ứng dụng rộng rãi của nó mà người ta đưa ra                
nhiều khái niệm về khai phá dữ liệu. Nhưng khái quát nhất, ta định nghĩa “              
Khai phá dữ liệu là một quá trình tìm kiếm, phát hiện các tri thức mới, tiềm               
ẩn,hữudụngtrongcơsơdữliệulớn.”

×