Tải bản đầy đủ (.pdf) (82 trang)

Củng Cố Và Ứng Dụng Phân Tích Thị Trường Việc Làm Và Khu Vực Phi Chính Thức Ở Việt Nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.66 MB, 82 trang )

Lớp chuyên đề 1
Phân tích dữ liệu cấp độ II: củng cố và ứng dụng phân tích
thị trường việc làm và khu vực phi chính thức ở Việt Nam
Ludovic Lebart, Marie Piron, Mireille Razafindrakoto,
François Roubaud và Jean-Pierre Cling



Phân tích dữ liệu cấp độ II: củng cố và ứng dụng phân tích
thị trường việc làm và khu vực phi chính thức ở Việt Nam
Ludovic Lebart, Marie Piron, Mireille Razafindrakoto,
François Roubaud và Jean-Pierre Cling

Đề dẫn 

152

Ngày 1, thứ hai 14/7 
Mục tiêu và bối cảnh 
Khái niệm và định nghĩa 
Dữ liệu có thể khai thác 
Định dạng và cấu trúc thông tin 

162
163
164
167
168

Ngày 2, thứ ba 15/7 
Phân tích dữ liệu 



170

Ngày 3, thứ tư 16/7 
Phân tích dữ liệu (tiếp theo)

174

Ngày 4, thứ năm 17/7 
Kết quả và diễn giải các dữ liệu 

176

Ngày 5, thứ sáu 18/7
Các nhóm trình bày 
Tổng kết và đánh giá 
Mục tiêu và cách tiếp cận 
Kết quả đạt được về phương pháp luận 
Các kết quả phân tích 

184
189
189
189
189

Phụ lục 

Phụ lục 1 - Danh sách các biến
Phụ lục 2 - Các bài tập thực hành

Phụ lục 3 - Giới thiệu điều tra VHLSS
Phụ lục 4 - VHLSS 2004: Giới thiệu bản điều tra

191
197
213
225


152

Khóa học Tam Đảo 2008

Tiếp theo hai lớp học chuyên đề được tổ chức năm
ngoái (“Phương pháp khảo sát đa chiều” – Ludovic
Lebart và Marie Piron, và “Điều tra hộ gia
đình” – nhóm IRD-DIAL), năm nay, chúng tôi đề xuất
ứng dụng các phương pháp phân tích dữ liệu đã
được giới thiệu năm 2007 vào các dữ liệu mới của
Việt Nam được thu thập trong khuôn khổ dự án
IRD-DIAL/Tổng Cục Thống kê.

Đề dẫn
Trong giai đoạn đầu, các cuộc điều tra sử dụng phương
pháp thống kê dựa trên lý thuyết điều tra chọn mẫu đại
diện. Ngoài ra, các phương pháp thu thập thông tin từ
các cá thể (hay các đơn vị thống kê khác) cũng được
sử dụng. Những thông tin này có thể là thực tế khách
quan hoặc chủ quan, định tính hay định lượng. Trong
giai đoạn xử lý dữ liệu, các cuộc điều tra sử dụng bộ

công cụ thống kê với các phương pháp phân tích dữ
liệu đóng vai trò quan trọng. Tuy nhiên, những phương
pháp này chưa phổ biến, do đó lớp học chuyên đề lần
này muốn chứng tỏ lợi ích của các phương pháp thông
qua các ứng dụng thực tế.
Chiến lược áp dụng phụ thuộc vào mức độ rõ ràng và
chính xác của các mục tiêu. Những mục tiêu này định
hướng cho các lựa chọn trong thực hiện điều tra, tức
trong thu thập dữ liệu và xử lý thống kê. Việc xử lý dữ
liệu điều tra theo cách truyền thống áp dụng các kỹ
thuật đơn giản, quen thuộc và dễ làm. Đó là các kỹ
thuật phân loại, lập bảng chéo, có nghĩa là tính phần
trăm từng nhóm cá thể theo một biến định tính (các
biến định tính như giới tính, vùng hay nghề nghiệp)
và tính trung bình cho các biến định lượng (như tuổi,
chi tiêu). Bên cạnh đó còn có xây dựng chỉ số như hệ
số, giao nhau giữa các biến định tính... Đôi khi, các
phương pháp thống kê phức tạp hơn, chuyên sâu hơn
như hồi quy, phân tích phương sai, phân tích loại trừ bổ
sung cho những kết quả ban đầu trong giai đoạn hai.
Phương pháp được giới thiệu ở đây đi xa hơn phương
pháp xử lý dữ liệu truyền thống và dựa trên các kỹ
thuật phân tích dữ liệu (phân tích thành phần chính,
phân tính đa biến đơn giản và phức tạp, phân loại theo
thứ bậc tăng dần, phân loại xung quanh trung tâm di
động...). Các kỹ thuật này được áp dụng ngay trong
các giai đoạn đầu của xử lý dữ liệu và là các công cụ
khảo sát để đánh giá các tập dữ liệu lớn. Phương pháp
này cho phép kiểm soát, thông qua biểu diễn trực
quan, đa phần các giai đoạn, tiếp cận các thông tin

vốn không thể tiếp cận bằng phân tích một chiều.
Toàn bộ các kỹ thuật này nhằm đưa ra cách nhìn tổng
thể về các tập thông tin lớn để rút ra được các hình thái
đặc trưng, các cấu trúc, tính hợp thức và các pattern.
Như vậy nó cho phép thể hiện và cơ cấu những chênh
lệch trong một tổng thể đã cho thay vì chỉ phân bổ hay
phân tán một biến xung quanh xu hướng trọng tâm
của nó. Nó làm xuất hiện các nhóm thuần nhất và đối

lập, lần lượt định vị các biến, các cá thể, các nhóm cá
thể với nhau. Ở đây không nhằm mô tả và tìm hiểu các
cá thể, các hộ gia đình, người tiêu dùng, người sản
xuất trung bình mà là chính là tính đa dạng phong phú
của chúng.
Trong thời gian diễn ra lớp học chuyên đề này, chúng
ta sẽ ôn lại các nguyên tắc của phương pháp thống kê
khảo sát và các nguyên tắc của phương pháp tương
tác là cơ sở cho phương pháp luận đã được giới thiệu
tại Khóa học mùa hè về Khoa học Xã hội năm 2007.
Tuy nhiên, trong phần một của tài liệu, chúng tôi
muốn nhấn mạnh đến hoạt động cơ cấu thông tin,
tức quá trình chuyển từ điều tra sang định dạng các
dữ liệu để tiến hành khảo sát và sang khái niệm
“Mô tả theo Chủ đề”.
Tiếp đó trong phần hai, chúng tôi sẽ giới thiệu một
nghiên cứu phân tích thị trường lao động và các doanh
nghiệp cá thể tại Việt Nam dựa trên kết quả điều tra
mức sống hộ gia đình VHLSS (Vietnamese Household
Living Standard Surveys) 2004.
Mục đích cuối cùng của lớp học chuyên đề này là đưa

phương pháp vào ứng dụng thực tế (thực hành các
công cụ, phân tích và diễn giải).

Phần I. Cơ cấu dữ liệu và chiến lược
phân tích
Chiến lược phân tích dữ liệu điều tra là một quy trình
lặp lại theo ba giai đoạn chính:
- xây dựng bảng dữ liệu bao gồm định dạng dữ liệu,
cụ thể là đánh mã các biến, cơ cấu dữ liệu theo chủ
đề điều tra;
- kết hợp các phương pháp nhân tố và phân loại
bằng cách phát huy tính bổ sung của hai nhóm
phương pháp này. Trong khuôn khổ các dữ liệu
điều tra kinh tế - xã hội, chủ yếu ta sử dụng phương
pháp phân tích đa biến phức tạp, phương pháp này
đặc biệt thích hợp cho phân tích bản hỏi hay phân
tích thành phần chính cho một nhóm biến liên tục
hợp thành một chủ đề;
- giải thích và đánh giá các kết quả đòi hỏi phải xem
xét lại các dữ liệu để thay đổi mã, xác định chính
xác hơn các chủ đề hay loại bỏ một số tác động
của một số biến.
Chiến lược đưa ra xuất phát từ thực tế là các câu hỏi
xuất hiện trong cuộc điều tra thường được nhóm theo
một số chủ đề tương ứng với các mô-đun khác nhau
của cuộc điều tra.
Tiếp theo, ta kết hợp theo đúng quy tắc các phương
pháp có vai trò bổ sung cho nhau và phân biệt các
phần tử tích cực và phẩn tử bổ sung.
Sự phân biệt này tác động rất lớn không chỉ đến giải

thích các kết quả mà đến việc cơ cấu toàn bộ các dữ
liệu và xây dựng một mô hình toán học cơ sở.


Phân tích dữ liệu cấp độ II

1. Định dạng dữ liệu
Các kỹ thuật phân tích dữ liệu đều đòi hỏi phải làm chủ
quy trình xây dựng bảng dữ liệu. Các cuộc điều tra có
thể có cấu trúc phức tạp tuỳ theo việc có tồn tại hay
không các cấp quan sát, các chiều theo thời gian hay
không gian.

1.1. Từ bảng hỏi đến bảng dữ liệu

Các dữ liệu điều tra phải được định dạng thành các
bảng (lớn) hình chữ nhật mà ta thường gọi là: X. Các
dòng (i=1,…,n) của bảng đại diện cho n cá thể thống
kê tương ứng với chủ đề điều tra (hộ gia đình, doanh
nghiệp, cá nhân), và các cột (j=1,…p) đại diện cho p
biến tương ứng với các câu hỏi mà các câu trả lới có thể
là kết quả đo lường, đặc điểm, thứ bậc hay các điểm số.
(xem sơ đồ cuối trang)
Thông thường các câu hỏi là câu hỏi đóng và chủ yếu
tạo ra hai loại biến sau:
- Biến định tính như giới tính, nghề nghiệp, bằng
cấp, vùng có giá trị là các tiêu thức cần đánh mã
sao cho phép toán đại số có ý nghĩa. Việc bố trí một
biến định tính phụ thuộc vào tỷ lệ phần trăm hay tần
số (ví dụ tỷ lệ nam giới và nữ giới).

Ta phân biệt biến định danh tức biến không xác
định thứ tự giữa các tiêu thức (ví dụ như giới tính,
hoạt động) với biến có thứ tự có các tiêu thức được
phân loại (ví dụ các câu hỏi về quan điểm đưa ra
các câu trả lời “hoàn toàn”, “có vẻ”, “ít”, “hoàn toàn
không” hài lòng). Giống như các biến định danh,
các biến lô-gích có hai tiêu thức “có/không hoặc có
mặt/vắng mặt) như trong trường hợp mã hoá các
câu hỏi trắc nghiệm.
- Biến định lượng có các giá trị được xác định trên
một thang độ, nơi thực hiện các phép toán đại số
như cộng, tính trung bình. Việc bố trí một biến định
lượng được quyết định bởi kết quả tính toán các
chỉ số xu hướng trung tâm như trung bình, trung
vị, mod và các chỉ số phân tán như phương sai, độ
lệnh chuẩn, lượng phân.

Ta phân biệt các biến liên tục như tuổi, thu nhập, chiều
cao với các biến ngẫu nhiên rời rạc như quy mô hộ gia
đình, số trẻ em là các biến ít có giá trị. Các biến định
lượng có thể trở thành biến định tính nhờ phân tổ các
giá trị.
Những biến trực tiếp rút ra từ bảng hỏi này chính là các
biến gốc làm cơ sở cho việc xây dựng các biến phái
sinh phục vụ công tác nghiên cứu. Các biến này là các
chỉ số phục vụ cho một mục tiêu cụ thể (kết hợp hai
biến định danh, hệ số ví dụ như tỷ lệ sử dụng nơi ở thể
hiện tỷ lệ giữa số thành viên trong một hộ gia đình với
số phòng của căn nhà).
Các câu hỏi mở đem lại các câu trả lời tự do có nội

dung (giá trị) thể hiện bằng lời văn. Đó là trường hợp
các câu hỏi “tại sao?” để giải thích một câu hỏi đóng
hay các câu hỏi mà người ta không muốn hạn chế
câu trả lời bằng việc đưa ra một số lựa chọn hạn chế.
Những câu hỏi này sau đó có thể trở thành các câu hỏi
đóng và do đó tạo ra các biến định danh với việc hình
thành một danh mục các đặc điểm được xây dựng kỹ
lưỡng. Nhưng thường câu hỏi mở được đưa ra vì không
muốn giới hạn các đặc điểm và khai thác các câu trả
lời như nó vốn có. Các câu hỏi mở dẫn đến việc phải
mã hoá thành các bảng từ vựng được mô tả qua phân
tích đa biến.
Xây dựng một bảng dữ liệu thu thập từ cuộc điều tra
có nghĩa là lựa chọn các dòng, tức đơn vị thống kê tập
hợp thành tổng thể nghiên cứu, tức các biến và các
giá trị đáp ứng một cách tối ưu cho mục tiêu nghiên
cứu đề ra.

1.2. Trường hợp các cuộc điều tra có cấu trúc phức tạp

Thường các cuộc điều tra có cấu trúc phức tạp hơn và
các thông tin được thu thập ngay trong bảng hỏi và
liên quan đến các đơn vị quan sát khác nhau và có đặc
điểm riêng. Đó là các cuộc điều tra có nhiều cấp quan
sát. Các cuộc điều tra khác như điều tra phỏng vấn hay
có bước lặp. Ngoài ra, còn có các cuộc điều tra tiểu sử
với bảng hỏi dựa vào lịch trình. Cũng cần phải kể đến
các cuộc điều ra có rất nhiều các câu hỏi mở. Tất cả
các cuộc điều tra này cho thấy cấu trúc phức tạp mà
đối với chúng mỗi lần cần phải xác định tốt các đơn vị

thống kê và các biến.

câu hӓi mà các câu trҧ lӟi có thӇ là kӃt quҧ ÿo lѭӡng, ÿһc ÿiӇm, thӭ bұc hay các ÿiӇm sӕ...

...

1

...

Indiv.

thể nn
question
Indiv.
ij hỏi 1 1
Câu

thể
question
2
Indiv.
2
Câu
question
Câu
Cá thể
2hỏi 1 1hỏi 2
Indiv.
1question


thể
Câu
Câu
2 2hỏi j j
question
1question
Câu
hỏi 1hỏi
question
Câu
hỏiCâu
1 1 2hỏi
question
2question
Câu
question
j j hỏi pp
Câu
hỏi
question
2
Câu
hỏi
2
question
j pp
Câu
question
Câu

hỏi
jhỏi
question
Câu
hỏihỏi
j j pp
Câu
question
Câu
hỏi p p
question

Bảng hỏi
Bҧng
hӓi

j

p

1

X =
(n,p)

153

i

valeur

variable
j
Giá trị de
củalabiến
j
theo cá
i
prise
parthể
l'individu
i
x

ij

n
Bảng
liệuliӋu
Bҧngdữdӳ

Thông thѭӡng các câu h͗i là câu hӓi ÿóng và chӫ yӃu tҥo ra hai loҥi biӃn sau :
- Bi͇n ÿ͓nh tính nhѭ giӟi tính, nghӅ nghiӋp, bҵng cҩp, vùng có giá trӏ là các tiêu thӭc cҫn ÿánh
mã sao cho phép toán ÿҥi sӕ có ý nghƭa. ViӋc bӕ trí mӝt biӃn ÿӏnh tính phө thuӝc vào tӹ lӋ phҫn


s variables et des valeurs qui répondront au mieux à l‟objectif fixé par l‟étude.

s d’enquêtes à structure complexe

ourant que des enquêtes révèlent en fait une structure plus complexe et Id.

qu‟au
sein d‟unvar. Housing var. Household
HS HH MB
var. Member
154 Khóa học Tam Đảo 2008
questionnaire soient collectées des informations concernant des Id.types
HS
HH
MB
var. Housing var. Household
var. Member
1 1 d‟unités
1
11 enquêtes
11 21
vation différentes et possédant leur propre jeu de caractéristiques. Ce sont des
à
2 1 12
rs niveaux d‟observation. D‟autres enquêtes, comme les panels, font l‟objet212 de211 passages
11
22 22 sur
21
.struire
D‟autres,
comme
les enquêtes
biographiques,
questionnaire
qui repose
un

un tableau
de données
issues d‟enquête,
c‟est donc ont
faireun
le choix
des lignes c‟est-à22 22 32
ier.
D‟autres,
enfin,
de nombreuses
questions
ouvertes.
de l‟unité
statistique
dontcomportent
l‟ensemble constitue
la population
d‟étude, des
colonnesToutes
c‟est-à-2ces2 enquêtes
3
a) valeurs
Các
cuộc
điều
tralesquelles

nhiềuà cấp
độàquan

sátl‟étude.
– hoặc
tổng hợp thông tin
về các
hộ gia đình ở cùng
des des
variables
et des
qui répondront
au mieux
fixé
par
population
Members
ent
structures
complexes
pour
ill‟objectif
faut
chaque
fois bien identifier
....les unités
population
Members

dụ
như
điều
tra

về
Nhà
ở:
người
ta
tiến
hành
quan
một
nơi

những
thành
viên
trong
cùng một hộ gia
ques
et les variables.
....
Cas d’enquêtes
à structure complexe
sát những nơi ở (quy chế, loại nhà, vật liệu xây dựng,
đình. Ví dụ, nếu giữa các thành viên phân biệt với
st courant
que des enquêtes
révèlent en fait une structure plus complexe et qu‟au sein d‟un
uêtes
à plusieurs
niveaux
trang

thiết d‟observation
bị...) và tất cả các hộ gia đình ở trong đó
nhau qua việc có việc làm hay không, ta thu được
me questionnaire soient collectées des informations concernant des types d‟unitésp m n
đều
được
điều
tra
(đặc
điểm
kinh
tế-xã
hội
của
chủ
hộ)
biến ở ở quy mô hộ gia đình là số lượng thành
s par l‟exemple
d‟une
enquête
Habitat
des logements
sontdesobservés
(statut,
bservation
différentes et
possédant
leur propre
jeu de: caractéristiques.
Ce sont

enquêtes àmột
p m n type,
cũng
như
tất
cả
các
thành
viên
trong
các
hộ
gia
đình
viên
códecông
ănauviệc
làm
hộdugia
đình. Nếu
ieurs
niveaux
d‟observation.
D‟autres
enquêtes,
comme
les
panels,
font
l‟objet

de
passages
données
niveau
destrong
membres
ménage
ux de construction, équipements, …) et au sein de ceux-ci sont enquêtés tousTableau
les ménages
tés.
D‟autres,
comme
les
enquêtes
biographiques,
ont
un
questionnaire
qui
repose
sur
un
Tableau
de
données
au
niveau
des
membres
du

ménage
này
(đặc
điểm
kinh
tế-xã
hội).
tổng
thể
nghiên
cứu

hộ
gia
đình,
ta
phân
tổ thông à un même
éristiques socio-économiques du chef de ménage) et tous –lessoitmembres
de ces ménages l‟information des ménages qui appartiennent
par
ndrier. D‟autres,Cấu
enfin,trúc
comportent
de nombreuses
questions
ouvertes.
Toutes
cesagrégation
enquêtestinenvềsommant

thông
tin
được
phân
theo
thứ
tự


hình
nơi


tổng
hợp
thông
tin
về
các
thành
viên
– soit paretagrégation
en sommant
l‟information
des ménages
à un
même
logement
desunités
personnes

qui appartiennent
à un même
ménage.qui
Parappartiennent
exemple,
si les
membres
éristiques
socio-économiques).
entent des structures
complexes pour lesquelles il faut à chaque fois bien
identifier les
logement
et des par
personnes
qui
appartiennent
àonun
mêmeune
ménage.
Parvariable
exemple,
si les membres
sont
caractérisés
le
fait
d‟être
actif
ou

non,
obtient
nouvelle
au
niveau
Ménage
dạng
như
sau:

cấp
độ
hộ
gia
đình.
stiques
et
les
variables.
cture de l‟information est hiérarchique et se présente sous la qui
forme
: lepersonnes
sont
caractérisés
fait d‟être actives
actif oudu
non,
on obtient
nouvelle variable
au niveau

Ménage
est
lesuivante
nombrepar
de
ménage.
Si laune
population
d‟étude est
le ménage,
on
nquêtes à plusieurs niveaux d‟observation
qui est le l‟information
nombre de personnes
actives
du agrège
ménage.
Si la
d‟étude
ménage, on
désagrège
du logement
etBảng
l‟on
celle
despopulation
membres
au
niveauest
duleménage.

dữ
liệu
về
nhà

Housing

désagrège
l‟information
du logement et l‟on agrège celle des membres au niveau du ménage.
nons par l‟exemple d‟une enquête Habitat : des logements sont observés
(statut,
type, Id.HS
var. Housing var. Household
var. Member
ériaux de construction, équipements, …) et au sein de ceux-ci sont enquêtés tous les ménages Id.HS
var. Housing var. Household
var. Member
1
actéristiques socio-économiques du chef de ménage) et tous les membres de ces ménages .1
population
Housings
Household
..
actéristiques socio-économiques).
population Housings
.
p
p


tructure de l‟information est hiérarchique et se présente sous la forme suivante :

Member
Housing
Cấu trúc thông tin phân theo thứ tự

re hiérarchique de l‟information

Household

1

1

cture hiérarchique .de l‟information

1

Các bảng dữ liệu tương ứng với ba cấp quan sát

.
.
s fichiers se déduisent
de Housing
cette enquête donnant
lieu
à trois tableaux de données :
Household
.
p var. Housing

Id.HS
1
.
.
Housing

Id.HH var. Household
m
1

Id.MB
1

.
var. Member
..
.

Tableau de données au niveau des logements
Tableau de
données
au niveau
Bảng
dữ liệu
về hộ des
gia logements
đình

Id. HS HH
HH

1
11
21
2 2
...

chiers se déduisent
de thông
cette enquête
donnant
à troisđiều
tableaux
donnéesId.: HS
Ba tệp
tin được
rút ra lieu
từ cuộc
tra vàdetạo
1
21
thành
ba
bảng
dữ
liệu
:
Member
Id.HS var. Housing
Id.HH var. Household
Id.MB var. Member 22


Aggregate var.
Aggregate var.

p... m
p m

var. Housing
var. Housing

var. Household
var. Household

var. Member
var. Member

population Households
population Households
Repeated var.
Repeated var.

Aggregate var.
Aggregate var.

Tableau de données au niveau du ménage
Tableau de données au niveau du ménage
Face à une structure hiérarchique de l‟information, on dispose ainsi autant de populations
p
.
Trong

cấu
trúc
phân
theo thứ tựon
của
thôngainsi
tin, ta
có số
Face à unequ‟il
structure
hiérarchique
de l‟information,
dispose
autant
de populations
statistiques
y a de niveaux
d‟observation.
m
..
lượng
tổng
thể
thống

tương
đương
với
số
lượng

các
statistiques qu‟il y a de niveaux d‟observation.
.
b) Enquêtes à passages répétés
Member
cấp quan
b) Enquêtes à passages
répétéssát.
Dans le cadre d‟enquêtes à passages répétés, il convient de bien identifier :
n le cadre d‟enquêtes à passages répétés, il convient de bien identifier :
Dans
– les unités statistiques
d‟observation
quilặp
correspondent aux individus enquêtés, renouvelées ou
b) Điều
tra có bước
– lesdans
unités
statistiques
correspondent
aux định:
individus enquêtés, renouvelées ou
non
le dispositif
; d‟observation
Tableaux de données correspondant à chacun des ntrois niveaux
d‟observation
Trong
điều tra có qui

bước
lặp, cần xác
non dans le dispositif ;
– les variables qui-sont
conservées
ou non sát
d‟unthống
passagekê
à l‟autre
các
đơn vị quan
tương; ứng với các cá
êt d‟une
telle enquête
de mettreàen
relation
lesniveaux
trois niveaux
d‟observation.
On peut
– les variables
qui sont
conservées
ou non
d‟un
passage
à l‟autre
;không trong hệ
Tableaux
de donnéesest

correspondant
chacun
des trois
d‟observation
thể
được
điều
tra,
được
lặp
lại
hoặc
- la périodicité des passages d‟enquêtes portant sur les mêmes
individus
ou non et sur les mêmes
er :
-mối
la périodicité
passages
variables
ou non.
térêt d‟une telle Ích
enquête
est de
mettre
en tra
relation
lesnày
troislàniveaux
d‟observation.

Ondes
peut
lợi của
cuộc
điều
dạng
tạo các
quan
thống;d‟enquêtes portant sur les mêmes individus ou non et sur les mêmes
variables
ou non.-des
céder
par: affectation
(ou en
désagrégation)
en sát.
répétant
hệ tương
tác giữa
ba cấp quan
Ta cól‟information
thể thực
cáclogements
biến được giữ lại hay không khi chuyển từ bước
.
.

Household

Member


tivement
sur hiện:
les ménages)
autant de en
foisrépétant
qu‟il yl‟information
a de personnes
dans nọ
le sang
logement
oit par affectation
(ou en désagrégation)
des logements
bước kia;
pectivement
ménages)
qu‟il
y atổ)
debằng
personnes
tivement lesur
ménages)
: quaautant
–les
hoặc
phân de
bổfois
(hay
phân

cáchdans
lặp le
lại logement
- tính chu kỳ của các 6bước điều tra về cùng hay
6
pectivement le ménages) :
thông tin về nhà ở (và hộ gia đình) số lần đúng bằng
số thành viên trong căn nhà (trong hộ gia đình):

không cùng các cá thể và cùng hay không cùng
các biến.

5
5
Cấu trúc dữ liệu của một hệ thống như vậy có thể được
Bảng dữ liệu cấp các thành viên trong
hộ gia đình
La structure
des données
d‟un
telnhư
dispositif
biểu
diễn
sau: peut être représentée de la manière suivante :
Id. HS HH MB
1
1
2
2

2
2

1
1
1
2
2
2

var. Housing

m

var. Member

population Members

....

p

var. Household

1
2
1
1
2
3


n

Tableau de données au niveau des membres du ménage

Giai đoạn 11
Période

Giai đoạn 22
Période

JJ et
vàJ1
J1

et J2
JJ và
J2

Population
I1

Population Population
I
I2

– soit par agrégation en sommant l‟information des ménages qui appartiennent à un même
L‟échantillon
est sirenouvelé
toutes les deux périodes. Différents cas de figures sont

logement et des personnes qui appartiennent à un même ménage.
Par exemple,
les membres
sont caractérisés par le fait d‟être actif ou non, on obtient uneconstruction
nouvelle variable
niveau Ménage
duautableau
de données :
qui est le nombre de personnes actives du ménage. Si la population d‟étude est le ménage, on
estduun
panel, I (mêmes individus enquêtés) et les jeux de variables
désagrège l‟information du logement et l‟on agrège celle desL‟échantillon
membres au niveau
ménage.
Id.HS var. Housing
1

var. Household

sur
périodes, J1 et J2
var.les
Member

posée

sont d


date, T :

structure des données d’un tel dispositif
peut1êtrePériode
représentée
de la manière suivante
Période
2
Période
J et J11

Période
J et J22

variables, J

T2

J et J1
J et J2
Phân tích dữ liệu cấp độ II
- il s’agit d’un panel
et les jeux de variables sont identiques
Population
I1
individus variables,
I
T1 l’on
Dans ce cas, ilPopulation
s’agit d’un tableau ternaire classique (individus,
temps) que
I1

représente de la manière
suivante :

Deux tableaux de données sont possibles :
Population
Population
Bộ mẫu được thay đổi theo
chu kỳ hai
giai đoạn. Nhiều
Có thể có hai bảng dữ liệu:
I
I2
date,
T để xây dựng bảng dữ
trường hợp khác được sử
dụng
Population Population
I
I2
liệu:
Période
1 1
Période
22
Giai đoạn
Giai
đoạn
-
Bộ
mẫu


một
nhóm
người
tham
gia điều cas
tra,de figures sont posées pour la
échantillon est renouvelé toutes les deux périodes. Différents
variables, J
T2
I (cùng
cá thể
được điều tra) và hoạt động
nstruction du
de các
données
: deux
échantillon
est tableau
renouvelé
toutes
les
périodes.
Différents
cas
de
figures
sont posées pour la
P_riode
1 P_riode

2 đoạn, J1
của các biến khác khau
trong
các giai
nstruction
duest
tableau
de
données
:
échantillon
un
panel,
I
(mêmes
individus
enquêtés)
et
les
jeux
de
variables
sont différents
và J2
J et J1 I J et J2
individus
T1

r les périodes,
J2 I (mêmes individus enquêtés) et les jeux de variables sont différents

échantillon
est J1
un et
panel,
I
les périodes, J1
etđoạn
J211
Période
période
22
Giai
Giai
đoạnPopulation

155

Période 1

I

Période 2

I

I1
Deux tableaux de données
sont possibles :

Période 1

J1
J1

J2
J2

J1

J2

période 2

Période
1
Population
Population
I

I2

hoặc
Cette situation permet d’effectuer le suivi de la population et
l’intensité
Période
2 de l’évolution.
1.3 Recodages pour l’analyse
Période
11
I
Giai

đoạnstatistique

surtout de sa

(Nhóm)II
La maîtrise du codage, et de sa part d’arbitraire, est fondamentale pour le praticie
(Panel)
B( mu
+c thay
'i theo chu k
hai giai
on. Nhiu tr*ngdes
h+pdonnées.
khác
+c
s/ d,ng
xây
Nous
avons
vu
que la constitution du tableau de données nécessite
d1ng bng d0 li"u : (Panel) I
une première codification. Mais selon la nature de la variable et surtout sel
d’analyse
et laavons
méthode
utilisée,
recodification
s’impose.
Giai

đoạn22 une
I d‟enquête classique
Période
I
e cas
de figurem(t
se nhóm
ramène
à đòi
une
analyse
où nous
au
moins
deux
hợpng*i
này
hỏi
kỹ các
thuật
- B( mu làTrường
tham
giaphải

iuáp
tra,dụng
I (cùng
cá phân
th
+c

iu tra) và hot
(ng
èmes,
premier
défini
variables
de
première
le deuxième
parmoins
celles
de la
que
l’analyse
des
correspondances
multiples est destinée à un ensemb
bin
khác
khau
trong
các
giai
on,
Jla
tích
điều
trapar
cổ
điển

trong
đó
chúng
ítpériode
nhấtRappelons
hai
1 và J2ta có
cas c-a
dele các
figure
se
ramène
àles
une
analyse
d’enquête
classique
oùet nous
avons
au
deux
qualitatives
et
nécessite
un
découpage
des
variables quantitatives en class
uxième
période.

chủdéfini
đề, chủ
đầu
tiên do
các
biến
của giaile
đoạn
một
mes,
le premier
parđềles
variables
de la
première
période
et lela deuxième
par
de la
Cette
situation
permet
d’effectuer
suivi
de
population
et celles
surtout
interviennent
en éléments

actifs. de saisir le sens et
Giai

on
1
Giai

on
2
xácsont
địnhindépendants
còn
chủ đềdethứ
hai do các biến
củaI2),
giai et
đoạn
Tình huống
này cho J,
phép
uxième
période.
l’intensité
l’évolution.
es échantillons
(populations
I1 et
l‟ensemble
des variables,
est theo dõi tổng thể điều tra

La
consultation
de
la
distribution
de
chacune
des variables
(tris-à-plat
et histogra
hai
xác
định.

nhất

nắm
bắt
được
chiều
hướng
và mức độ
biến
Jl’analyse
J
1
1.3mẫu
Recodages
pour
statistique

sentique
échantillons- sont
(populations
et
etconséquent,
l’ensemble
des variables,
est ces recodages.
indispensable
pour J,
effectuer
Cácindépendants
bộ
độc lập
(tổng
thể I1I1và
I2),2 I2),
và toàn
bộ
động.
nntique
dispose
tableau
deLa
données
: et de sa part d’arbitraire,
các gia
biến,
J,tra)
giống

nhau
maîtrise
du
codage,
est fondamentale
pourdans
le praticien
de l’analyse
(nhómdu
ng*i
tham

iu
I suivant
Cette étape
de codification
le processus
d’exploitation est sans doute la plu
des
données.
Nous
avons
vu
que
la
constitution
du
tableau
de
données

nécessite
implicitement
Ta

bảng
dữ
liệu
sau:
1.3.
Đánh
lại

cho
phân
tích
thống
kê On pourra être amené
plus
fondamentale
pour
une
cohérence
des
résultats.
dispose du tableau
de
données
suivant
:
J

une première codification. Mais selon ladécoupage
nature de
la
variable
et
surtout
selon
la
stratégie
Làm
chủ
việc

hoá

ý
nghĩa
quan
trọng đối
với à découper u
d’une variable nominale. Lorsque l’on cherche
ainsi
Tr*ng h+p này
òid’analyse
h$i phi áp
k2 thut
phân
traclasses,
c'
i ns’impose.

trong

ó
chúng
ta

ít
et d,ng
la méthode
utilisée,
une
iu
recodification
J tích
người
thực
hiện
phân
tích
các
dữ
liệu.
Chúng
ta
biết
on est confronté à plusieurs problèmes : combien de classes choisir e
nht hai ch-
, ch-

×