Khái niệm và thuật ngữ trong NCKH Định Lượng
Khái niệm và thuật ngữ trong NCKH Định Lượng
HÀ NỘI - 2018
CHỦ BIÊN:
PGS.TS. Hoàng Văn Minh, Trường Đại học Y tế Công cộng
PGS.TS. Lưu Ngọc Hoạt, Trường Đại học Y Hà Nội
PGS.TS. Đỗ Văn Dũng, Trường Đại học Y dược Thành phố Hồ Chí Minh
PGS.TS. Võ Văn Thắng, Trường Đại học Y dược Huế
ii
LỜI GIỚI THIỆU
Phương pháp nghiên cứu định lượng hiện đang được áp dụng rộng rãi trong các
công trình nghiên cứu khoa học sức khỏe tại Việt Nam. Phương pháp nghiên cứu
định lượng cũng là nội dung chủ đạo của các chương trình đào tạo về phương pháp
nghiên cứu khoa học trong hầu hết các trường đại học, viện nghiên cứu thuộc khối
khoa học sức khỏe tại Việt nam. Tuy nhiên, hiện còn có nhiều khái niệm và thuật
ngữ nghiên cứu khoa học định lượng chưa được hiểu một cách chính xác, gây ra
tình trạng thiếu nhất quán khi sử dụng khái niệm và thuật ngữ này. Việc sử dụng
thuật ngữ một cách không thống nhất có thể làm ảnh hưởng đến chất lượng của các
công trình nghiên cứu cũng như gây ra khó khăn khi bình duyệt và và đánh giá các
báo cáo, bài báo khoa học.
Cuốn tài liệu “KHÁI NIỆM VÀ THUẬT NGỮ CƠ BẢN SỬ DỤNG TRONG CÁC
NGHIÊN CỨU KHOA HỌC SỨC KHỎE ĐỊNH LƯỢNG”, được biên soạn và thống
nhất bởi nhóm giảng viên và nghiên cứu viên của một số cơ sở đào tạo y dược và
một số cơ quan nghiên cứu tại Việt Nam cũng như ở nước ngoài, nhằm mục tiêu hỗ
trợ các nhà nghiên cứu, giảng viên, học viên và sinh viên trong việc tra cứu ý nghĩa
của các khái niệm và thuật ngữ thường dùng trong nghiên cứu khoa học sức khỏe
định lượng, qua đó thống nhất về cách hiểu và cách sử dụng các khái niệm và thuật
ngữ này và hướng tới việc chuẩn hóa về phương nghiên cứu khoa học sức khỏe tại
Việt Nam.
Trong quá trình xây dựng cuốn tài liệu này, nhóm tác giả đã tham khảo và sử dụng
nhiều nguồn tài liệu trong nước và quốc tế có uy tín. Ngoài ra, nhóm tác giả cũng
nhận được các ý kiến góp ý của một số chuyên gia và nhà khoa học trong lĩnh vực
có liên quan. Mặc dù đã được rà soát, thảo luận nhiều lần nhưng chắc chắn cuốn tài
liệu này sẽ vẫn còn những thiếu sót. Nhóm tác giả rất mong các đồng nghiệp và Quý
độc giả đóng góp ý kiến để cuốn tài liệu có chất lượng ngày càng tốt hơn.
iii
MỤC LỤC
iv
DANH MỤC CÁC BẢNG
Hình 1: Các thiết kế nghiên cứu dịch tễ học phổ biến .............................................. 14
Hình 2: Sơ đồ nghiên cứu bệnh chứng .................................................................... 16
Hình 3: Sơ đồ nghiên cứu thuần tập ........................................................................ 18
Hình 4: Nghiên cứu thuần tập lịch sử (thuần tập hồi cứu)........................................ 19
Hình 5: Nghiên cứu thuần tập tương lai ................................................................... 19
Hình 6: Sơ đồ lựa chọn ca bệnh/chứng cho nghiên cứu bệnh - chứng dựa trên
nghiên cứu thuần tập ............................................................................................... 20
Hình 7: Các giai đoạn tiến hành thử nghiệm lâm sàng một loại thuốc mới .............. 24
Hình 8: Tính giá trị khoa học của các thiết kế nghiên cứu........................................ 27
Hình 9: Sơ đồ thiết kế bắt chéo ................................................................................ 28
Hình 10: Sơ đồ thiết kế song song ........................................................................... 29
Hình 11: Sơ đồ thiết kế theo hình nêm..................................................................... 30
Hình 12: 6 cấu phần cốt lõi của hệ thống y tế (theo Tổ chức Y tế thế giới).............. 33
Hình 13: Quan hệ giữa quần thể và mẫu ................................................................. 35
Hình 14: Các loại phương pháp chọn mẫu thường dùng ......................................... 38
Hình 15: Sơ đồ chọn mẫu thuận tiện........................................................................ 39
Hình 16: Sơ đồ chọn mẫu ngẫu nhiên đơn .............................................................. 41
Hình 17: Sơ đồ chọn mẫu ngẫu nhiên hệ thống ....................................................... 42
Hình 18: Sơ đồ chọn mẫu cụm ................................................................................ 43
Hình 19: Sơ đồ chọn mẫu ngẫu nhiên phân tầng ..................................................... 44
Hình 20: Sơ đồ chọn mẫu nhiều giai đoạn ............................................................... 45
Hình 21: Ảnh chụp một phần mẫu bệnh án nội khoa sử dụng tại bệnh viện ............ 55
Hình 22: Nối dài/ Nối dọc ......................................................................................... 60
Hình 23: Nối rộng/Nối ngang .................................................................................... 60
Hình 24: Giá trị ngoại lai ........................................................................................... 62
Hình 25: Các loại thống kê phổ biến ........................................................................ 64
v
Hình 26: Hình dạng của phân phối có độ lệch dương và độ lệch âm ...................... 67
Hình 27: Hình dạng phân phối với độ gù = 4.0, 3.0 và 2.7 ....................................... 68
Hình 28: Phân bố chuẩn........................................................................................... 68
Hình 29: Công thức tính giá trị dự đoán âm tính và dương tính ............................... 82
Hình 30: Các dạng đường cong ROC ...................................................................... 83
Hình 31: Các dạng sai số thường gặp ..................................................................... 92
Hình 32: Biểu đồ Gantt ........................................................................................... 105
vi
KHÁI NIỆM VÀ THUẬT NGỮ CƠ CƠ BẢN THEO ĐỀ MỤC BÁO CÁO
ĐẶT VẤN ĐỀ
Tính cấp thiết (Urgency)
Mức độ cần thiết phải triển khai một nghiên cứu hoặc một can thiệp nào đó càng
sớm càng tốt.
Ví dụ: Năm 2015, virus Zika lây lan trên diện rộng ở Nam Mỹ. Các đánh giá
nhanh cho thấy mối liên quan giữa Zika và sự gia tăng số ca dị tật não bẩm
sinh và hội chứng Guillain-Barre (GBS). Tháng 2/2016, Tổ chức Y tế thế giới
kêu gọi đẩy mạnh các nghiên cứu về mối quan hệ nhân quả giữa virus Zika
và các dị tật não bẩm sinh, từ đó làm cơ sở cho các ứng phó y tế trên toàn
cầu. Đáp ứng lời kêu gọi này, Fabienne Krauer và CS. đã tiến hành Tổng
quan hệ thống “Nhiễm virut Zika như là nguyên nhân gây bất thường ở não
bẩm sinh và hội chứng Guillain-Barré”.
7
thấp (chủ yếu ở các mụn cơm vùng sinh dục), nhóm nguy cơ cao (thường
liên quan tới ung thư cổ tử cung xâm lấn). Tuy nhiên hiện chưa có một sự
đồng thuận nào về việc phân loại một số loại HPV ít gặp vào các nhóm nguy
cơ. Do đó, một tiêu chuẩn phân loại rõ ràng các loại HPV vào nhóm nguy cơ
cao hoặc thấp là rất cần thiết.
Xem thêm: http://www.nejm.org/doi/pdf/10.1056/NEJMoa021641
8
TỔNG QUAN TÀI LIỆU
Tài liệu chưa được xuất bản chính thức (Grey literature)
Là các tài liệu hoặc báo cáo nghiên cứu chưa được xuất bản thông qua các kênh
phát hành chính thức của các nhà xuất bản. Hiểu đơn giản thì đây là những tài liệu
hoặc báo cáo nghiên cứu chưa được xuất bản trên các tạp chí khoa học được bình
duyệt, phản biện (peer-reviewed literature journals).
Ví dụ: Tài liệu chưa được xuất bản chính thức tương đối đa dạng, có thể bao
gồm các báo cáo kỹ thuật, bài trình bày hội thảo, các bộ tiêu chuẩn, luận án,
luận văn, tiểu luận, bảng thống kê, bài giảng, bài thuyết trình, bản thảo của
bài báo v.v.
9
Tổng quan mô tả (Narrative review)
Quá trình thu thập, tóm tắt, tổng hợp các tài liệu và báo cáo nghiên cứu về cùng một
chủ đề, từ đó đưa ra các giải thích và kết dựa trên kinh nghiệm của nghiên cứu viên,
các lý thuyết và mô hình đã có sẵn. Tổng quan mô tả không dựa trên quá trình tìm
kiếm và đánh giá các tài liệu và báo cáo nghiên cứu một cách có hệ thống mà
thường dựa trên các tài liệu và báo cáo nghiên cứu sẵn có hoặc do tác giả tự lựa
chọn.
Ví dụ: Tổng quan mô tả về các đổi mới trong phương pháp nghiên cứu định
tính của tác giả Rose Wiles (2011) sử dụng 57 bài báo xuất bản trong giai
đoạn 2000-2009 có đề cập đến việc sử dụng phương pháp nghiên cứu định
tính mới.
Xem thêm: http://journals.sagepub.com/doi/abs/10.1177/1468794111413227
10
Dưới đây là những điểm khác biệt chính giữa tổng quan mô tả và tổng quan hệ
thống (Hình 1).
Bảng 1: Tổng quan mô tả và tổng quan hệ thống
11
MỤC ĐÍCH, MỤC TIÊU NGHIÊN CỨU
12
Trong nghiên cứu tương đương (equivalence study), giả thuyết Ho cho 2 nhóm đối
tượng/biện pháp can thiệp có các giá trị biến số/chỉ số không tương đương.
Ví dụ:
o Nguy cơ mắc ung thư phổi ở người hút thuốc không tương đương
nguy cơ mắc ung thư phổi của người không hút thuốc
o Hiệu quả của thuốc A không tương đương hiệu quả của thuốc B trong
điều trị bệnh X
13
THIẾT KẾ NGHIÊN CỨU
Có Không
Có Không Có Không
Nghiên cứu
Nghiên cứu mô tả
Thử nghiệm phân Thử nghiệm phân phân tích
bổ ngẫu nhiên có bổ ngẫu nhiên
đối chứng không đối chứng
Chiều thời gian
1
Grimes DA, Schulz KF. An overview of clinical research: the lay of the land. Lancet. 2002 Jan
5;359(9300):57-61.
14
Nghiên cứu một trường hợp bệnh (Case report)
Là việc mô tả một trường hợp bệnh đặc biệt/bất thường, chưa có trong y văn (như
một căn bệnh mới hoặc biến chứng bất thường, sự kết hợp không phổ biến của các
ca bệnh, nguyên nhân hoặc kết quả bất thường của một ca bệnh bao gồm cả sự
phục hồi đáng ngạc nhiên của bệnh nhân). Nghiên cứu một trường hợp bệnh có giá
trị gợi ý giả thuyết nghiên cứu hoặc gợi ý về việc xuất hiện một vấn đề sức
khỏe/bệnh dịch mới trong cộng đồng.
Ví dụ: Nghiên cứu trường hợp một phụ nữ 34 tuổi phá thai bằng thuốc
mifepristone và gemeprost. Trong quá trình phá thai, bệnh nhân mắc viêm tụy
cấp tính nghiêm trọng và phải điều trị cấp tính trong 14 ngày.
Nghiên cứu sinh thái/ Nghiên cứu tương quan (Ecological study or
correlational study)
Là nghiên cứu lấy số liệu thống kê của quần thể (không phải số liệu ở cấp độ cá thể,
ví dụ như trung bình, trung vị, tỷ lệ phần trăm…) để mô tả sự tương quan giữa hai
biến số nghiên cứu và rất có giá trị trong gợi ý hình thành giả thuyết nghiên cứu.
Ví dụ: Nghiên cứu về tỷ lệ tử vong do ung thư và chế độ dinh dưỡng có nhiều
chất béo ở các quốc gia trên thế giới.
15
Nghiên cứu cắt ngang (Cross sectional study)
Thuộc loại hình nghiên cứu quan sát. Trong nghiên cứu cắt ngang, cả thông tin về
bệnh và thông tin về phơi nhiễm được thu thập tại cùng một thời điểm cho nên
nghiên cứu cắt ngang thường được dùng để hình thành các giả thuyết nghiên cứu
chứ không cho phép chứng minh giả thuyết nghiên cứu. Nghiên cứu cắt ngang còn
được gọi là nghiên cứu hiện mắc (prevalence study). Nghiên cứu cắt ngang giúp
chúng ta tính được tỷ lệ hiện mắc bệnh (prevalence) và tỷ số chênh hiện mắc
(prevalence odds ratio).
Ví dụ: Điều tra hút thuốc lá ở người trưởng thành (tỷ lệ hút thuốc và thói quen
hút thuốc) được tiến hành vào năm 2015.
Cá thể không có
Cá thể có bệnh bệnh (chứng)
Tìm
Tìm hiểu
hiểu tiền
tiền sử
sử phơi
phơi nhiễm
nhiễm
Có
Có bệnh
bệnh Không
Không bệnh
bệnh
Có
Có phơi
phơi nhiễm
nhiễm a b
Không
Không phơi
phơi
nhiễm
nhiễm
c d
16
Ví dụ: Mối liên quan giữa sử dụng hormone estrogen và ung thư nội mạc tử
cung đã được nghiên cứu trên 188 phụ nữ da trắng tuổi 40-80 mới được
chẩn đoán ung thư nội mạc tử cung và 428 trường hợp chứng là những phụ
nữ cùng độ tuổi nhập viện trong giai đoạn từ tháng 1, 1970 đến tháng 6, 1975
do u không ác tính cần phẫu thuật. Các số liệu về sử dụng thuốc và các biến
số liên quan đến sinh sản được trích xuất từ hồ sơ bệnh án của mỗi đối
tượng nghiên cứu. Có 39% trường hợp bệnh và 20% trường hợp chứng đã
sử dụng hormone estrogen trong quá khứ.
Phương pháp ghép cặp theo điểm xu hướng (Propensity score matching-PSM)
Là phương pháp ghép cặp nhóm can thiệp và nhóm đối chứng dựa trên điểm xu
hướng, được tính toán từ các đặc điểm của các đối tượng nghiên cứu. Phương
pháp ghép cặp theo điểm xu hướng giúp chúng ta loại bỏ được các sai lệch lựa
chọn.
17
Nghiên cứu thuần tập (Cohort study)
Là nghiên cứu theo dõi một hay nhiều nhóm có hay không có yếu tố phơi nhiễm
(exposure) tới khi xảy ra kết quả nghiên cứu (outcome).
Ví dụ: Để tìm hiểu mối liên hệ giữa hút thuốc lá và bệnh mạch vành, nghiên
cứu viên chọn 3.000 nguời hút thuốc lá và 5.000 nguời không hút thuốc lá. Cả
hai nhóm lúc bắt đầu nghiên cứu đều không có bệnh tim mạch và được theo
dõi dể xem xét sự phát triển bệnh. Sau một thời gian, kết quả phát hiện được
84 nguời hút thuốc phát triển bệnh và 87 nguời không hút thuốc lá phát triển
bệnh.
Cá
Cá thể
thể có
có phơi
phơi Cá
Cá thể
thể không
không
nhiễm
nhiễm phơi
phơi nhiễm
nhiễm
Theo
Theo dõi
dõi sự
sự xuất
xuất hiện
hiện bệnh
bệnh
Có phơi nhiễm a b
Không phơi
nhiễm c d
Nghiên cứu thuần tập lịch sử/Nghiên cứu thuần tập hồi cứu (Historical cohort
study/Retrospective study/Nonconcurrent cohort)
Là loại hình nghiên cứu thuần tập dựa trên cơ sở các hồ sơ ghi chép về các phơi
nhiễm và các kết quả nghiên cứu (số liệu đã có) trước thời điểm nghiên cứu viên bắt
đầu tiến hành nghiên cứu.
Ví dụ: Có một nghiên cứu theo dõi tình hình sức khoẻ của người dân ở thành
phố A được dự kiến tiến hành từ năm 2004 và kéo dài tới năm 2024. Năm
2012, một nghiên cứu viên quyết định sử dụng dữ liệu của nghiên cứu này
trong giai đoạn 2004-2012, chia 2 nhóm dựa trên thông tin về hành vi hút
18
thuốc đã được thu thập trước đó (1 nhóm hút thuốc và 1 nhóm không hút
thuốc lá), sau đó phân tích sự khác biệt về tỷ suất mới mắc ung thư phổi của
2 nhóm.
Nghiên cứu thuần tập tương lai/Nghiên cứu thuần tập tiến cứu (Prospective
cohort/Concurrent cohort/)
Là loại hình nghiên cứu thuần tập trong đó số liệu được thu thập sau khi nghiên cứu
viên bắt đầu tiến hành nghiên cứu
Ví dụ: Năm 2003, nhà nghiên cứu muốn tìm hiểu mối quan hệ của hút thuốc
lá và việc mắc ung thư phổi. Do đó nhà nghiên cứu đã thực hiện một nghiên
cứu trên người dân ở Chí Linh (Hải Dương), chia nhóm theo đặc điểm hút
thuốc lá (1 nhóm hút thuốc và 1 nhóm không hút thuốc) từ năm 2003 và ghi
nhận tỷ lệ mắc mới ung thư phổi của 2 nhóm. Giả định rằng các đối tượng
không thay đổi hành vi hút thuốc trong thời gian thực hiện nghiên cứu. Sau 10
năm, nhà nghiên cứu thực hiện phân tích sự khác biệt về tỷ suất mới mắc
ung thư phổi giữa 2 nhóm.
Hình 4: Nghiên cứu thuần tập lịch sử (thuần tập hồi cứu)
19
Nghiên cứu thuần tập từ lúc sinh (Birth cohort study)
Là loại hình nghiên cứu thuần tập theo dõi dài hạn những người sinh ra trong cùng
một năm hoặc một thời điểm xác định nào đó trong năm. Việc theo dõi thậm chí có
thể bắt đầu từ khi bà mẹ mang thai.
Ví dụ: Nghiên cứu thuần tập từ lúc sinh mới nhất của Anh – Nghiên cứu
thuần thập thiên niên kỷ (The Millennium Cohort Study), đang theo dõi 19,000
trẻ sinh trong năm 2000-2001 tại Anh. Ngoài các dữ liệu về sức khỏe của
những trẻ này và cha mẹ chúng, nghiên cứu cũng xem xét đến hành vi và sự
phát triển nhận thức của trẻ cùng một loạt các yếu tố xã hội liên quan.
Nghiên cứu bệnh - chứng dựa trên nghiên cứu thuần tập (Nested case-control
studies)
Là một dạng của thiết kế nghiên cứu bệnh chứng mà ở đó việc lựa chọn nhóm bệnh
và nhóm chứng được tiến hành trên nền một nghiên cứu thuần tập.
Nhóm thuần tập(Tất cả các đối tượng đều chưa mắc bệnh
hoặc vấn đề sức khỏe được quan tâm)
Thời
gian Theo dõi nhiều năm
Chọn mẫu
Bệnh Chứng
Hình 6: Sơ đồ nghiên cứu bệnh - chứng dựa trên nghiên cứu thuần tập
Ví dụ:
Để xác định mối liên quan giữa nhiễm H. pylori (HP) và ung thư đường tiêu
hóa, Parsonnet và cộng sự (N Engl J Med. 1991 Oct 17;325(16):1127-31)
theo dõi 128,992 người (chưa mắc ung thư tiêu hóa) từ giữa những thập kỷ
60. Qua thời gian, có 189 người phát triển ung thư tiêu hóa được đưa vào
nhóm bệnh. 189 người không có bệnh được lựa chọn ngẫu nhiên từ những
ngườợi không bị bệnh còn lại (nhóm chứng).
20
Nghiên cứu thực nghiệm (Experimental study)
Là nghiên cứu về hiệu quả của một can thiệp nào đó thông qua việc so sánh chỉ
số/biến số nghiên cứu của nhóm can thiệp và nhóm đối chứng. Trong nghiên cứu
thực nghiệm, can thiệp được đưa vào là chủ động. Điều này khác với nghiên cứu
thuần tập, tình trạng phơi nhiễm của các đối tượng nghiên cứu là tự có.
Thử nghiệm ngẫu nhiên có đối chứng (Randomized controlled trials - RCTs)
Là loại hình nghiên cứu thực nghiệm trong đó đối tượng nghiên cứu được phân bổ
ngẫu nhiên vào nhóm can thiệp và nhóm đối chứng. Mục tiêu là để không chế sai
lệch lựa chọn (sai số có hệ thống).
Ví dụ: Nghiên cứu chỉ định ngẫu nhiên 10.101 phụ nữ sau mãn kinh trên 55
tuổi, có tiền sử hoặc có nguy cơ cao mắc bệnh mạch vành vào nhóm can
thiệp (dùng 60 mg raloxifene hàng ngày) hoặc nhóm chứng (dùng giả dược).
Sau đó nhà nghiên cứu theo dõi tỷ lệ gãy xương của 2 nhóm đối tượng trong
5 năm.
Xem thêm:
https://www.ncbi.nlm.nih.gov/pubmed/17892376?ordinalpos=1&itool=EntrezSystem2.
PEntrez.Pubmed.Pubmed_ResultsPanel.Pubmed_RVDocSum
Thử nghiệm ngẫu nhiên có đối chứng theo cụm (Cluster randomized
controlled trials)
Là loại hình nghiên cứu thực nghiệm trong đó các nhóm đối tượng nghiên cứu (các
cụm thay vì các cá nhân) được phân bổ ngẫu nhiên vào nhóm can thiệp và nhóm
đối chứng
Ví dụ: Trong nghiên cứu tác dụng của điều trị giun sán lên cân nặng và chiều
cao của 3.935 trẻ em từ 1-5 tuổi, nhà nghiên cứu chỉ định ngẫu nhiên trẻ em
ở 25 vùng vào nhóm chứng (chỉ nhận vitamin A) và trẻ em ở 25 vùng khác
vào nhóm bệnh (nhận cả vitamin A và albedazone). Định kỳ 6 tháng trong
vòng 24 tháng cấp vitamin và thuốc, nghiên cứu viên tiến hành đo cân nặng
và chiều cao của trẻ.
Xem thêm: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2291568/
21
Phương pháp làm mù (Blinding/Masking)
Nghiên cứu thực nghiệm trong đó có một hoặc nhiều nhóm người tham gia nghiên
cứu (các đối tượng nghiên cứu, các nhân viên y tế, nhà nghiên cứu) không được
biết về tình trạng can thiệp.
22
Phương pháp làm mù ba (Triple-blind study)
Nghiên cứu thực nghiệm trong đó đối tượng nghiên cứu, người tiến hành can thiệp
và nghiên cứu viên đều không biết về phân nhóm can thiệp/chứng. Phương pháp
làm mù này không áp dụng được đối với các can thiệp ngoại khoa.
Ví dụ: Một thử nghiệm lâm sàng có 85 bệnh nhân H.pylori (+), không có triệu
chứng, điều trị theo phác đồ kháng sinh 3 loại kết hợp được 1 tuần. Để tìm
hiểu hiệu lực của men vi sinh trong việc làm giảm tác dụng phụ của kháng
sinh, nhà nghiên cứu chỉ định ngẫu nhiên các đối tượng vào 4 nhóm: nhóm 1
(n = 21) dùng Lactobacillus GG, nhóm 2 (n=22) dùng Saccharomyces
boulardii, nhóm 3 (n=21) dùng kết hợp Lactobacillus spp. và biphidobacteria,
nhóm 4 (n=21) dùng giả dược. Men vi sinh và giả dược được đựng trong các
túi, đóng hộp như nhau và có đánh số nên bệnh nhân không biết mình thuộc
nhóm nào (làm mù 1). Người theo dõi và đánh giá tình trạng bệnh và người
xử lý số liệu cũng không biết bệnh nhân thuộc nhóm điều trị nào (làm mù 2 và
làm mù 3).
Xem thêm: http://www.sciencedirect.com/science/article/pii/S0002927002054801
23
Somerville đã tham gia vào thử nghiệm. Nhóm nghiên cứu thực hiện các
chương trình giáo dục sức khoẻ, giới thiệu và cung cấp các món ăn lành
mạnh cho trẻ khi học tại trường, ở nhà và ở nơi công cộng với mục tiêu làm
giảm BMI của trẻ. Có rất nhiều nhóm và cá nhân trong cộng đồng cũng tham
gia vào thử nghiệm này bao gồm trẻ em, các phụ huynh, thầy cô giáo, nhân
viên cấp dưỡng của trường, các phòng ban của thành phố, các nhà hoạch
định sách, nhân viên y tế, nhà hàng, các đơn vị truyền thông.
Xem thêm: https://www.ncbi.nlm.nih.gov/pubmed/17495210
Hình 7: Các giai đoạn tiến hành thử nghiệm lâm sàng một loại thuốc mới
24
Thử nghiệm lâm sàng giai đoạn I: Dược lý lâm sàng và độc tính (Phase I trial)
Giai đoạn này nghiên cứu tính an toàn chứ không phải tính hiệu quả của thuốc và sau
đó xác định liều sử dụng thuốc thích hợp. Thử nghiệm tiến hành trên những người
tình nguyện. Cỡ mẫu nghiên cứu của giai đoạn này thường khoảng 15-30 người.
Thử nghiệm lâm sàng giai đoạn III (Phase III trial)
Giai đoạn này nghiên cứu đầy đủ về hiệu lực và tính an toàn của thuốc hay vắc xin
trên một cỡ mẫu lớn (100-1000 người tình nguyện).
Thử nghiệm lâm sàng giai đoạn IV: Nghiên cứu thuốc trên thị trường (Phase IV
trial)
Giai đoạn này được tiến hành sau khi cơ quan quản lý đã phê duyệt đăng ký
thuốc/vắc xin và thuốc/vắc xin đó đã được đưa vào thị trường. Mục tiêu chung là
nghiên cứu về tỷ lệ phản ứng phụ hiếm gặp và các tác động tiềm tàng của việc sử
dụng lâu dài loại thuốc đó trong thực tế và cũng tìm thêm bằng chứng về hiệu quả ở
một quần thể rộng hơn quần thể đã được nghiên cứu trong thử nghiệm lâm sàng
giai đoạn 3. Nghiên cứu trong giai đoạn này cũng có thể phát hiện ra các công dụng
tiềm năng mới của thuốc.
Bảng 2: Thông tin sơ lược về quá trình thử nghiệm lâm sàng giai đoạn II và III của 2
vắc xin Cervaris và Gadasil
25
Tuổi trung
bình (số
20 (15-25) 20 (15-25) 20 (16-23) 20 (16-24)
năm)
(khoảng)
Số bạn
≤6 ≤6 ≤4 ≤4
tình
Tần suất
6 tháng 12 tháng 6 tháng 6 tháng
sàng lọc
Thời gian
a a
theo dõi 48 tháng 15 tháng 60 tháng 36 tháng
trung bình
26
Y học dựa vào bằng chứng (Evidence-based medicine or EBM)
Là sự phối hợp giữa kinh nghiệm lâm sàng của nhân viên y tế, bằng chứng khoa
học cập nhật và có giá trị nhất và tôn trọng đến giá trị của bệnh nhân. Trong y học
dựa vào bằng chứng, giá trị của bằng chứng được đánh giá dựa trên thiết kế nghiên
cứu (Hình 8).
Tổng
Tổng
quan
quan hệ
hệ
thống
thống và
và
phân
phân tích
tích
gộp
gộp
Thử
Thử nghiệm
nghiệm phân
phân
bổ
bổ ngẫu
ngẫu nhiên
nhiên có
có Nghiên
Nghiên
đối
đối chứng
chứng cứu
cứu thực
thực
nghiệm
nghiệm
Nghiên
Nghiên cứu bán thực
cứu bán thực nghiệm
nghiệm
Giá
Giá
trị
trị
nghiên
nghiên
cứu
cứu Nghiên
Nghiên cứu
cứu thuần
thuần tập
tập
khoa
khoa
học
học
Nghiên
Nghiên cứu
cứu bệnh
bệnh chứng
chứng
Nghiên
Nghiên
cứu
cứu quan
quan
sát
sát
Nghiên
Nghiên cứu
cứu cắt
cắt ngang
ngang
Nghiên
Nghiên cứu
cứu trường
trường hợp
hợp bệnh
bệnh
Hình 8: Tính giá trị khoa học của các thiết kế nghiên cứu
27
Thiết kế bắt chéo (Cross-over assignment/study)
Là loại hình thiết kế nghiên cứu can thiệp có đối chứng trong đó một nửa số đối
tượng nghiên cứu được phân bổ ngẫu nhiên vào nhóm sử dụng điều trị A, sau đó
được đổi sang nhóm nhận điều trị B trong khi nhóm trước đó được nhận điều trị B
sẽ quay sang sử dụng điều trị A. Thiết kế bắt chéo chỉ thích hợp trong nghiên cứu về
bệnh mãn tính (Hình 9).
Điều trị
Bắt chéo
Điều trị B
Điều trị A
Y Z Sàng lọc
Điều trị B Điều trị A
Z
Ví dụ: Trong một nghiên cứu đánh giá tác dụng của trà Giảo cổ lam lên tính
nhạy cảm insulin trên bệnh nhân đái tháo đường mới được chẩn đoán và
chưa dùng thuốc điều trị, bệnh nhân nhóm A (n=8) dùng 6g trà Giảo cổ lam
mỗi ngày trong vòng 4 tuần, sau đó nghỉ 2 tuần (washout period), rồi chuyển
sang dùng giả dược trong 4 tuần tiếp theo. Trong khi đó, nhóm bệnh nhân B
(n=8) dùng giả dược trong 4 tuần trước, rồi nghỉ 2 tuần, và dùng trà Giảo cổ
lam trong 4 tuần cuối.
Xem thêm: https://www.ncbi.nlm.nih.gov/pubmed/20213586
28
Thiết kế song song (Parallel assignment/design)
Là loại hình thiết kế nghiên cứu can thiệp trong đó các đối tượng nghiên cứu được
phân bổ ngẫu nhiên vào hai hoặc nhiều nhóm được nhận hai hay nhiều can thiệp
khác nhau (Hình 10).
Điều trị A
Phân bổ
ngẫu nhiên
X
Điều trị C
X Y Z Y
Z
Hình 10: Sơ đồ thiết kế song song
Ví dụ: Thử nghiệm lâm sàng được thực hiện trên 459 bệnh nhân có huyết áp
tâm thu dưới 160 mmHg và huyết áp tâm trương 80-95 mmHg. Các đối tượng
được phân bổ ngẫu nhiên vào 1 trong 3 nhóm: nhóm chứng (chế độ ăn ít rau,
hoa quả và sản phẩm từ sữa, hàm lượng chất béo trung bình), nhóm can
thiệp 1 (chế độ ăn nhiều rau, hoa quả), nhóm can thiệp 2 (chế dộ ăn nhiều
rau, hoa quả, sản phẩm từ sữa ít béo, giảm chất béo nói chung và chất béo
bão hoà). Trong vòng 8 tuần, nghiên cứu viên sẽ theo dõi và ghi nhận sự
huyết áp, sự tuân thủ theo chế độ ăn đã chỉ định, lấy mẫu nước tiểu 24h,
kiểm tra các triệu chứng, hoạt động thể lực của các đối tượng.
Xem thêm: http://www.nejm.org/doi/full/10.1056/NEJM199704173361601#t=abstract
29
5
Người
Người
tham
tham
3
gia/
gia/
Cụm
Cụm
1 2 3 4 5 6
Các thời kỳ
Ví dụ: Trong nghiên cứu HEADS-UP, 7 khoa của 2 bệnh viện lần lượt được
chỉ định dùng một công cụ hội chẩn mới để nhằm làm giảm sai sót hệ thống
trong y khoa, tăng cường sự tương tác và học hỏi lẫn nhau liên ngành giữa
các bác sĩ.
Xem thêm: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4479997/
30
Nghiên cứu dịch tễ học: Mối liên quan giữa thiếu kém và mức độ trầm trọng
của bệnh tiêu chảy là gì? (WHAT)
Nghiên cứu về hiệu lực lâm sàng: Hiệu quả của việc sử dụng kẽm để hỗ
trợ điều trị tiêu chảy? (WHAT)
Nghiên cứu về hiệu quả của can thiệp: Hiệu quả của chương trình thúc đẩy
sự dụng kẽm trong hỗ trợ điều trị tiêu chảy? (WHAT)
Nghiên cứu triển khai: Làm thế nào để vượt qua các rào cản trong việc mở
rộng chương trình sử dụng kẽm trong hỗ trợ điều trị tiêu chảy để chương
trình này có thể tiếp cận tới tất cả các trẻ bị tiêu chảy? (HOW)
31
Đánh giá tác động (Impact evaluation)
Là nghiên cứu có mục tiêu đánh giá tác động dài hạn của chương trình.
Ví dụ: Sử dụng rượu bia quá mức gây ra nhiều vấn đề về sức khỏe con
người, kinh tế và trật tự an toàn xã hội. Nhận thức được thực trạng này,
tháng 5 năm 2010, Hội Y tế Công cộng (YTCC) Việt Nam đã thử nghiệm xây
dựng một mạng lưới gồm 55 hội viên YTCC người cao tuổi (NCT) tham gia
vào chương trình can thiệp phòng chống tác hại rượu bia ở Phương Công,
một xã nông thôn thuộc huyện Tiền Hải, tỉnh Thái Bình.
Năm 2012, nghiên cứu đánh giá kết quả chương trình can thiệp giảm
mức độ sử dụng rượu bia thông qua việc tham gia của hội viên y tế công
cộng người cao tuổi được tiến hành.
o Đánh giá kết quả của chương trình là so sánh số lượng nam giới
sử dụng rượu bia ở mức an toàn trước và sau khi thực hiện can
thiệp.
o Đánh giá tác động của chương trình sẽ được tiến hành 1-2 năm
sau khi chương trình kết thúc để xem mô hình có tiếp tục được
thực thi không và số lượng nam giới sử dụng rượu bia ở mức an
toàn so với trước và ngay sau khi kết thúc can thiệp.
32
Sáu thành phần đầu vào Mục đích/đầu ra
Độ bao
Nhân lực y tế
phủ dịch
vụ
Hình 12: 6 cấu phần cốt lõi của hệ thống y tế (theo Tổ chức Y tế thế giới)
33
QUẦN THỂ, CHỌN MẪU, CỠ MẪU
Mẫu (Sample)
Là một phần của quần thể, được coi là đại diện cho quần thể, bao gồm những cá
thể mà chúng ta sẽ nghiên cứu. Mẫu có thể được chọn ngẫu nhiên hoặc không
ngẫu nhiên từ quần thể (Hình 13).
Ví dụ: Trong mỗi phường, nhà nghiên cứu chọn ngẫu nhiên 80 người trưởng
thành.
34
Quần thể
Mẫu
Cá
Cá thể
thể
35
Đối tượng nghiên cứu (Study participant/subject/respondent)
Là người, sự vật, hiện tượng có các biến số/chỉ số được nghiên cứu. Cần phân biệt
đối tượng nghiên cứu với nguồn cung cấp số liệu.
Ví dụ: Nghiên cứu về cân nặng của trẻ sơ sinh thông qua phỏng vấn bà mẹ và
các đặc điểm về bà mẹ không được nghiên cứu thì đối tượng nghiên cứu là trẻ
sơ sinh và nguồn cung cấp số liệu là bà mẹ. Nêu các đặc điểm về bà mẹ cũng
được nghiên cứu thì đối tượng nghiên cứu là cả trẻ sơ sinh và bà mẹ.
36
Hệ số thiết kế (Design effect - DE)
Hệ số thiết kế đề cập đến tác động của phương pháp chọn mẫu đối với kết quả
phân tích thống kê. Hệ số thiết kế trong nghiên cứu sử dụng phương pháp chọn
mẫu cụm là tỷ số giữa phương sai của biến số nghiên cứu tính được theo phương
pháp chọn mẫu cụm và phương sai của biến số nghiên cứu tính được theo phương
pháp chọn mẫu ngẫu nhiên đơn. Hệ số thiết kế được đưa vào khống chế sự giống
nhau của các đơn vị mẫu trong các cụm (chùm) và qua đó đảm báo tính đa dạng
của mẫu.
Ví dụ: Hệ số thiết kế=2 thường được đưa vào công thức tính cỡ mẫu 1 tỷ lệ
khi nghiên cứu sử dụng phương pháp chọn mẫu cụm.
2
𝑍1−𝛼/2 𝑃(1 − 𝑃)
𝑛 = 𝑑𝑒
𝑑2
37
Chọn mẫu (Sampling)
Chọn mẫu là quá trình lựa chọn các đối tượng từ quần thể vào mẫu nghiên cứu.
Chọn mẫu có thể được thực hiện theo phương pháp xác suất hoặc không xác suất
(Hình 14).
(Quota sampling)
Chọn mẫu xác suất tỷ
lệ với kích cỡ quần thể
Chọn mẫu chủ đích (PPS sampling)
(Purposive sampling)
Chọn mẫu cụm
Chọn mẫu hòn (Cluster sampling)
tuyết lăn
Chọn mẫu ngẫu nhiên
(Snowball
phân tầng (Stratified
sampling)
random sampling)
Hình 14: Các loại phương pháp chọn mẫu thường dùng
38
Chọn mẫu không xác suất (Non-probability sampling)
Xác suất (cơ hội) được lựa chọn vào mẫu nghiên cứu của các đối tượng là không
giống nhau. Nghiên cứu viên thực hiện chọn mẫu dựa trên các tiêu chí, mong muốn
của họ hoặc dựa trên sự thuận tiện nào đó. Các phương pháp chọn mẫu không xác
suất bao gồm chọn mẫu thuận tiện, chọn mẫu chỉ tiêu, chọn mẫu có chủ đích...
Mẫu
Quần thể
Ví dụ: Trong nghiên cứu về bệnh nhân tăng huyết áp và các yếu tố liên quan,
nghiên cứu viên chọn mẫu bằng cách đến khoa tim mạch của bệnh viện A và
phỏng vấn các bệnh nhân đến khám/điều trị trong ngày hôm đó.
39
Địa bàn Mẫu Loại đối tượng Mẫu Nhóm thu nhập Mẫu
Hà Nội 400 Đang sử dụng dịch vụ 200 < 5 triệu/tháng 50
5-10 triệu/tháng 50
10-15 triệu/tháng 50
>15 triệu/tháng 50
Có nhu cầu sử dụng dịch vụ 200 …
HCM 400 … … … …
Đà Nẵng 400 … … … …
40
Chọn mẫu ngẫu nhiên đơn (Simple random sampling)
Tất cả các đơn vị mẫu trong khung mẫu đều có cơ hội được chọn vào nghiên cứu
như nhau. Nghiên cứu viên có thể sử dụng bảng số ngẫu nhiên, bốc thăm ngẫu
nhiên, máy tính để chọn đối tượng nghiên cứu (Hình 16).
1 2 3 4
2 5 Mẫu
5 6 7 8
8 10
9 10 11 12
Quần thể
41
Quần thể
1 2 3 4 5 6 7 8 9 10 11 12
2 5 8 11
Chọn mẫu xác suất tỷ lệ với kích cỡ quần thể (Probability proportional to size–
PPS – sampling)
Chọn mẫu xác suất tỷ lệ với kích cỡ quần thể là một kỹ thuật chọn mẫu thường áp
dụng trong phương pháp chọn mẫu phân tầng hay chọn mẫu cụm trong đó xác suất
một đơn vị mẫu được lựa chọn tỷ lệ thuận với độ lớn (số lượng) các đơn vị mẫu đó.
Ví dụ, xác suất được chọn của đơn vị mẫu thuộc các tầng (cụm) lớn hơn sẽ lớn hơn
so với xác suất được chọn của đơn vị mẫu thuộc các tầng (cụm) nhỏ.
Ví dụ:
Danh sách các xã (cụm) và dân cư tương ứng như trong bảng sau
Dân số cộng Chọn vào
Xã/phường Dân số
dồn mẫu
Xã Phú Sơn 1.428 1.428
Xã Dương Hòa 2.244 3.672
Xã Thủy Tân 4.115 7.787
Xã Thủy Vân 6.307 14.094
Phường Thủy Lương 7.045 21.139 x
Xã Thủy Bằng 7.418 28.557
Xã Thủy Thanh 7.594 36.151
Phường Thủy Châu 10.176 46.327
Xã Thủy Phù 11.314 57.641 x
Phường Thủy Dương 11.737 69.378
Phường Thủy Phương 13.247 82.625 x
Phường Phú Bài 13.497 96.122
42
Số xã/phường cần chọn ra là 3, khoảng cách mẫu k=96.122/3=32.041. Chọn
1 số ngẫu nhiên trong khoảng (1,k) là 16,200. Như vậy chùm số tương ứng
để chọn 3 xã sẽ là 16.200+nk (n=0,2), = 16.200, 48.241 và 80.281. Các
xã/phường được chọn sẽ là phường Thủy Lương, xã Thủy Phù và phường
Thủy Phương.
1 2 3 4
Cụm 2
Cụm 1
5 6
Mẫu (chọn 2 cụm)
5 6 7 8
Cụm 3 Cụm 4
11 12
9 10 11 12
Cụm 5 Cụm 6
43
Ví dụ: Cơ sở thực địa Chililab (Chí Linh, Hải Dương) gồm có 7 xã/phường và
được chia thành 50 cụm (mỗi cụm là 1 thôn). Cỡ mẫu cần thiết cho điều tra
ban đầu về tình trạng sức khỏe và các yếu tố liên quan ở Chililab là 6000 hộ
gia đình. Do mỗi cụm có khoảng 350 hộ gia đình, nghiên cứu cần chọn
6.000/350=17 cụm.
1 10 12
2 4 6 2 10 Mẫu
7 8 11 8 5
3 5 9
44
Ví dụ: Để chọn mẫu cho nghiên cứu về sức khỏe răng miệng của trẻ em tại
trường tiểu học A, nghiên cứu viên sẽ lấy mỗi khối lớp là một tầng. Như vậy
sẽ có 5 tầng, tương ứng với khối lớp 1, 2, 3, 4 và 5. Với cỡ mẫu là 500, nếu
chọn mẫu ngẫu nhiên phân tầng không tỷ lệ, cỡ mẫu cần chọn ở mỗi tầng sẽ
là 500/5=100. Nếu chọn mẫu ngâu nhiên phân tầng theo tỷ lệ, cỡ mẫu cần
chọn cần tương ứng với sĩ số học sinh ở mỗi khối lớp như trong bảng dưới
45
Phân bổ ngẫu nhiên (Randomization)
Đối tượng nghiên cứu được phân bổ ngẫu nhiên vào nhóm can thiệp và nhóm đối
chứng. Việc phân bổ ngẫu nhiên có ba điểm mạnh chính. Thứ nhất, nó loại bỏ các
sai lệnh trong việc phân bố điều trị. Nếu không được phân bổ ngẫu nhiên, việc so
sánh kết quả điều trị có thể bao gồm các định kiến, dù vô tình hay hữu ý, bằng cách
lựa chọn những người tham gia với đặc tính chung nào đó nhận một loại điều trị cụ
thể nào đó. Thứ hai, việc phân bổ ngẫu nhiên tạo điều kiện làm mù (blinding*) danh
tính của loại điều trị trước nhà nghiên cứu, người tham gia, và người đánh giá,
thông thường bằng cách sử dụng giả dược – thứ có thể giảm sai lệch sau khi phân
bổ đìều trị. Thứ ba, việc phân bổ ngẫu nhiên cho phép sử dụng các lý thuyết về xác
suất để thể hiện rằng bất kỳ sự khác biệt trong kết quả đầu ra (outcome) giữa các
nhóm can thiệp khác nhau ít có khả năng là do ngẫu nhiên.
46
Phân bổ ngẫu nhiên theo khối (Blocking randomization)
Để số lượng đối tượng nghiên cứu được phân bổ vào 2 nhóm so sánh sẽ cân bằng.
Ví dụ, nếu chọn kích cỡ khối bằng 4, chúng ta sẽ có 6 trình tự phân bổ là AABB,
ABAB, ABBA, BAAB, BABA, BBAA. Với mỗi nhóm 4 đối tượng nghiên cứu, chúng ta
sẽ chọn ngẫu nhiên một trong sáu trình tự phân bổ ở trên để phân bổ các đối tượng
nghiên cứu vào 2 nhóm có và không có can thiệp (A và B).
Điểm yếu của phương pháp này là người thực hiện phân bổ có thể đoán được trình
tự phân bổ (ví dụ với kích cỡ khối = 4, sau khi phân bổ 3 người, sẽ biết chắc chắn
người tiếp theo được phân bổ vào nhóm nào). Để hạn chế sai số này, người thực
hiện phân bổ không được biết kích cỡ của khối và có thể sử dụng nhiều khối có kích
cỡ khác nhau cùng một lúc.
Che giấu phân bổ không nên bị nhầm lẫn với làm mù (blinding). Che giấu phân bổ
hướng tới giảm sai số chọn, bảo vệ trình tự/chuỗi phân bổ ngẫu nhiên trước khi tiến
hành phân bổ. Che giấu phân bổ luôn có thể được tiến hành thành công. Ngược lại,
làm mù hướng tới việc ngăn chặn sai số nhận định (ascertainment bias*), bảo vệ
trình tự/chuỗi phân bổ sau khi phân bổ diễn ra, và không phải luôn luôn có thể thực
hiện được. Nghiên cứu không áp dụng làm mù (unblined trials) vẫn có thể áp dụng
che gidấu phân bổ.
47
Phân cấp hoặc thuê một bên thứ ba tiến hành phân bổ điều trị được ưa chuộng. Rất
nhiều cách tiếp cận tốt để che giấu phân bổ có sự tham gia của các bên thứ ba nằm
ngoài nhóm nghiên cứu. Sử dụng một nhà thuốc hoặc hệ thống quay số điện thoại
ngẫu nhiên là hai kỹ thuật phổ biến.
Ví dụ: Những người phụ nữ tham gia thử nghiệm được phân vào nhóm sử
dụng vitamin A, E và nhóm sử dụng giả dược. Họ sẽ ở trong nhóm đã được
phân bổ trong suốt quá trình mang thai (nếu họ vẫn tiếp tục tham gia thử
nghiệm). Một danh sách phân bổ ngẫu nhiên tạo bởi máy tính sẽ được nhà
thống kê tạo ra… và đưa cho khoa dược. Các nghiên cứu viên chịu trách
nhiệm tuyển chọn người vào nghiên cứu từ khoa siêu âm hoặc khám trước
sinh. Mỗi phụ nữ tham gia nghiên cứu sẽ nhận thuốc trực tiếp từ khoa dược.
Trình tự phân bổ ngẫu nhiên sẽ được tiết lộ với các nhà nghiên cứu sau khi
việc tuyển chọn, thu thập số liệu và phân tích trong phòng thí nghiệm đã hoàn
thành.
48
BIẾN SỐ, CHỈ SỐ
Biến số (Variable)
Biến số là đặc tính của người, vật, sự việc, hiện tượng mà chúng ta đang quan tâm
nghiên cứu. Đặc tính của những người, vật, sự việc, hiện tượng khác nhau thường
là khác nhau (biến đổi). Do đó, biến số là những đại lượng hay những đặc tính có
thể thay đổi từ người này sang người khác hay từ thời điểm này sang thời điểm
khác. Biến số có thể thể hiện đại lượng (biến số định lượng – quantitative variable)
hay đặc tính (biến số định tính – qualitative variable).
49
Biến định lượng (Quantitative variable)
Là dạng biến với các giá trị có “lượng” thực sự. Ví dụ như biến cân nặng, người có
cân nặng 60 kg sẽ nặng hơn người có cân nặng 50kg là 10 kg.
50
Biến kết quả/ Biến đầu ra/Biến phụ thuộc (Output variable/Outcome
variable/Dependent variable)
Là biến chính của các nghiên cứu. Biến kết quả/biến đầu ra/biến phụ được cho là có
thể có mối liên quan với một hay nhiều biến độc lập. Ví dụ như tình trạng hút thuốc
lá là biến kết quả/biến đầu ra/biến phụ biến và được đưa vào phân tích về mối liên
quan đến tình trạng học vấn, nghề nghiệp và điều kiện kinh tế của người dân.
51
THU THẬP SỐ LIỆU
Số liệu (Data)
Số liệu là tập hợp các đặc tính của các đối tượng nghiên cứu. Số liệu được thu thập
dựa trên các biến số nghiên cứu đã được xác định trong giai đoạn xây dựng đề cương.
Ví dụ: Một nhà nghiên cứu đo nồng độ hemoglobin của 30 thai phụ có kết
quả như sau:
10.2 13.7 10.4 14.9 11.5 12.0 9.3 13.5 14.6 11.2
13.3 12.9 12.1 9.4 13.2 10.8 11.7 10.9 10.6 10.5
13.7 11.8 14.1 10.3 12.1 12.9 11.4 12.7 10.6 11.4
và những con số này được gọi là số liệu.
52
Bộ câu hỏi (Questionnaire)
Bao gồm các câu hỏi để thu thập các số liệu cần thiết cho nghiên cứu. Câu hỏi có
thể đi kèm với các tình huống trả lời có sẵn (câu hỏi đóng) hoặc để người trả lời trả
lời câu hỏi theo ý của họ (câu hỏi mở).
53
Thang lẻ (5 cấp độ)
A1 Chúng tôi sẽ đọc cho anh nghe 1 số câu nhận định về tác hại của
thuốc lá. Xin hãy nghe kỹ và cho chúng tôi biết mức độ đồng ý hoặc
không đồng ý của anh đối với mỗi câu nhận định. Có 5 mức độ đó là:
rất không đồng ý, không đồng ý, trung lập, đồng ý, rất đồng ý
Rất không Không Trung Rất
Đồng ý
đồng ý đồng ý lập đồng ý
Hút thuốc gây hôi
a 1 2 3 4 5
miệng và hỏng răng
Hút thuốc gây ung
b 1 2 3 4 5
thư phổi
54
Bệnh án/Hồ sơ y tế (Medical records)
Là tài liệu có chứa các số liệu về thông tin chung và tình trạng sức khỏe của các cá
nhân.
Hình 21: Ảnh chụp một phần mẫu bệnh án nội khoa sử dụng tại bệnh viện
55
ĐẢM BẢO CHẤT LƯỢNG SỐ LIỆU
Đảm bảo chất lượng (Quality assurance)
Là những hoạt động nhằm dự phòng, phát hiện, xử trí kịp thời các sai sót có thể xảy
ra trong quá trình nghiên cứu giúp nghiên cứu đạt được chất lượng như mong đợi
hoặc như hệ thống tiêu chuẩn nhất định. Ví dụ như giám sát quá trình thu thập số
liệu, kiểm tra lại phiếu ngẫu nhiên, nhập liệu 2 lần (double data entry) v.v.v
56
Chỉ số Kappa càng cao thể hiện sự nhất quán càng lớn. Nếu cả hai người hoặc hai
nghiệm pháp chẩn đoán giống nhau cho mọi trường hợp, chỉ số Kappa sẽ bằng 1.
Thông thường người ta phiên giải kết quả như sau:
Độ nhất quán rất cao: Kappa > 0,8
Độ nhất quán cao: Kappa = 0,6-0,8
Độ nhất quán trung bình: Kappa = 0,4-0,6
Độ nhất quán thấp: Kappa < 0,4
57
Giá trị cấu trúc (Construct validity): Mức độ mà các đo lường tương ứng
với các khung lý thuyết (các cấu trúc) liên quan đến hiện tượng đang được
nghiên cứu. Ví dụ, nếu trên cơ sở lý thuyết hiện tượng này nên thay đổi theo
tuổi tác, một phép đo có giá trị cấu trúc sẽ phản ánh một sự thay đổi như vậy.
58
QUẢN LÝ, XỬ LÝ SỐ LIỆU
Cơ sở dữ liệu (Database/Data repository/Databank)
Thường là tập hợp của nhiều số liệu, bộ số liệu. Cơ sở dữ liệu có thể được công bố
rộng rãi cho tất cả ai quan tâm đều có thể truy cập hoặc giới hạn quyền truy cập
trong một nhóm nhỏ nghiên cứu viên.
Ví dụ:
Cơ sở dữ liệu của Tổ chức Y tế thế giới (WHO):
http://apps.who.int/gho/data/node.home
Cơ sở dữ liệu của Ngân hàng thế giới (World Bank):
http://data.worldbank.org/
Cơ sở dữ liệu của Ngân hàng phát triển Châu Á (ADB):
https://www.adb.org/data/statistics
Cơ sở dữ liệu của trường Đại học John Hopkins về các mẫu cảnh báo sức
khỏe trên bao thuốc lá toàn cầu qua các năm:
http://www.jhsph.edu/news/stories/2017/a-graphic-approach-to-cigarette-
warning-labels.html
59
Bộ số liệu chính Bộ số liệu sau khi nối
Nối
Bộ số liệu cần nối
Ví dụ: Nối số liệu của hộ gia đình với số liệu cá nhân. Chúng ta cần có 2 điều
kiện: 1) Hai bộ số liệu phải có ít nhất một biến chung (biến để nối) và 2) Hai
bộ số liệu phải được sắp xếp theo thứ tự của biến để nối.
60
Xử lý số liệu (Data processing)
Quá trình tạo ra bộ số liệu có thể dùng cho phân tích. Xử lý số liệu thường bao gồm
làm sạch số liệu và tạo ra các biến mới phục vụ phân tích số liệu.
Ví dụ: Biến tuổi trong số liệu điều tra 20 người về thói quen sử dụng điện
thoại di động có kết quả như sau
22 34 43 30 52 19 35 18 28 22
45 34 33 15 22 18 43 25 54 16
Từ biến “tuổi” (định lượng liên tục trên) ta tạo biến mới “nhóm tuổi” (biến định
tính) với các nhóm là “<=19”, “20-24”, “25-34”, “35-44”, “45-54”, “55-64”, “65+”
Trong bảng số liệu trên, 2 người không có thông tin về cân nặng. Chúng ta có
thể kiểm tra lại phiếu gốc của 2 người này xem có đúng là không có thông tin
về cân nặng không.
61
Giá trị ngoại lai (Outlier)
Là giá trị quá lớn hoặc quá nhỏ (hay giá trị ngoại vi) so với phần lớn các giá trị khác
trong bộ số liệu (Hình 24). Đây là những giá trị có thể xảy ra trên thực tế nhưng hiếm
gặp. Nếu chúng ta đưa các giá trị này vào tính toán (ví dụ tính trung bình) thì kết quả
sẽ không chính xác bởi các giá trị này làm lệch phân bố của số liệu.
Giá trị ngoại lai
Ví dụ: Bệnh nhân bị loét dạ dày - tá tràng được điều trị theo một phác đồ diệt
vi khuẩn Helicobacter. Sau điều trị, bệnh nhân được theo dõi và ghi nhận thời
gian kể từ khi sử dụng thuốc đến lúc bắt đầu cải thiện triệu chứng đau. Ở 10
bệnh nhân thời gian này (ngày) là như sau: 1, 2, 2, 2, 2, 2, 3, 3, 3, 30. Con số
30 trong thí dụ trên được gọi là số ngoại lai (outlier) và làm số liệu bị lệch.
Trung vị và trung bình của số liệu là 2 và 5 ngày. Con số trung vị phản
ánh chân thực hơn bởi vì với tư cách là một bác sĩ lâm sàng từ số liệu trên có
thể nhận xét rằng một bệnh nhân tiêu biểu sẽ giảm đau sau 2 ngày dùng
thuốc. Nhìn chung, khi số liệu bị lệch thì con số trung bình sẽ bị ảnh hưởng
rất nhiều và không phản ánh giá trị tiêu biểu như con số trung vị.
62
PHÂN TÍCH SỐ LIỆU
Thống kê (Statistics)
Là phân môn toán học có nhiệm vụ thu thập, phân tích, phiên giải và trình bày số
liệu. Số liệu là đối tượng chính của thống kê.
63
Thống kê y sinh học (Biostatistics)
Áp dụng lý thuyết thống kê vào các lĩnh vực y sinh học, bao gồm y tế, nông, lâm
nghiệp, sinh thái học…
64
Trung vị (Median)
Khi sắp xếp dãy số từ bé tới lớn, trung vị là số nằm chính giữa dãy số. Nếu dãy số là
chẵn, trung vị là tổng của 2 số nằm giữa chia đôi, nếu dãy số là lẻ, trung vị là số nằm
chính giữa dãy số.
Ví dụ: Trung vị của 1, 3, 15, 16, 17 là 15. Trung vị của 1, 2, 3, 5, 8 và 9 là giá
trị trung bình của hai giá trị đứng giữa của quan sát đó, tức là bằng (3+5)/2=4
Trung bình được sử dụng khi các biến có phân bố chuẩn. Trung vị được sử dụng khi
các biến có phân bố không chuẩn. Xem thêm về Phân bố chuẩn (Standard Normal
distribution): Trang 66
Mode (Mode)
Là giá trị xuất hiện nhiều nhất trong bộ số liệu. Trong trường hợp không có giá trị
nào được lặp lại thì không có mode. Ngoài ra một bộ số liệu cũng có thể có nhiều
mode.
Ví dụ: Mode của 1, 2, 2, 3, 4, 5 là 2. Tập hợp 1, 2, 3, 4, 5 không có mode.
Tập hợp 1, 2, 3, 3, 4, 5, 5 có 2 mode là 3 và 5.
Biên độ (Range)
Là khoảng giữa giá trị lớn nhất (tối đa) và giá trị nhỏ nhất (tối thiểu) của bộ số liệu
hay một tập hợp các dữ liệu.
Ví dụ: Khoảng của tập hợp 2, 4, 7 là 5. Khoảng của tập hợp -10, -3, 4 là 14.
65
Khoảng tứ phân vị (Interquartile range - IQR)
Là khoảng cách giữa giá trị ở vị trí 25% và vị trí 75% của bộ số liệu. Trung vị chính
là giá trị nằm ở vị trí 50% của bộ số liệu.
Ðộ lệch chuẩn (standard deviation - viết tắt là SD hay s) là con số đánh giá mức độ
phân tán và được tính theo công thức:
n
( xi x ) 2
s
i 1 N 1
Ví dụ: Số liệu về huyết áp tâm thu (mmHg) của 5 đối tượng là 120, 125, 130,
135, 150. Trung bình của huyết áp là 132 và độ lệch chuẩn bằng
n
( xi x ) 2
s
i 1 N 1
(120 132) 2 (125 132) 2 (132 130) 2 (135 132) 2 (150 132) 2
5 1
144 49 4 9 324 530
132,5 11,5
4 4
66
Độ lệch (Skewness)
Độ lệch của một phân bố xác suất đo lường sự đối xứng của phân bố đó. Giá trị
tuyệt đối của độ lệch càng cao thì phân bố đó càng bất đối xứng. Một phân bố đối
xứng có độ lệch bằng 0. Như vậy độ lệch càng gần 0 thì phân bố càng chuẩn.
Hình dạng của một phân phối có độ lệch dương (positive skewness) hoặc độ lệch
âm (negative skewness) (Hình 26):
Độ lệch dương (Positive skewness) hay phân bố lệch phải: có nghĩa là các
giá trị cực lớn hơn giá trị trung bình (mean) sẽ ở xa hơn so với giá trị cực nhỏ
hơn giá trị trung bình (mean).
mean > median > mode
Độ lệch âm (Negative skewness) hay phân bố lệch trái: có nghĩa là các giá
trị cực lớn hơn giá trị trung bình (mean) sẽ ở gần hơn so với giá trị cực nhỏ
hơn giá trị trung bình (mean).
mean < median < mode
Độ lệch dương Độ lệch âm
Mốt Mốt
Trung vị Trung vị
Độ gù (Kurtosis)
Là một chỉ số để đo lường về đặc điểm hình dáng của một phân bố xác suất. Cụ thể
hơn, nó so sánh độ cao phần trung tâm của một phân bố so sánh với một phân bố
chuẩn. Phần trung tâm càng cao và nhọn, chỉ số Kurtosis của phân bố đó càng lớn.
Phân bố chuẩn có độ gù bằng 3. Như vậy độ gù càng gần 3 thì phân bố càng chuẩn.
67
Độ chênh của độ gù (Excess kurtosis): so sánh giữa độ gù của phân bố cần xem xét
và độ gù của phân bố chuẩn (bằng cách lấy độ gù cần xem xét trừ đi 3).
Độ chênh dương (Leptokurtic): đường gạch đứt trên cùng
Độ chênh bằng 0 (Mesokurtic): đường gạch đứt có chấm ở giữa
Độ chênh âm (Platykurtic): đường liền ở dưới cùng
Độ gù
0.5
Độ gù = 4.0
0.4
Phân bố
0.3 chuẩn
Y-Axis
Độ gù = 3.0
0.2
0.1
Độ gù =
2.7
0.0
-4 -3 -2 -1 0 1 2 3 4
Hình 27: Hình dạng phân phối với độ gù = 4.0, 3.0 và 2.7
0.4
Mật
độ 0.2
0.1
2.1% 2.1%
13.6% 13.6%
0.0
-3σ -2σ -1σ µ 1σ 2σ 3σ
68
Phân bố chuẩn (Standard normal distribution)
Là phân bố đối xứng hình chuông có = 0 và = 1. Trung bình và trung vị của số
liệu có phân bố chuẩn là tương đương nhau (Hình 28).
69
Kiểm định giả thuyết (Hypothesis testing)
Sử dụng trắc nghiệm thống kê để kiểm định xem sự khác biệt, mối liên quan nào đó
mà nghiên cứu viên thấy ở trong mẫu có xảy ra tương tự như vậy trong quần thể
hay không. Kiểm định giả thuyết nhằm chứng mình giả thuyết của nhà nghiên cứu
(H1, Ha, có sự khác biệt nào đó) là đúng thông qua việc bác bỏ giả thuyết Ho, không
có sự khác biệt nào đó.
70
Kiểm định hai chiều/ hai đuôi/ hai phía (Two-tailed test)
Kiểm định thống kê sự khác biệt giữa hai nhóm/ hai giá trị không có hướng cụ thể.
Kiểm định hai chiều cần cỡ mẫu lớn hơn so với kiểm định một chiều. Trong kiểm
định này, miền bác bỏ giả thuyết Ho nằm về hai phía của phân bố.
Ví dụ: Phân tích sự khác biệt về tỷ lệ mắc bệnh nào đó giữa 2 nhóm có điều
kiện kinh tế khác nhau. Tỷ lệ mắc bệnh có thể cao hơn hoặc thấp hơn ở
nhóm nghèo.
Phiên giải
Huyết áp tâm trương của nam trong nghiên cứu cao hơn huyết áp tâm trương
của nữ trong nghiên cứu là 1.493 mmHg, sự khác biệt này không có ý nghĩa
thống kê với p=0.493 (>0.05).
71
Kiểm định t ghép cặp (Paired t-test)
Kiểm định sự khác biệt về giá trị trung bình của 2 nhóm ghép cặp trong quần thể (ví
dụ số liệu trước và sau can thiệp được đo trên từng đối tượng nghiên cứu). Số liệu
hiệu số (sự khác biệt về biến số/chỉ số) của 2 nhóm phải có phân bố chuẩn.
Ví dụ: So sánh đường kính thất phải trước và sau can thiệp
Kết quả
Paired Samples Test
Paired Differences
95% Confidence Interval
Std. Std. Error Sig. (2-
Mean of the Difference t df
Deviation Mean tailed)
Lower Upper
Pair 1 Duong kinh that phai truoc 3.681 4.274 .623 2.426 4.936 5.904 46 .000
can thiep – Duong kinh
that phai sau can thiep
Phiên giải
Đường kính thất phải trung bình giảm 3.681 đơn vị sau khi can thiệp (từ 30.85
xuống 27.17) với khoảng tin cậy 95% là 2.426 đén 4.936. Kết quả này có ý
nghĩa thống kê (t=5.904, p<0.001).
72
ANOVA
can nang
Sum of Squares df Mean Square F Sig.
Between Groups 327.672 3 109.224 .582 .630
Within Groups 8633.448 46 187.684
Total 8961.120 49
Phiên giải
Cân nặng trung bình của các đối tượng có trục điện tim trung gian là
51.125kg, của các đối tượng có trục điện tim trái là 41kg, của các đối tượng
có trục điện tim phải là 45.6kg, của các đối tượng có trục điện tim vô định là
44kg. Với giá trị F=0.582 và mức ý nghĩa là 0.630 chúng ta kết luận không có
sự khác biệt về cân nặng giữa các nhóm trục điện tim khác nhau.
Kiểm định dấu thứ hạng Wilcoxon (Wilcoxon signed rank test)
Đây là kiểm định phi tham số dùng để so sánh sự khác biệt về thứ hạng của 2 nhóm
ghép cặp. Kiểm định này mạnh hơn kiểm định dấu (sign test) vì có tính đến cả độ
lớn của sự khác biệt giữa 2 nhóm.
73
Kiểm định Mann-Whitney (Mann-Whitney U test)
Đây là kiểm định phi tham số dùng để so sánh sự khác biệt giữa giá trị trung vị của 2
nhóm độc lập.
Ví dụ: Để so sánh lượng ferritin máu (ng/ml) giữa 2 nhóm bệnh nhân có và
không uống rượu
74
Giảm nguy cơ tuyệt đối (Absolute risk reduction – ARR)
Là hiệu số giữa tỷ lệ mắc bệnh (tử vong) ở nhóm không phơi nhiễm (hoặc nhóm
chứng, R0) và tỷ lệ mắc bệnh (tử vong) ở nhóm có phơi nhiễm (nhóm can thiệp,
R1).
ARR = R0 – R1
75
OR < 1 => yếu tố bảo vệ
OR được tính từ các nghiên cứu cắt ngang (prevalence odds ratio – POR) hoặc
nghiên cứu bệnh chứng (OR)
Ví dụ: So sánh tỷ lệ cao huyết áp giữa nam và nữ theo bảng dưới đây
Cao HA Không cao HA Tổng
Nam 240 720 960
Nữ 140 860 1000
Tổng 380 1580 1960
OR=240*860/(140*720)=2.05
76
Nguy cơ quy thuộc quần thể phần trăm (Population Attributable Risk %/PAR%)
Là tỷ lệ phần trăm mắc bệnh trong quần thể được quy cho phơi nhiễm. Đây là tỷ lệ
mắc bệnh có thể phòng ngừa được nếu phơi nhiễm bị loại bỏ. Chỉ số này được tính
bằng cách chia nguy cơ quy thuộc quần thể cho tỷ suất mắc bệnh của quần thể và
nhân với 100.
77
Hồi quy (Regression)
Hồi qui là mô hình toán học thể hiện sự biến đổi của một biến số (biến phụ thuộc)
theo một hay nhiều biến khác (biến độc lập hay biến giải thích). Mục tiêu của mô
hình hồi quy là ước lượng (hay dự đoán) giá trị của biến phụ thuộc trên cơ sở các
giá trị đã biết của biến độc lập. Có rất nhiều mô hình hồi quy khác nhau, trong đó 2
mô hình thông dụng nhất là hồi quy tuyến tính (linear regression) và hồi quy logistic
(logistic regression).
78
Phân tích dựa trên các cá thể hoàn thành nghiên cứu (Per protocol analysis -
PP)
Được dùng trong phân tích số liệu của nghiên cứu thử nghiệm ngẫu nhiên có đối
chứng. Chỉ những người tuân thủ các yêu cầu của đề cương (tiêu chuẩn chọn mẫu;
tuân thủ thăm khám điều trị) mới được đưa vào phân tích. Loại phân tích này có thể
dẫn đến sai lệch kết quả điều trị giữa 2 nhóm vì kinh nghiệm cho thấy những đối
tượng tuân thủ theo đúng qui trình, không bỏ cuộc giữa chừng, thường có kết cục
điều trị tốt hơn dù ở nhóm can thiệp hoặc nhóm đối chứng.
Phân tích dựa trên phân bổ ngẫu nhiên ban đầu (Intention-to-treat analysis -
ITT)
Được dùng trong phân tích số liệu của nghiên cứu thử nghiệm lâm sàng ngẫu nhiên
có đối chứng. Tất cả các đối tượng ngay sau khi được phân bổ ngẫu nhiên đều
được đưa vào phân tích mặc dù một số đối tượng không hoàn thành nghiên cứu (bỏ
cuộc, thay đổi phác đồ…). Phân tích dựa trên phân bổ ngẫu nhiên ban đầu giúp
khống chế sai lệch do mất đối tượng nghiên cứu (có thể phá hỏng độ tương đồng
đầu kỳ khi bắt đầu phân bổ).
Ví dụ: Một nghiên cứu lâm sàng ngẫu nhiên đối chứng gồm 200 BN bị bệnh
mạch máu não được phân bổ ngẫu nhiên vào 2 nhóm:
* Nhóm 1 (n=100): Điều trị Aspirin + phẫu thuật sau 1 tháng dùng Aspirin
* Nhóm 2 (n=100): chỉ điều trị Aspirin
Kết cục chính (primary outcome) của thử nghiệm lâm sàng này là đột quị xảy
ra trong 1 năm. Trong thời gian chờ mổ, nhóm 1 có 10 BN bị đột quị và sau
khi mổ có thêm 10 BN bị đột quị. Trong nhóm 2 trong thời gian này có 20 BN
bị đột quị.
● Nếu phân tích theo quy trình (per protocol), loại bỏ 10 người chưa mổ, kết
cục nhóm 1 có Tỷ lệ bị đột quị là 10/90 (11%) và kết cục nhóm 2 Tỷ lệ mắc
đột quị là 20/100 (20%) và Tỷ lệ giảm nguy cơ tương đối (relative risk
reduction-RRR) là 0,45.
● Nếu phân tích dựa trên phân bổ ngẫu nhiên ban đầu (intention-to-treat) mặc
dù nhóm 1 có 10 bệnh nhân chưa kịp phẫu thuật đã tử vong nhưng khi phân
tích vẫn được tính vào nhóm có phẫu thuật, vì vậy lúc này Tỷ lệ đột quị của
nhóm 1 là 20/100 (20%) và Tỷ lệ giảm nguy cơ tương đối (RRR) là 0.
79
Phân tích đơn biến (Univariate analysis)
Là phân tích mối liên quan giữa một biến phụ thuộc và một biến độc lập.
80
Hồi quy Cox (Cox regression)
Thường được áp dụng trong các phân tích sống còn để tính toán tỷ số nguy hại.
Tỷ lệ (Proportion)
Về mặt toán học, tỷ lệ là 1 phân số, trong đó tử số là một phần của mẫu số và có
cùng đơn vị đo lường. Trong y tế công cộng, tỷ lệ nói lên mức độ phổ biến của một
bệnh trong một quần thể nhất định.
Tỷ số (Ratio)
Là mối liên quan về mặt số lượng, kích cỡ, mức độ của hai sự vật/hiện tượng được
đo lường bằng lượng (số lượng, con số, khối lượng vv) của sự vật này cho lượng
(số lượng, con số, khối lượng vv) của sự vật kia. Tử số của tỷ số thường không nằm
trong mẫu số.
Ví dụ: Tỷ số nam và nữ, tỷ số bàn thắng bàn thua, tỷ số giường bệnh và bệnh
nhân nhập viện, tỷ số bác sĩ trên 100.000 dân, tỷ số các dịch vụ y tế nhận
được giữa bệnh nhân có bảo hiểm y tế và bệnh nhân không có bảo hiểm y tế.
Tỷ suất (Rate)
Trong toán học, tỷ suất cũng là 1 dạng của tỷ số hay tỷ lệ. Khác biệt với tỷ lệ là mẫu
số của tỷ suất bao gồm yếu tố thời gian và số đối tượng. Giá trị của tỷ suất có thể đi
từ 0 đến vô hạn.
Trong dịch tễ học, dân số và thống kê, tỷ suất đo lường về tần số của một sự kiện
xảy ra trong một quần thể trong một khoảng thời gian để phản ánh tố độ mắc/xảy ra
sự kiện đó trong quần thể. Tỷ suất thường để xác định mức độ biến động của các
hiện tượng trong một khoảng thời gian xác định.
Ví dụ: Tỷ suất chết/tử vong, tỷ suất mới mắc, tỷ suất sinh…
81
Âm tính thật (True negative)
Một người thực sự không có bệnh được làm xét nghiệm chẩn đoán và có kết quả
âm tính (không có bệnh).
Dương
tính
Hoặc
Hình 29: Công thức tính giá trị dự đoán âm tính và dương tính
82
Tỷ số khả năng có kết quả dương tính (Positive Likehood Ratio – PLR)
Là tỷ số giữa khả năng dương tính với nghiệm pháp chẩn đoán của nhóm có bệnh
thực sự và khả năng dương tính với nghiệm pháp chẩn đoán của nhóm không có
bệnh. Tỷ số này càng lớn thể hiện nghiệm pháp chẩn đoán càng có giá trị.
% dương tính thật Độ nhạy
PLR = ------------------------ = -------------------
% dương tính giả 1 - Độ đặc hiệu
Tỉ
lệ
dương Ngẫu nhiên
tính Tốt
thật Tốt hơn
Tốt nhất
83
Diện tích dưới đường cong ROC (Area under ROC curve – AUC)
Được sử dụng như một chỉ số đánh giá khả năng phân biệt giữa bệnh và không
bệnh của một công cụ chẩn đoán. Giá trị của khu vực này dao động trong khoảng
0,5 đến 1. Giá trị bằng 1 co thấy nghiệm pháp chẩn đoán phân biệt một cách hoàn
hảo giữa ca bệnh và không bệnh. Giá trị bằng 0,5 chỉ ra khả năng phân biệt chỉ như
là may rủi. Phiên giải kết quả này như sau:
Khả năng phân biệt rất tốt: AUC = 0,90 đến 1
Khả năng phân biệt tốt: AUC = 0,80 đến dưới 0,90
Khả năng phân biệt trung bình: AUC = 0,7 đến dưới 0,8
Khả năng phân biệt kém: AUC = 0,6 đến dưới 0,7
Khả năng phân biệt rất kém: AUC = 0,5 đến dưới 0,6
Độ nhạy (Sensitivity)
Khả năng một nghiệm pháp/xét nghiệm chẩn đoán phát hiện đúng những người mắc
bệnh.
84
Số hiện mắc (Prevalence)
Là tổng số trường hợp hiện đang có vấn đề sức khỏe/tình trạng bệnh nào đó trong
quần thể xác định vào một thời điểm hay một khoảng thời gian xác định.
Ví dụ: Để ước tính số trường hợp hiện mắc bệnh huyết áp cao trên địa bàn
Cần Thơ trong tháng 3 năm 2015, nhóm nghiên cứu có thể đến từng hộ gia
đình trong thành phố để phỏng vấn “Bác/anh/chị hiện tại có bị bệnh huyết áp
cao không?” và đo huyết áp kiểm tra, chẩn đoán và ghi nhận số ca bệnh trong
tháng đó.
85
Nguy cơ/ tỷ lệ/ số ca mới mắc tích lũy (Cumulative incidence risk, Cumulative
incidence proportion, Cumulative incidence)
Nguy cơ mới mắc tích lũy phản ánh mức độ lan truyền bệnh trong cộng đồng trong
một khoảng thời gian xác định. Nguy cơ mới mắc tích lũy bằng tổng số trường hợp
mới mắc bệnh chia cho tổng số quần thể có nguy cơ ở đầu thời điểm nghiên cứu
Ví dụ: Để ước tính tỷ lệ mắc tích lũy huyết áp cao trong vòng 5 năm gần đây
tại Hà Nội, nhóm nghiên cứu có thể đến từng hộ gia đình trong thành phố để
phỏng vấn “Trong 5 năm vừa qua, bác có từng được chẩn đoán mắc bệnh
cao huyết áp bao giờ chưa?”
Số năm sống điều chỉnh theo chất lượng cuộc sống (Quality-adjusted life
years - QALYs)
Là đơn vị đo lường chất lượng cuộc sống, tính toán đến cả số lượng và chất lượng
các năm sống của đối tượng quan tâm.
Ví dụ: Một năm sống trong tình trạng sức khỏe hoàn toàn khỏe mạnh tương
đương với 1 QALY. Một năm sống trong tình trạng nằm liệt giường chỉ được
tính 0.5 QALY.
Số năm sống điều chỉnh theo mức độ bệnh tật (Disability-adjusted life years -
DALYs)
Là đơn vị đo lường gánh nặng do tử vong và bệnh tật. DALY là một chỉ số định
lượng, phản ánh số năm cuộc sống bị mất đi do các nguyên nhân, ví dụ do chết non
(chết trước tuổi thọ trung bình, do tàn tật tạm thời hay vĩnh viễn). Chỉ số DALY cho
phép đo lường tại thời điểm phản ánh dịch vụ y tế được cung cấp cũng như những
tác động tích cực tiêu cực của các yếu tố chủ quan hay khách quan lên sức khỏe.
Chỉ số này được đo lường bằng số năm sống mất đi do tử vong sớm (Years of life
lost due to premature mortality - YLL) và số năm sống khỏe mạnh mất đi do tàn tật
(Years lived with disability - YLD): DALY = YLL + YLD
Số năm sống mất đi do tử vong sớm (Years of life lost due to premature
mortality - YLL)
Được tính bằng cách nhân số trường hợp tử vong với kỳ vọng sống tại tuổi tử vong.
YLL = N x L
(N: số tử vong, L: kỳ vọng sống tại tuổi tử vong)
86
Số năm sống khỏe mạnh mất đi do tàn tật (Years lived with disability - YLD)
Là số năm phải sống với bệnh hay tình trạng sức khỏe do mới mắc bệnh hay tình
trạng sức khỏe bị tác động, được tính bằng cách nhân số trường hợp mới mắc (tàn
tật/khuyết tật/bệnh) với tỷ trọng khuyết tật (phản ánh mức độ trầm trọng của dạng
khuyết tật) và với số năm sống trung bình của dạng khuyết tật/bệnh đó)
YLD = I x DW x L
(I: Số ca mới mắc, DW: tỷ trọng khuyết tật (phản ánh mức độ trầm trọng của dạng
khuyết tật), L: số năm sống trung bình của dạng khuyết tật).
Số năm sống tiềm tàng bị mất đi (Years of Potential Life Lost - YPLL)
Được hiểu đơn giản là hiệu số giữa kỳ vọng sống và tuổi tử vong.
87
Ví dụ: Vào năm 2008, ở Ấn Độ có 8,504,709 người tử vong trong tổng dân số
là 1,149,285,000 người. Như vậy tỷ suất tử vong thô của Ấn Độ trong năm
2008 là khoảng 7 người trong 1000 người.
Tỷ suất tử vong đặc trưng theo chủng tộc (Race-specific mortality rate)
Là tỷ suất tử vong của 1 chủng tộc xác định nào đó. Công thức giống như tỷ suất tử
vong thô nhưng cả tử số và mẫu số của tỷ suất tử vong đặc trưng theo chủng tộc
đều được giới hạn và tính toán cho 1 chủng tộc nhất định.
Ví dụ: Tỷ suất tử vong của người da trắng, da đen, gốc Mỹ La tinh tại Mỹ
Tỷ suất tử vong đặc trưng theo giới tính (Sex-specific mortality rate)
Là tỷ suất tử vong của nam hoặc nữ. Công thức giống như của tỷ suất tử vong thô
nhưng cả mẫu số và tử số được giới hạn và tính toán riêng cho nam hoặc nữ giới.
Tỷ suất tử vong đặc trưng theo nguyên nhân (Cause-specific mortality rate)
Tử số là số ca tử vong do một nguyên nhân cụ thể nào đó của một quần thể trong
một khoảng thời gian xác định và mẫu số là tổng số người tử vong của quần thể
trong cùng khoảng thời gian.
Ví dụ: Tỷ suất tử vong do đột quỵ tại Việt Nam năm 2016. Tỷ suất tử vong do
tai nạn giao thông. Tại Mỹ năm 2003 có tổng cộng 108.256 ca tử vong do tai
nạn. Do đó tỷ suất tử vong đặc trưng theo nguyên nhân ở đây sẽ là 37.2 trên
100.000 dân.
Tỷ suất tử vong đặc trưng theo nhóm tuổi (Age-specific mortality rate)
Tử số là số ca tử vong trong một nhóm tuổi nhất định và mẫu số là số người trong
nhóm tuổi đó của quần thể.
Ví dụ: Tỷ suất tử vong của ở trẻ em 1-5 tuổi, của người trong độ tuổi lao động
18-65 tuổi, của nhóm thanh niên 15-24 tuổi, của nhóm người già 75-84 tuổi.
88
Tỷ suất tử vong trẻ dưới 1 tuổi (Infant mortality rate - IMR)
Tử số là số trẻ dưới 1 tuổi tử vong trong một năm xác định của một quần thể và mẫu
số là tổng số trẻ đẻ sống trong cùng năm của quần thể đó. IMR thường được biểu
diễn dưới dạng x/1000 trẻ đẻ sống.
Ví dụ: Năm 2009, Thụy Điển có tỷ suất tử vong trẻ dưới 1 tuổi thấp nhất trên
thế giới với 2,2 trẻ trên 1000 trẻ đẻ sống. Ngược lại Chad là một trong những
nước có tỷ suất tử vong trẻ dưới 1 tuổi cao nhất trên thế giới với 130 trẻ trên
1000 trẻ đẻ sống.
Tỷ suất tử vong trẻ dưới 5 tuổi là một chỉ số quan trọng. Giảm 2/3 tỷ suất tử vong trẻ
dưới 5 tuổi trong giai đoạn 1990-2015 là 1 trong 8 mục tiêu thiên niên kỷ (Millenium
Development Goals – MDGs). Tính trên toàn thế giới, tỷ suất tử vong trẻ đã giảm
53% từ 91/1000 trẻ đẻ sống năm 1990 xuống 43/1000 trẻ đẻ sống vào năm 2015.
89
Tỷ suất chết/mắc (Case-fatality rate)
Là tỷ lệ tử vong do một bệnh nào đó trên tổng số người mắc bệnh đó của một quần
thể nhất định.
Ví dụ: Trong quần thể 10 000 người, có 5 người mắc ung thư tuỵ, và trong 1
năm, 4 trong 5 người đó đã tử vong vì căn bệnh này. Tỷ suất chết/mắc của
bệnh ung thư tuỵ trong quần thể này là: 4/5=0.8 hay 80%.
90
SAI SỐ VÀ NHIỄU
Hiệu ứng Hawthorne (Hawthorne effect)
Là sai số quan sát gặp phải khi đối tượng được quan sát thay đổi hành vi, ứng xử
khi biết bản thân bị quan sát.
Nhiễu (Confounding)
Là biến số thứ ba có liên quan độc lập với cả biến số phụ thuộc/ kết quả và biến số
phơi nhiễm và không phải yếu tố trung gian giữa biến số phơi nhiễm và biến số kết
quả.
Ví dụ: Khi xét tới mối quan hệ giữa cà phê và ung thư phổi, hút thuốc lá là
một yếu tố nhiễu vì đây là một yếu tố nguy cơ gây ung thư phổi, và hành vi
này cũng liên quan tới thói quen uống cà phê.
91
Sai số (Error)
Sự khác biệt giữa kết quả của nghiên cứu trên mẫu so với giá trị thực của quần thể.
Sai số có thể là sai số ngẫu nhiên hoặc sai số hệ thống (Hình 31).
Sai số
(Error)
Sai số đo lường
Sai số đáp ứng Sai số nhớ lại
ngẫu nhiên
(response bias) (recall bias)
(Random
measurement Sai số theo Sai số xếp lẫn
error) dõi/bỏ cuộc (Misclassificatio
(follow-up bias) n bias)
92
Sai số ngẫu nhiên (Random error)
Sai số ngẫu nhiên xảy ra so sự khác biệt về sinh học giữa các cá thể hoặc của một
cá thể vào các thời điểm khác nhau (ví dụ: huyết áp, nhịp tim), sai số chọn mẫu và
sai số đo lường ngẫu nhiên. Chúng ta có thể hạn chế sai số ngẫu nhiên thông qua
việc tăng cỡ mẫu nghiên cứu.
93
Mất đối tượng theo dõi (Loss to follow-up)
Là dạng sai số hệ thống xảy ra khi các đối tượng nghiên cứu trong nghiên cứu dọc
(nghiên cứu thuần tập, thử nghiệm ngẫu nhiên có đối chứng) có thể bỏ cuộc, chuyển
đi nơi khác hặc tử vong…
94
Sai số phân loại/xếp lẫn (Misclassification bias)
Là dạng sai số hệ thống xảy ra khi người nghiên cứu phân loại không chính xác
nhóm bệnh/không bệnh, có phơi nhiễm/không phơi nhiễm ở các đối tượng nghiên
cứu.
95
ĐẠO ĐỨC NGHIÊN CỨU
Đạo đức nghiên cứu (Research ethics)
Là các nguyên tắc, chuẩn mực đạo đức áp dụng trong nghiên cứu đặc biệt khi đối
tượng nghiên cứu là con người.
Hội đồng đạo đức (Institutional review board - IRB hoặc Ethics committee - EC)
Là hội đồng bao gồm các thành viên có trách nhiệm xét duyệt khía cạnh đạo đức
của các nghiên cứu.
Ví dụ: Hội đồng đạo đức trường Đại học Y tế công cộng có trách nhiệm xét
duyệt khía cạnh đạo đức của các nghiên cứu của bản thân trường và của các
đơn vị nghiên cứu khác tại Việt Nam và trên thế giới.
Đồng thuận tham gia sau khi được cung cấp thông tin đầy đủ (Informed
consent)
Sự đồng thuận tham gia của các đối tượng nghiên cứu được đưa ra sau khi họ
được đầy đủ các thông tin có liên quan đến nghiên cứu. Có 2 dạng đồng thuận tham
gia nghiên cứu, bằng lời nói (verbal informed consent) và bằng văn bản (written
informed consent). Nên dùng dạng thứ hai và lưu lại ở từng hồ sơ nghiên cứu.
Trong trường hợp cần giữ bí mật danh tính của người tham gia thì có thể lấy chấp
thuận tham gia bằng lời nói.
96
KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN
Bảng một chiều (Frequency distribution table)
Là bảng mà số liệu của một biến được trình bày theo một chiều với tổng của cột
(không có tổng dòng).
Ví dụ:
Cấp học Tần số Tần suất (%)
Tiểu học 320 48,0
Trung học cơ sở 155 23,0
Trung học phổ thông 168 25,0
Đại học 24 4,0
Tổng cộng 667 100
97
Bảng 2x2 (Two-by-two table)
Là loại bảng chéo thể hiện phân bố về tần số và/hoặc tỷ lệ phần trăm các giá trị của
một biến số theo một khác. Mỗi biến số chỉ có 2 giá trị để tạo ra bảng có 2 hàng và 2
cột. Đây là dạng bảng được sử dụng nhiều nhất trong nghiên cứu dịch tễ học khi
nghiên cứu viên muốn đo lường hoặc biểu thị mối quan hệ nhân quả giữa hai biến
nhị phân. Từ bảng này có thể tính được tỷ suất chênh (OR) hoặc nguy cơ tương đối
(RR).
Ví dụ: Kết quả điều trị bệnh nhân loãng xương với thuốc zoledronic acid
Zoledronic acid Placebo Tổng
Số bị gãy xương 92 148 240
Số không bị gãy xương 970 917 1887
Tổng 1062 1065 2127
Nöõ
35%
Nam
65%
98
Biểu đồ Box Whiskers (Box-and-Whiskers plot)
Biểu đồ thể hiện sự phân bố của một biến định lượng theo các nhóm tứ phân vị kèm
theo các giá trị quá lớn và quá nhỏ.
Ví dụ: Biểu đồ Box Whiskers thể hiện mối liên quan giữa cân nặng của trẻ
(trục tung) và nhóm BMI của bà mẹ (trục hoành)
100.0
80.0
60.0
40.0
20.3 21.0 21.2 22.7
16.1 15.0 16.3 20.9
20.0 13.8 12.6 11.4
11.6
10.0 7.1 7.8
0.0
Tổng Quảng Nam Quảng Ngãi Vùng đồi núi Khu vực ven biển
Khảo sát trước tập huấn Khảo sát sau tập huấn lần 1 Khảo sát sau tập huấn lần 2
99
Biểu đồ cột chồng (Stacked bar chart)
Giống như biểu đồ cột tuy nhiên nghiên cứu viên trình bày hai hay ba biến số trên
cùng một biểu đồ để tiện so sánh. Biểu đồ cột chồng có 2 loại:
Loại cột chồng có chiều cao bằng nhau: thường được dùng để so sánh tỷ lệ
phân bố giữa các nhóm của một biến số có tổng tỷ lệ bằng 100% so với các
nhóm của một biến khác.
Loại cột chồng có chiều cao không bằng nhau: biểu thị số liệu khi tổng tỷ lệ
phần trăm của các nhóm trong biến số không bằng nhau.
Ví dụ: Nhận định của đối tượng nghiên cứu (trẻ em cấp 1) về thái độ của gia
đình đối với thông tin được chia sẻ từ bản thân các em
3.5
Khảo sát sau tập
9.1 81.1 6.2
huấn lần thứ hai
3.2
Khảo sát sau tập
6.7 84.1 6.0
huấn lần thứ nhất
10.1
Khảo sát trước tập
11.0 68.6 10.3
huấn
Ðể vẽ biểu đồ cột liên tục, người ta chia biên độ của giá trị làm nhiều khoảng giá trị
và tính tần suất của những khoảng giá trị đó. Những khoảng giá trị này được biểu thị
ở trên trục hoành. Ứng với mỗi khoảng giá trị người ta vẽ những hình chữ nhật có
diện tích tỉ lệ với tần suất của khoảng giá trị đó.
100
Ví dụ: Một biểu đồ cột liên tục biểu diễn sự phân bố tuổi của các đối tượng
nghiên cứu (và số liệu thô dùng để vẽ biểu đồ)
15
10
8 9 10 11 12 13 14 15 16
hemoglobin
101
Biểu đồ chấm rải rác (Scatter)
Dùng để mô tả tương quan hai biến định lượng.
Ví dụ: Biểu đồ thể hiện mối tương quan giữa khả năng ghi nhớ và khả năng
đọc hiểu.
20%
17.1%
Tỉ lệ thừa cân và béo phì
15.3% 15.6%
15%
12.0%
9.1% 9.6%
12.6%
10%
6.6% 9.8%
5.6%
4.8% 4.4%
5%
2.0% 5.3%
2.3% 3.5%
1.2%
0%
1992-1993 1997-1998 2002 2005 2009-2010 2015
Năm
102
Biểu thị số liệu dưới dạng bản đồ (Map chart)
Thường áp dụng cho các số liệu dịch tễ học để biết được tính chất phân bố theo dịa
dư của nó. Số liệu trên bản đồ thường là số tuyệt đối của một hiện tượng sức khỏe
nào đó, những cũng có thể là số liệu tương đối/tỷ lệ.
Ví dụ: Mức độ sử dụng đồ uống có cồn (số lít trung bình trên người)
Tiêu thụ rượu, bia
TB 2003–05, ít/người
Ít hơn 2.5
12.5 và hơn
Không dữ liệu
Nguồn: TCYTTG
103
Hiệu dụng (Efficiency)
Là tỷ lệ giữa kết quả/ hiệu quả trên đầu tư ban đầu (nguồn lực, thời gian, tài
chính…).
Ví dụ: Một loại vaccine ở giai đoạn thử nghiệm lâm sàng cho thấy hiệu lực rất
cao. Khi đưa vào thực tế cộng đồng, vaccine cũng hiệu quả bảo vệ tốt. Tuy
nhiên cần tính đến giá thành, tác dụng phụ có thể có, kỳ thị và định kiến xã
hội, nạn bài trừ vaccine hiện nay… để đảm bảo việc đầu tư vào vaccine là
hợp lý.
104
MỘT SỐ KHÁI NIỆM VÀ THUẬT NGỮ KHÁC
1/16 1/20 1/24 1/28 2/1 2/5 2/9 2/13 2/17 2/21
Việc 1
Việc 2
Việc 3
Việc 4
Việc 5
Việc 6
Việc 7
Việc 8
Việc 9
Việc 10
Việc 11
Việc 12
Hình 32: Biểu đồ Gantt
105
Đề xuất (đề cương) nghiên cứu (Research proposal)
Là tài liệu viết bởi nghiên cứu viên nhằm cung cấp thông tin chi tiết về nghiên cứu
dự kiến bao gồm lý do, mục đích, mục tiêu, phương pháp nghiên cứu cũng như kế
hoạch thực hiện về thời gian và kinh phí…
Chỉ số H (H-index)
Đo lường mức độ ảnh hưởng tích lũy của một nhà khoa học. Chỉ số H được tính
toán dựa vào số công trình công bố và số lần trích dẫn.
Ví dụ: Nếu nhà khoa học A có chỉ số H = 20 thì điều này có nghĩa là nhà khoa
học này có nhiều bài báo, trong đó có 20 bài báo, mỗi bài được trích dẫn ít
nhất là 20 lần.
106
Truy cập mở (Open access)
Cho phép tất cả mọi người được tiếp cận và tải các bài báo khoa học trực tuyến một
cách miễn phí.
Ví dụ: tạp chí PLOS One, F1000Research, BMC Medical Research
Methodology (cập nhật tháng 7/2017)
107
THUẬT NGỮ TIẾNG VIỆT THEO TRÌNH TỰ ABC
Âm tính giả, 81
Âm tính thật, 82
108
Biến rời rạc, 50
Biến số, 49
Biến số nền, 51
Biến thứ hạng, 49
Biến tỷ số, 50
Biểu đồ bánh, 98
Biểu đồ Box Whiskers, 99
Biểu đồ chấm rải rác, 102
Biểu đồ cột, 99
Biểu đồ cột chồng, 100
Biểu đồ cột liền/ Tổ chức đồ, 100
Biểu đồ dây, 102
Biểu đồ GANTT, 105
Biểu đồ tròn, 98
Biểu thị số liệu dưới dạng bản đồ, 103
Bình duyệt, 106
Bộ câu hỏi, 53
109
Chọn mẫu ngẫu nhiên phân tầng không theo tỷ lệ, 44
Chọn mẫu ngẫu nhiên phân tầng theo tỷ lệ, 44
Chọn mẫu nhiều giai đoạn, 45
Chọn mẫu thuận tiện, 39
Chọn mẫu xác suất, 40
Chọn mẫu xác suất tỷ lệ với kích cỡ quần thể, 42
Chuỗi hay trình tự phân bổ, 46
Cỡ mẫu, 36
Cơ sở dữ liệu, 59
Công thức tính cỡ mẫu, 36
110
Đo lường độ tập trung, 64
Độ nhạy, 84
Độ tin cậy, 56
Đối tượng nghiên cứu, 36
Đơn vị mẫu, 34
Đường cong ROC, 83
Dương tính giả, 82
Dương tính thật, 82
Ghép cặp, 17
Ghép cặp ở mức cá thể, 17
Ghép cặp theo nhóm, 17
Giả thuyết của nghiên cứu viên – Ha/H1, 12
Giả thuyết Ho, 12
Giá trị bất thường, 61
Giá trị bị thiếu, 61
Giá trị cấu trúc, 58
Giá trị đồng hướng, 57
Giá trị dự đoán âm tính, 82
Giá trị dự đoán dương tính, 82
Giá trị hội tụ, 57
Giá trị khái niệm, 57
Giá trị ngoại lai, 62
Giá trị nội dung, 57
Giá trị p, 70
Giá trị tiêu chuẩn, 57
Giá trị vô lý, 61
Giảm nguy cơ tương đối, 75
Giảm nguy cơ tuyệt đối, 75
Giám sát viên, 52
111
H
Hệ số hồi quy, 78
Hệ số tác động của tạp chí, 106
Hệ số thiết kế, 37
Hệ số tương quan, 77
Hệ số tương quan nội cụm, 37
Hệ số xác định, 78
Hiệu dụng, 104
Hiệu lực, 103
Hiệu quả, 103
Hiệu số nguy cơ, 74
Hiệu ứng công nhân khỏe mạnh, 94
Hiệu ứng Hawthorne, 91
Hiệu ứng Rosenthal, 91
Hồ sơ y tế, 55
Hội đồng đạo đức, 96
Hồi quy, 78
Hồi quy Cox, 81
Hồi quy logistic, 78
Hồi quy Poisson, 78
Hồi quy tuyến tính, 78
112
Kiểm định Khi bình phương, 74
Kiểm định Kruskal-Wallis, 74
Kiểm định Mann-Whitney, 74
Kiểm định một chiều/một đuôi/ một phía, 70
Kiểm định phi tham số, 73
Kiểm định t độc lập, 71
Kiểm định t ghép cặp, 72
Kiểm định tham số, 71
Kỳ vọng sống, 84
113
Nghiên cứu một trường hợp bệnh, 15
Nghiên cứu phân tích, 15
Nghiên cứu quan sát, 14
Nghiên cứu sinh thái, 15
Nghiên cứu thăm dò, 31
Nghiên cứu theo dõi dọc, 27
Nghiên cứu thuần tập, 18
Nghiên cứu thuần tập hồi cứu, 18
Nghiên cứu thuần tập lịch sử, 18
Nghiên cứu thuần tập tiến cứu, 19
Nghiên cứu thuần tập tương lai, 19
Nghiên cứu thực nghiệm, 21
Nghiên cứu triển khai, 30
Nghiên cứu tương quan, 15
Nghiên cứu viên chính, 105
Nguồn số liệu, 52
Ngụy biện sinh thái, 95
Nguy cơ quy thuộc, 76
Nguy cơ quy thuộc phần trăm, 76
Nguy cơ quy thuộc quần thể, 76
Nguy cơ quy thuộc quần thể phần trăm, 77
Nguy cơ tương đối, 74
Nguy cơ/ tỷ lệ/ số ca mới mắc tích lũy, 86
Nhiễu, 91
Nối dài, 59
Nối dọc, 59
Nối ngang, 60
Nối rộng, 60
Phân bố chuẩn, 69
Phân bố đối xứng hình chuông, 68
Phân bổ ngẫu nhiên, 46
114
Phân bổ ngẫu nhiên đơn, 46
Phân bổ ngẫu nhiên theo khối, 47
Phân tích đa biến, 80
Phân tích đa tầng, 80
Phân tích đơn biến, 80
Phân tích dựa trên các cá thể hoàn thành nghiên cứu, 79
Phân tích dựa trên phân bổ ngẫu nhiên ban đầu, 79
Phân tích nhân tố, 80
Phân tích phương sai lặp lại, 73
Phân tích phương sai một chiều, 72
Phân tích số liệu, 63
Phân tích sống còn, 80
Phân tích thành phần chính, 80
Phỏng vấn có cấu trúc, 53
Phương pháp ghép cặp theo điểm xu hướng, 17
Phương pháp làm mù, 22
Phương pháp làm mù ba, 23
Phương pháp làm mù đôi, 22
Phương pháp làm mù đơn, 22
Phương pháp phân bổ định trước, 47
Phương sai, 66
115
Sai số đáp ứng, 93
Sai số điều tra viên, 94
Sai số do báo cáo, 95
Sai số hệ thống, 93
Sai số lựa chọn, 93
Sai số ngẫu nhiên, 93
Sai số nhớ lại, 94
Sai số phân loại/xếp lẫn, 95
Sai số phát hiện, 95
Sai số tham gia, 93
Sai số thu thập thông tin, 94
Sai số xác định/chẩn đoán, 93
Số cá thể cần can thiệp/điều trị, 75
Số hiện mắc, 85
Số liệu, 52
Số liệu sơ cấp, 52
Số liệu thô, 59
Số liệu thứ cấp, 52
Số mới mắc, 85
Số năm sống điều chỉnh theo chất lượng cuộc sống, 86
Số năm sống điều chỉnh theo mức độ bệnh tật, 86
Số năm sống khỏe mạnh mất đi do tàn tật, 87
Số năm sống mất đi do tử vong sớm, 86
Số năm sống tiềm tàng bị mất đi, 87
Sự kết hợp, 74
116
Thiết kế một nhóm, 28
Thiết kế song song, 29
Thiết kế theo "hình nêm", 29
Thống kê, 63
Thống kê mô tả, 64
Thống kê suy luận, 69
Thống kê y học, 64
Thống kê y sinh học, 64
Thử nghiệm cộng đồng, 23
Thử nghiệm lâm sàng, 24
Thử nghiệm lâm sàng giai đoạn I, 25
Thử nghiệm lâm sàng giai đoạn II, 25
Thử nghiệm lâm sàng giai đoạn III, 25
Thử nghiệm lâm sàng giai đoạn IV, 25
Thử nghiệm mở, 23
Thử nghiệm ngẫu nhiên có đối chứng, 21
Thử nghiệm ngẫu nhiên có đối chứng theo cụm, 21
Tiêu chuẩn loại trừ, 35
Tiêu chuẩn lựa chọn, 35
Tính cấp thiết, 7
Tính đại diện, 58
Tính giá trị, 84
Tính giá trị của nghiên cứu, 58
Tính giá trị của thang đo, 57
Tính giá trị nội tại, 58
Tính khả thi, 7
Tính mới, 7
Tính ứng dụng, 8
Tính xác đáng, 8
Tổng quan hệ thống, 10
Tổng quan mô tả, 10
Tổng quan tài liệu, 9
Tổng tỷ suất sinh, 87
Trung bình, 64
117
Trung vị, 65
Truy cập mở, 107
Tử vong mẹ, 89
Tương quan, 77
Tương quan nghịch, 77
Tương quan thuận, 77
Tương tác, 91
Tỷ lệ, 81
Tỷ lệ không tham gia nghiên cứu, 55
Tỷ lệ tham gia, 36
Tỷ lệ trả lời, 36
Tỷ lệ từ chối, 55
Tỷ số, 81
Tỷ số chênh, 75
Tỷ số chết mẹ, 89
Tỷ số khả năng có kết quả âm tính, 83
Tỷ số khả năng có kết quả dương tính, 83
Tỷ số nguy cơ, 74
Tỷ số nguy hại, 80
Tỷ số phân bổ, 48
Tỷ số tử vong mẹ, 89
Tỷ suất, 81
Tỷ suất chết/mắc, 90
Tỷ suất hiện mắc, 85
Tỷ suất mới mắc, 85
Tỷ suất sinh thô, 90
Tỷ suất tấn công, 90
Tỷ suất tấn công thứ phát, 90
Tỷ suất tử vong, 87
Tỷ suất tử vong đặc trưng theo chủng tộc, 88
Tỷ suất tử vong đặc trưng theo nguyên nhân, 88
Tỷ suất tử vong đặc trưng theo nhóm tuổi, 88
Tỷ suất tử vong thô, 87
Tỷ suất tử vong trẻ dưới 1 tuổi, 89
118
Tỷ suất tử vong trẻ dưới 5 tuổi, 89
Tỷ suất tử vong trẻ sơ sinh, 88
Xử lý số liệu, 61
Xung đột lợi ích, 96
119
THUẬT NGỮ TIẾNG ANH THEO TRÌNH TỰ ABC
Background variables, 51
Bar chart, 99
Beta error, 91
Bias, 93
Binary variable, 49
Biostatistics, 64
Blinding, 22
Blocking randomization, 47
Box-and-Whiskers plot, 99
120
C
121
Crude birth rate - CBR, 90
Crude death rate - CDR, 87
Cumulative incidence, 86
Cumulative incidence proportion, 86
Cumulative incidence risk, 86
DALYs, 86
Data, 52
Data analysis, 63
Data cleaning, 61
Data processing, 61
Data repository, 59
Data source, 52
Databank, 59
Database, 59
Dependent variable, 51
Descriptive statistics, 64
Descriptive study, 14
Design effect - DE, 37
Detection bias, 95
Deterministic method of allocation, 47
Dichotomous variable, 49
Disability-adjusted life years, 86
Discontinuous variable, 50
Discrete variable, 50
Disproportionate stratified sampling, 44
Double-blind study, 22
Dummy table, 63
122
E
Ecological fallacy, 95
Ecological study, 15
Effectiveness, 103
Efficacy, 103
Efficiency, 104
Error, 92
Ethics committee - EC, 96
Evaluation research, 31
Evidence, 105
Evidence-based medicine or EBM, 27
Excess kurtosis, 68
Exclusion criteria, 35
Experimental study, 21
Exploratory study, 31
External validity, 58
Face validity, 57
Factor analysis, 80
False negative, 81
False positive, 82
Feasibility, 7
Field interviewer, 52
Field supervisor, 52
Follow-up, 27
Frequency distribution table, 97
Frequency matching, 17
123
G
Haphazard sampling, 39
Hawthorne effect, 91
Hazard ratio – HR, 80
Health system research, 32
Healthy worker effect, 94
H-index, 106
Histogram chart, 100
Historical cohort study, 18
Hypothesis testing, 70
Impact evaluation, 32
Implementation research, 30
Incidence, 85
Incidence rate, 85
Inclusion criteria, 35
Independent t-test, 71
Independent variable, 50
Individual matching, 17
Infant mortality rate - IMR, 89
Inferential statistics, 69
Information bias, 94
Informed consent, 96
Institutional review board - IRB, 96
124
Intention-to-treat analysis - ITT, 79
Interaction, 91
Internal consistency, 56
Internal validity, 58
Interquartile range - IQR, 66
Inter-raters reliability, 56
Interval variable, 50
Interviewer bias, 94
Intraclass correlation coefficient – ICC, 37
Kappa coefficient, 56
Kruskal-Wallis test, 74
Kurtosis, 67
Leptokurtic, 68
Life expectancy, 84
Likert scale, 53
Line chart, 102
Linear regression, 78
Literature review, 9
Logistic regression, 78
Longitudinal study, 27
Loss to follow-up, 94
125
M
Mann-Whitney U test, 74
Map chart, 103
Masking, 22
Matched pairs, 17
Matching, 17
Maternal mortality, 89
Maternal mortality ratio – MMR, 89
Mean, 64
Measures of central location, 64
Measures of dispersion, 65
Median, 65
Medical records, 55
Medical statistics, 64
Merge data, 60
Mesokurtic, 68
Misclassification bias, 95
Missing data, 61
Mode, 65
Mortality rate, 87
Multilevel analysis, 80
Multi-stage sampling, 45
Multivariable analysis, 80
Narrative review, 10
Needs assessment, 33
Negative correlation, 77
Negative Likehood Ratio – NLR, 83
Negative Predictive Value - NPV, 82
Negative skewness, 67
Neonatal mortality rate, 88
Nested case-control studies, 20
126
Nominal categorical data, 49
Nonconcurrent cohort, 18
Non-parametric tests, 73
Non-probability sampling, 39
Non-response rate, 55
Normal distribution, 68
Novelty, 7
Null hypothesis, 12
Number needed to treat – NNT, 75
Observational study, 14
Odds ratio - OR, 75
One-tailed test, 70
Open access, 107
Open trial, 23
Ordinal variable, 49
Out of range, 61
Outcome evaluation, 31
Outcome variable, 51
Outlier, 62
Output variable, 51
p value, 70
Paired t-test, 72
Parallel assignment/design, 29
Parametric tests, 71
Participation bias, 93
Peer review, 106
Peer-reviewed journal, 106
Per protocol analysis - PP, 79
Phase I trial, 25
127
Phase II trial, 25
Phase III trial, 25
Phase IV trial, 25
Pie chart, 98
Platykurtic, 68
Poisson regression, 78
Policy brief, 105
Polyline, 101
Population Attributable Risk - PAR, 76
Population Attributable Risk %, 77
Positive correlation, 77
Positive Likehood Ratio – PLR, 83
Positive Predictive Value - PPV, 82
Positive skewness, 67
Power, 37
Prevalence, 85
Prevalence rate, 85
Primary data, 52
Principal component analysis – PCA, 80
Principal investigator - PI, 105
Probability proportional to size– PPS – sampling, 42
Probability sampling, 40
Process evaluation, 31
Program evaluation, 31
Propensity score matching-PSM, 17
Proportion, 81
Proportionate stratified random sampling, 44
Prospective cohort, 19
Purposive sampling, 40
128
Q
QALYs, 86
Qualitative variable, 49
Quality assurance, 56
Quality-adjusted life years, 86
Quantitative variable, 50
Quasi-experimental, 24
Questionnaire, 53
Quota sampling, 39
129
Representative sample, 35
Representativeness, 58
Research ethics, 96
Research gap, 9
Research proposal, 106
Research protocol, 33
Research question, 12
Response bias, 93
Response rate, 36
Retrospective study, 18
Risk difference – RD, 74
Risk ratio – RR, 74
ROC curve, 83
Rosenthal effect, 91
R-square, 78
Sample, 34
Sample size, 36
Sample size formula/equation, 36
Sampling, 38
Sampling frame, 34
Sampling unit, 34
Scatter, 102
Scientific publications, 106
Secondary attack rate, 90
Secondary data, 52
Selection bias, 93
Sensitivity, 84
Sex-specific mortality rate, 88
Sign test, 73
Simple random sampling, 41
Simple Randomization, 46
130
Single group design, 28
Single-blind study, 22
Skewness, 67
Snowball sampling, 40
Specific objective, 13
Specificity, 84
Stacked bar chart, 100
Standard deviation, 66
Standard error, 69
Standard normal distribution, 69
Statistical significance, 70
Statistics, 63
Stepped wedge design, 29
Stratified random sampling, 44
Structured interview, 53
Study participant/subject/respondent, 36
Study population, 34
Survival analysis, 80
Systematic error, 93
Systematic random sampling, 41
Systematic review, 10
Test-retest reliability, 56
Total fertility rate, 87
Triple-blind study, 23
True negative, 82
True positive, 82
T-test, 71
Two-by-two table, 98
Two-tailed test, 71
Tỷ suất tử vong đặc trưng theo giới tính, 88
Type I error, 91
Type II error, 91
131
U
Validity, 84
Variable, 49
Variance, 66
Vertification bias, 93
132
TÀI LIỆU THAM KHẢO[1-36]
133
16. Oxford Research. Glossary of key terms: Oxford University Press; 2009.
17. Public Health Accreditation Board (PHAB). PHAB Acronyms and Glossary of
Terms. USA. 2011. 38 p.
18. Ruth B, Beaglehole R, Kjellström T. Basic Epidemiology. Second Edition.
Geneva, Switzerlands: WHO Library Cataloguing-in-Publication Data; 2006. 226 p.
19. Schulz KF, Grimes DA. Case-control studies: research in reverse. The
Lancet. 2002;359(9304):431-4.
20. Schulz KF, Grimes DA. Generation of allocation sequences in randomised
trials: chance, not choice. The Lancet. 2002;359(9304):515-9.
21. Schulz KF, Grimes DA. Allocation concealment in randomised trials:
defending against deciphering. The Lancet. 2002;359(9304):614-8.
22. Schulz KF, Grimes DA. Blinding in randomised trials: hiding who got what.
The Lancet. 2002;359(9304):696-700.
23. Schulz KF, Grimes DA. Sample size slippages in randomised trials:
exclusions and the lost and wayward. The Lancet. 2002;359(9304):781-5.
24. Schulz KF, Grimes DA. Unequal group sizes in randomised trials: guarding
against guessing. The Lancet. 2002;359(9304):966-70.
25. Trường Đại học Y Dược thành phố Hồ Chí Minh. Phương pháp nghiên cứu
khoa học cơ bản dành cho bác sĩ lâm sàng. Hồ Chí Minh, Việt Nam. 2014. 109 p.
26. Trường Đại học Y Hà Nội. Tài liệu hướng dẫn xây dựng đề cương nghiên
cứu khoa học Y Dược. Hà Nội, Việt Nam: NXB Y Học; 2010.
27. Trường Đại học Y tế công cộng. Câu hỏi và trả lời về một số vấn đề thường
gặp trong quá trình làm luận văn sau đại học. Hà Nội, Việt Nam. 2015.
28. UNFPA Việt Nam. Các thuật ngữ trong theo dõi, đánh giá và quản lý dựa trên
kết quả. Hà Nội, Việt Nam: NXB Giao thông vận tải; 2008. 64 p.
29. Viện Nghiên cứu Y xã hội học (IMS). Bảng thuật ngữ Dịch tễ học và Thống kê
2016 [cited 2016 03/11].
30. Whitley E, Ball J. Statistics review 6: Nonparametric methods. Critical Care.
2002;6(6):509-13.
31. World Health Organization (WHO). Health Systems Strengthening Glossary
[cited 2016 10/10]. Available from:
http://www.who.int/healthsystems/hss_glossary/en/.
32. World Health Organization (WHO). Glossary of terms in health research. A
practical guide for health researchers. Geneva, Switzerlands.
134
33. World Health Organization (WHO). Health Promtion Glossary. Nutbeam D,
editor. Geneva, Switzerlands. 1998. 36 p.
34. Austin PC. An Introduction to Propensity Score Methods for Reducing the
Effects of Confounding in Observational Studies. Multivariate Behavioral Rese.
2011;46(3):399-424.
35. Rosenbaum P.R., Rubin D.B. The central role of the propensity score in
observational studies for causal effects. Biometrika. 1983;70:41-55.
36. Sackett DL, Rosenberg WM, Gray JA, Haynes RB, Richardson WS. Evidence
based medicine: what it is and what it isn’t. BMJ. 1996;312(7023):71-2.
135