Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia

Theo nhà thống kê học Arthur Lyon Bowley, thống kê là “báo cáo bằng số của các dữ kiện trong bất kỳ bộ phận của cuộc điều tra được đặt trong mối quan hệ với nhau” (numerical statements of facts in any department of inquiry placed in relation to each other).

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia trang 1

Trang 1

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia trang 2

Trang 2

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia trang 3

Trang 3

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia trang 4

Trang 4

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia trang 5

Trang 5

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia trang 6

Trang 6

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia trang 7

Trang 7

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia trang 8

Trang 8

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia trang 9

Trang 9

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 13 trang Danh Thịnh 12/01/2024 800
Bạn đang xem 10 trang mẫu của tài liệu "Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia

Bài giảng Thống kê ứng dụng - XD - Chương 1: Giới thiệu thống kê học - Đặng Thế Gia
1/21/2019
1
Bộ môn Kỹ Thuật Xây Dựng
Khoa Công Nghệ, Trường Đại Học Cần Thơ
MÔN HỌC
THỐNG KÊ ỨNG DỤNG - XD (KC107)
GIÁO VIÊN PHỤ TRÁCH
ĐẶNG THẾ GIA
Chương 1:
GIỚI THIỆU THỐNG KÊ HỌC
(Introduction to Statistics)
Bộ môn Kỹ thuật xây dựng Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1. Định nghĩa
2. Thống kê vs Xác suất
3. Các khái niệm trong thống kê
4. Phương pháp & Quá trình 
thống kê
5. Dữ liệu thống kê & Thang đo
Nội dung chương
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Các định nghĩa thống kê
• Theo nhà thống kê học Arthur Lyon Bowley, thống kê là 
“báo cáo bằng số của các dữ kiện trong bất kỳ bộ phận 
của cuộc điều tra được đặt trong mối quan hệ với nhau” 
(numerical statements of facts in any department of inquiry placed in 
relation to each other).
• Theo từ điển Merriam-Webster, thống kê là “những dữ 
kiện được phân loại đại diện cho các điều kiện của một 
người trong một nhà nước - đặc biệt là các dữ kiện mà nó 
có thể được định nghĩa bằng các con số hoặc bất kỳ dạng 
bảng hoặc phân loại sắp xếp khác” (classified facts 
representing the conditions of a people in a state – especially the facts 
that can be stated in numbers or any other tabular or classified 
arrangement).
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
2
Thống kê học
• Thống kê học là ngành nghiên cứu của tập hợp nhiều 
lĩnh vực khác nhau bao gồm thu thập (collection), phân 
tích (analysis), giải thích (interpretation), trình bày
(presentation), và tổ chức (organization) dữ liệu.
• Thống kê học là môn khoa học nghiên cứu hệ thống các 
phương pháp thu thập, xử lý và phân tích các con số 
(mặt lượng) của những hiện tượng số lớn để tìm hiểu bản 
chất và tính quy luật (mặt chất) vốn có của nó trong 
những điều kiện thời gian và địa điểm cụ thể.
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Thống kê học
• Việc áp dụng thống kê trong các lĩnh vực như khao học, 
công nghiệp, hoặc các vấn đề xã hội, thật cần thiết để bắt 
đầu nghiên cứu với một quần thể thống kê (statistical 
population) hoặc một tiến trình (statistical model process).
• Quần thể là một đa dạng các chủ để như “tổng số dân 
của một châu lục” hay “số nguyên tử hydro trong tự 
nhiên”. Thống kê đề cập tới tất cả các khía cạnh của dữ 
liệu bao gồm việc lập kế hoạch thu thập dữ liệu (mẫu) cho 
các cuộc khảo sát và thí nghiệm.
• Khi không thể khảo sát trên một quần thể/tổng thể, chúng 
ta sẽ tiến hành khảo sát/thí nghiệm trên mẫu.
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Thống kê học là một ngành học giúp ta thực hiện những 
công việc sau:
1. Thu thập dữ liệu (data) và thiết kế các nghiên cứu định 
lượng
2. Tóm tắt thông tin nhằm hỗ trợ quá trình tìm hiểu về một 
vấn đề hoặc đối tượng nào đó
3. Kiểm định để đưa ra những kết luận (information) dựa 
trên các số liệu giả thuyết, và
4. Ước lượng hiện tại hoặc dự báo tương lai (information)
Thống kê thường đi kèm với môn học song hành là Xác 
xuất, là ngành học nhằm đưa ra các mô hình toán học về sự 
ngẫu nhiên và cho phép tính toán về sự ngẫu nhiên trong 
những trường hợp phức tạp.
Thống kê làm những việc gì?
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
THỐNG KÊ & XÁC SUẤT 
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
3
Xác suất là dự đoán khả năng xảy ra của những dữ kiện 
trong tương lai, trong khi thống kê là việc phân tích tần suất 
của những dữ kiện đã xảy ra (Probability deals with predicting the 
likelihood of future events, while statistics involves the analysis of the 
frequency of past events).
Xác suất cơ bản là một ngành lý thuyết của toán học trong 
đó nghiên cứu hệ quả của các định nghĩa toán học. Thống 
kê cơ bản là một ngành ứng dụng của toán học trong đó làm 
cho các quan sát trong thế giới thực trở nên có ý nghĩa 
(Probability is primarily a theoretical branch of mathematics, which 
studies the consequences of mathematical definitions. Statistics is 
primarily an applied branch of mathematics, which tries to make sense of 
observations in the real world).
Thống kê vs Xác Suất [1]
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Xác suất là ngôn ngữ toán học của sự ngẫu nhiên trong đó 
cho phép bạn lý giải hoặc lập báo cáo dự đoán về kết quả 
của các hệ thống hoặc quá trình vật lý có tính ngẫu nhiên 
hoặc không chắc chắn (Probability is the mathematical language of 
randomness which enables you to reason about or make predictive 
statements about outcomes of physical systems or processes that have 
randomness or uncertainty).
Thống kê làm việc theo cách khác: nó mô tả và tóm tắt đặc 
điểm của các kết quả quan sát, hoặc dữ liệu; chiết xuất 
mẫu/mô hình từ nó, và báo cáo về cơ chế nền tảng hoặc cấu 
trúc bản chất của hệ thống hay quy trình vật lý (Statistics works 
the other way: it describes and summarizes characteristics of observed 
outcomes, or data, extracts patterns from it, and makes statements about 
underlaying mechanisms or intrinsic structures of the physical systems or 
processes).
Thống kê vs Xác Suất [2]
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Quan hệ mưa rào và dòng chảy lũ
• Khi nghiên cứu quan hệ mưa rào và dòng chảy lũ của lưu 
vực A, ta thấy sự xuất hiện lũ trên các sông rất ngẫu 
nhiên. Cùng một lượng mưa rơi trên lưu vực nhưng ở 
những lần khác nhau sẽ cho lưu lượng đỉnh lũ khác nhau.
• Khi quan sát hiện tượng ngẫu nhiên một ít lần thì không 
thấy theo quy luật nào! Nhưng quan sát nhiều lần ta thấy 
có một quy luật nhất định, gọi là quy luật đám đông.
• Trong tự nhiên các hiện tượng ngẫu nhiên rất phức tạp, do 
đó ta phải thống kê nhiều số liệu ngẫu nhiên này để tính 
toán xác suất xuất hiện, Vì vậy muốn ứng dụng lý thuyết 
xác suất vào thực tế ta phải sử dụng lý thuyết thống kê 
(thống kê xác suất).
Thống kê và Xác Suất - Ví dụ
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
CÁC KHÁI NIỆM TRONG THỐNG KÊ
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
4
• Tổng thể (quần thể, population): một nhóm gồm c ...  cần thiết.
Tổng thể
Thống kê suy luận
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Thống kê suy luận là quá trình tạo ra một ước lượng, dự 
đoán, hay quyết định về tổng thể dựa trên mẫu. 
• Những suy luận có thể mang hình thức trả lời có hoặc 
không các câu hỏi về dữ liệu (kiểm định giả thuyết), ước 
tính số lượng dữ liệu (ước lượng), mô tả các liên kết của 
dữ liệu (tương quan) và các mối quan hệ của các mẫu 
trong dữ liệu (ví dụ sử dụng phân tích hồi quy). 
• Suy luận có thể mở rộng để dự báo, tiên đoán và ước 
tính giá trị không được chú ý đến hoặc sự liên kết với 
tổng thể được nghiên cứu. Nó có thể bao gồm các biến 
ngoại suy hoặc biến nội suy của chuỗi thời gian hoặc dữ 
liệu không gian, và khai thác dữ liệu.
Thống kê suy luận
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
6
Thống kê suy luận
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Quá trình thống kê
(Statistical process)
1) Lập kế hoạch nghiên cứu, bao gồm việc tìm kiếm số liệu 
để trả lời cho các nghiên cứu. Xem xét việc lựa chọn đối 
tượng nghiên cứu, lưu ý tầm quan trọng của đạo đức 
nghiên cứu. 
2) Thiết kế nghiên cứu: ngăn sự ảnh hưởng của các biến 
gây nhiễu, tránh lỗi xử lý và lỗi thực nghiệm.
3) Tiến hành thực nghiệm và phân tích dữ liệu theo các giao 
thức (experimental protocol) đã định.
4) Kiểm tra bộ dữ liệu thông qua các phân tích thứ cấp 
(secondary analysis) để đưa ra các giả thuyết mới cho 
những nghiên cứu trong tương lai.
5) Lập hồ sơ và trình bày kết quả nghiên cứu.
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Quá trình thống kê
(Statistical process)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Quá trình thống kê
(Statistical process)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
7
DỮ LIỆU & THANG ĐO
STATISTICAL DATA TYPES &
LEVELS OF MEASUAREMENT
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Dữ liệu (data), thông tin (information), kiến thức
(knowledge), và trí tuệ (wisdom) là những khái niệm có liên 
quan chặt chẽ; mỗi cái đều có vai trò riêng trong mối quan 
hệ với những cái khác.
• Dữ liệu được thu thập và phân tích để tạo ra thông tin
thích hợp cho việc ra quyết định, trong khi kiến thức có 
nguồn gốc từ một lượng phong phú của kinh nghiệm đối 
phó với thông tin về một chủ đề. 
Dữ liệu
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Dữ liệu
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Dữ liệu (Data): là giá trị đại lượng cùng ngữ cảnh (biến cố 
hay sự kiện) đi kèm,
Ngữ cảnh của dữ liệu: “Five W’s”: Who, What, When, 
Where & Why, Có thể có cả “How”
- Thử nghiệm cấp độ bền chịu nén của bê tông: các giá 
trị cường độ chịu nén của tổ mẫu BT,
- Thí nghiệm cường độ chống cắt của đất, đá: các giá trị 
cường độ chống cắt cục bộ của tổ mẫu đất, đá, 
- Lượng mưa, lưu lượng con sông trên lưu vực,,: các 
con số đo đạc quan trắc về lượng mưa và lưu lượng, 
• Dữ liệu không có ngữ cảnh đi kèm thì hầu như vô nghĩa
Dữ liệu
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
8
Dữ liệu
https://www.climate-eval.org/blog/answer-42-data-information-and-knowledge
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Data Information
Statistics
Data vs Information
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Phân loại theo thuộc tính:
• Dữ liệu định tính (catergorial/qualitiative data)
• Dữ liệu định lượng (quantitative data)
• Phân loại theo cách thu thập:
• Dữ liệu sơ cấp
• Dữ liệu thứ cấp
Các loại dữ liệu
(Type of Data)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Chúng ta cần xác định các phương pháp phân tích thích 
hợp dựa vào mục đích nghiên cứu và bản chất của dữ liệu 
thống kê. 
• Tìm hiểu bản chất của dữ liệu thống kê qua khảo sát các 
cấp độ đo lường khác nhau vì mỗi cấp độ sẽ chỉ cho phép 
một số phương pháp nhất định.
• Khái niệm về số đo: là việc gán những giá trị hay ký hiệu 
cho những hiện tượng quan sát.
• Khái niệm về thang đo: là tạo ra một thang điểm để đánh 
giá đặc điểm của đối tượng nghiên cứu thể hiện qua sự 
đánh giá, nhận xét.
Các loại dữ liệu
(Type of Data)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
9
• Dữ liệu sơ cấp là do trực tiếp thu thập nên độ chính xác 
cao hơn. Dữ liệu sơ cấp giúp giải quyết cấp bách và kịp 
thời những vấn đề đặt ra. Tuy nhiên, dữ liệu sơ cấp phải 
qua quá trình thực tế mới có được, vì vậy việc thu thập dữ 
liệu sơ cấp thường tốn nhiều thời gian và chi phí. 
• Vì vậy, các nhà nghiên cứu sẽ phải cân nhắc khi nào sẽ 
phải thu thập dữ liệu sơ cấp và lựa chọn phương pháp thu 
thập hiệu quả để hạn chế nhược điểm này.
• Dữ liệu thứ cấp là dữ liệu đã có sẵn, không phải do mình 
thu thập, đã công bố nên dễ thu thập, ít tốn thời gian & chi 
phí trong quá trình thu thập, nhưng là loại tài liệu quan 
trọng trong việc nghiên cứu trong khoa học xã hội.
Dữ liệu sơ cấp & thứ cấp
(Primary & Secondary Data)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Dữ liệu thứ cấp chỉ cung cấp các thông tin mô tả tình hình, 
chỉ rõ qui mô của hiện tượng chứ chưa thể hiện được bản 
chất hoặc các mối liên hệ bên trong của hiện tượng nghiên 
cứu. 
• Dữ liệu thứ cấp là những thông tin đã được công bố nên 
thiếu cập nhật, đôi khi thiếu chính xác và không đầy đủ. 
• Tuy nhiên, dữ liệu thứ cấp cũng đóng một vai trò quan 
trọng do các lý do: Các dữ liệu thứ cấp có thể giúp người 
quyết định đưa ra giải pháp để giải quyết vấn đề trong 
những trường hợp thực hiện những nghiên cứu mà các 
dữ liệu thứ cấp là phù hợp mà không cần thiết phải có các 
dữ liệu sơ cấp.
Đặc tính của Dữ liệu thứ cấp
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Phương pháp thực nghiệm: thu thập dữ liệu trực tiếp qua 
các thực nghiệm có chủ định trên đối tượng nghiên cứu. 
Dữ liệu đúng & chính xác, mất thời gian & chi phí,...
• Phương pháp quan sát: được áp dụng khi không thể lấy
thông tin trực tiếp từ đối tượng nghiên cứu. Người nghiên 
cứu sẽ phải dùng các giác quan hoặc máy móc để quan 
sát đối tượng nghiên cứu trong một khoảng thời gian nhất 
định. Dữ liệu đúng & chính xác, đòi hỏi nhận lực & thời 
gian,...
• Phương pháp khảo sát trực tuyến: khảo sát qua thư điện 
tử hay các website. Ưu điểm của phương pháp này là thu 
thập dữ liệu với số lượng lớn, tiết kiệm chi phí, nhưng số 
lượng phản hồi thấp & kết quả chính xác tương đối,
Thu thập dữ liệu sơ cấp
(Data collection)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Theo Stanley Smith Stevens (1946): 
• Định tính (qualitative): định danh (nominal), 
• Định lượng (quantitative): thứ tự (ordinal), khoảng
(interval), và tỷ lệ (ratio scale).
• Mosteller và Tukey (1977): 
1. Names 
2. Grades (e.g. freshmen, sophomores etc.) 
3. Counted fractions bound by 0 and 1 
4. Counts (non-negative integers) 
5. Amounts (non-negative real numbers) 
6. Balances (any real number)
Các thang đo dữ liệu thống kê
(Levels of Measurement)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
10
• Chrisman (1998):
1. Nominal
2. Graded membership
3. Ordinal
4. Interval
5. Log-Interval
6. Extensive Ratio
7. Cyclical Ratio
8. Derived Ratio
9. Counts
10.Absolute
• Nelder (1990): continuous counts, continuous ratios, count 
ratios & phân loại (categorical modes)
Các thang đo dữ liệu thống kê
(Type of Data)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Thang đo định danh (nominal scala) là loại thang đo sử 
dụng cho dữ liệu định tính.
• Các biểu hiện của dữ liệu thuộc tính không có sự hơn 
kém, khác biệt về thứ bậc, không có thứ tự giữa các giá 
trị.
• Các giá trị (con số, mã hóa) không có mối quan hệ hơn 
kém, không thực hiện các phép tính đại số. 
• Các giá trị chỉ mang tính chất mã hóa để phân loại thuộc 
tình của dữ liệu và không mang bất kỳ ý nghĩa nào khác. 
Ví dụ: giới tính ta có thể đánh số 1 là nam, số 2 nữ.
Thang đo định danh
(Nominal Scala)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Thang đo thứ bậc (ordinal scala) là loại thang đo dùng 
cho các dữ liệu thuộc tính. Tuy nhiên, trường hợp này biểu 
hiện của dữ liệu có sự so sánh. 
• Có sự khác biệt không chính xác giữa các giá trị liên 
tiếp, nhưng có một trật tự có ý nghĩa đối với những giá trị 
đó, và cho phép bất kỳ sự chuyển đổi duy trì đơn hàng.
• Ví dụ: trình độ thành thạo của công nhân được phân từ
thợ bậc 1 đến 7. Phân loại giảng viên trong các trường đại 
học: Giáo sư, Phó giáo sư, Giảng viên chính, Giảng viên. 
• Thang đo này cũng không thực hiện được các phép tính 
đại số.
Thang đo thứ bậc
(Ordinal Scala)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Thang đo khoảng (interval scala) là loại thang đo cho các 
dữ liệu số lượng. Là loại thang đo cũng có thể dùng để 
xếp hạng các đối tượng nghiên cứu nhưng khoảng cách 
bằng nhau; là thang đo thứ bậc có các khoảng cách đều 
nhau.
• Có khoảng cách có ý nghĩa giữa các phép đo được xác 
định, nhưng giá trị bằng 0 là tùy ý (như trường hợp với 
kinh độ và đo nhiệt độ theo Celsius hoặc Fahrenheit), và 
cho phép chuyển đổi tuyến tính.
• Có thể thực hiện các phép tính đại số (trừ phép chia không 
có ý nghĩa). Ví dụ như điểm môn học của sinh viên. Sinh 
viên A có điểm thi là 8, sinh viên B có đểm là 4 thì không
thể nói rằng sinh viên A giỏi gấp hai lần sinh viên B.
Thang đo khoảng
(Interval Scala)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
11
• Thang đo tỷ lệ (ratio scala) có cả giá trị bằng không có ý 
nghĩa, khoảng cách giữa các phép đo khác nhau được xác 
định, và cho phép bất kỳ chuyển đổi định dạng lại.
• Là loại thang đo cũng có thể dùng dữ liệu có đặc tính số 
lượng. 
• Là thang đo cao nhất trong các loại thang đo định lượng. 
• Ngoài đặc tính của thang đo khoảng, phép chia có thể 
thực hiện được. Ví dụ: thu nhập trung bình một tháng của 
ông A là 2 triệu đồng và thu nhập của bà B là 4 triệu đồng 
thì ta có thể nói rằng thu nhập trung bình trong một tháng 
của bà B gấp 2 lần thu nhập của ông A.
Thang đo tỉ lệ
(Ratio Scala)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
So sánh các thang đo
(Comparision)
Incremental 
Progress
Measure
Property
Mathematical 
Operators
Advanced 
Operations Central Tendency
Nominal Classification, Membership =, != Grouping Mode
Ordinal Comparison, Level >, < Sorting Median
Interval
Difference, 
Affinity (mối
liên quan)
+, - Yardstick (thước đo) Mean, Deviation
Ratio Magnitude, Amount *, / Ratio
Geometric Mean, 
Coeff. of Variation
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
SỬ DỤNG SAI & DIỄN GIẢI SAI
MISUSE & MISINTERPRETATION
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Sử dụng sai mục đích các số liệu thống kê có thể có 
những kết quả không lường được;
• Những sai số nghiêm trọng trong mô tả và giải thích sai ý 
nghĩa, ngay cả các chuyên gia có kinh nghiệm; 
• Dẫn đến đưa ra quyết định sai. Ví dụ chính sách xã hội, 
nghề thuốc, và độ tin cậy của cấu trúc dựa trên các số liệu 
thống kê.
• Ngay cả khi các kỹ thuật thống kê được áp dụng một cách 
chính xác, kết quả có thể khó để giải thích cho những 
người thiếu chuyên môn. 
Sử dụng sai
(Misuse)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
12
• Ý nghĩa thống kê của một phương pháp có thể được gây 
ra bởi sự thay đổi ngẫu nhiên trong mẫu; có thể hoặc 
không thể đồng ý với đánh giá trực quan của mức ý nghĩa.
• Có ý kiến cho rằng kiến thức thống kê được cho là bị lạm 
dụng một cách quá bình thường bằng cách tìm ra hướng 
để giải thích các dữ liệu có ích cho người trình bày. 
• Sự nghi ngờ và hiểu sai về thống kê có liên qua đến câu 
nói, “có ba loại lừa dối: dối trá, rất dối trá và thống kê”. 
• Lạm dụng các số liệu thống kê có thể có được kể cả vô ý 
và có chủ ý.
Sử dụng sai & Lạm dụng
(Misuse)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Cách để tránh số liệu thống kê bao gồm sử dụng sơ đồ 
thích hợp và ngăn ngừa sai số.
• Sử dụng sai số có thể xảy ra khi kết luận là sai số quá lớn 
và yêu cầu có tính đại diện hơn so với giá trị thật, thường 
là cố ý hay vô ý không nhận thấy ra sai số mẫu.
• Đồ thị dạng cột được cho là biểu đồ đơn giản nhất để sử 
dụng và hiểu, các biểu đồ này có thể vẽ bằng tay hoặc 
bằng các chương trình máy tính đơn giản. 
• Nhưng hầu hết mọi người đều không nhìn ra giá trị sai 
lệch hay sai số, vì vậy những lỗi sai này không được sửa 
chữa. Nên mọi người thường tin vào kết quả ngay cả khi 
nó không phải là kết quả tốt.
Cách trách sử dụng sai & Lạm dụng
(Prevention)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Để làm cho dữ liệu thu thập được từ các số liệu thống kê 
đáng tin cậy và chính xác, mẫu được chọn phải có tính 
tổng thể;
• Theo Huff, “độ tin cậy của một mẫu có thể bị phá hủy giá 
trị sai lệch, cho phép một số mức độ hoài nghi”;
• Để hỗ trợ cho sự hiểu biết của các số liệu thống kê, Huff 
đã đề xuất một loạt các câu hỏi được hỏi trong mỗi trường 
hợp:
1. Ai nói vậy?
2. Làm thế nào để anh/chị biết
3. Những gì còn thiếu
4. Có ai thay đổi nội dung
5. Nó có ý nghĩa không
Cách trách sử dụng sai & Lạm dụng
(Prevention)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Khái niệm ‘tương quan’ cần đặc biệt lưu ý vì tiềm ẩn 
những nhầm lẫn. Phân tích thống kê của một bộ số liệu 
thường cho thấy chỉ hai biến (tính chất) của quần thể biến 
thiên với nhau như thể chúng có quan hệ với nhau. 
• Ví dụ 1: Thực nghiệm con cào cào. Ví dụ 2: một nghiên 
cứu về thu nhập hàng năm (biến 1) và tuổi thọ (biến 2) có 
khả năng dẫn đến mối tương quan rằng người nghèo 
thường có tuổi thọ thấp hơn người giàu.
• Hai biến được xem là tương quan (theo thống kê) đôi khi 
không phải làm nguyên nhân hay hệ quả của nhau. Mối 
tương quan này có thể được gây ra bởi một biến (hiện 
tượng) thứ ba mà trước đây không được xem xét (‘biến 
ẩn’ hoặc ‘biến gây nhiễu’). Không thể ngay lập tức suy 
ra sự tồn tại về một mối quan hệ nhân quả giữa hai biến.
Diễn giải sai tương quan
(Misinterpretation correlation)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
1/21/2019
13
Thank you!
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ

File đính kèm:

  • pdfbai_giang_thong_ke_ung_dung_xd_chuong_1_gioi_thieu_thong_ke.pdf