Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia

Thống kê mô tả (Descriptive statistics) bao gồm việc sắp xếp, tóm tắc và trình bày dữ liệu nhằm diễn giải một cách có ý nghĩa và hỗ trợ quá trình ra quyết định.

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia trang 1

Trang 1

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia trang 2

Trang 2

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia trang 3

Trang 3

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia trang 4

Trang 4

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia trang 5

Trang 5

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia trang 6

Trang 6

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia trang 7

Trang 7

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia trang 8

Trang 8

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia trang 9

Trang 9

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 11 trang Danh Thịnh 12/01/2024 3240
Bạn đang xem 10 trang mẫu của tài liệu "Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia

Bài giảng Thống kê ứng dụng - XD - Chương 2: Kỹ thuật mô tả đồ họa - Đặng Thế Gia
10/4/2017
1
Bộ môn Kỹ Thuật Xây Dựng
Khoa Công Nghệ, Trường Đại Học Cần Thơ
MÔN HỌC
THỐNG KÊ ỨNG DỤNG (KC107)
GIÁO VIÊN PHỤ TRÁCH
ĐẶNG THẾ GIA
Chương 2:
KỸ THUẬT MÔ TẢ ĐỒ HỌA
(Graphical Descriptive Techniques)
1. Giới thiệu
2. Các kiểu dữ liệu (Types of data)
3. Kỹ thuật đồ họa cho dữ liệu định lượng
(Graphical Techniques for Quantitative Data)
4. Các dạng biểu đồ (Pie Charts, Bar Charts, 
Line Charts)
5. Sơ đồ phân tán (Scatter Diagrams)
Nội dung chương
GIỚI THIỆU
INTRODUCTION
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
10/4/2017
2
• Thống kê mô tả (Descriptive statistics) bao gồm việc sắp
xếp, tóm tắc và trình bày dữ liệu nhằm diễn giải một cách
có ý nghĩa và hỗ trợ quá trình ra quyết định.
• Các phương pháp thống kê mô tả sử dụng:
• Các kỹ thuật đồ họa (Chương 2)
• Các phép đo mô tả số (Chương 3)
• Những phương pháp này áp dụng cho:
• Tổng thể/quần thể (the entire population)
• Mẫu (the population sample)
Giới thiệu
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
CÁC KIỂU DỮ LIỆU
TYPES OF DATA
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Các kiểu dữ liệu
(Types of data)
• Biến (Variable) – một đặc tính của tổng thể hoặc mẫu mà 
chúng ta quan tâm đến.
• Lựa chọn sản phẩm trên kệ hàng
• Chi phí đầu tư
• Thời gian chờ xe buýt
• Dữ liệu (Data) – giá trị thực của biến
• Dữ liệu định lượng (Quantitative data) – các quan sát 
dạng số (numerical observations)
• Dữ liệu định lượng (Qualitative data) – các quan sát 
thang đo
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Dữ liệu định lượng
Tuổi – Thu nhập
55 75000
42 68000
. .
. .
Tăng cân
+10
+5
.
.
Dữ liệu định tính
Người Đã lập gia đình
1 yes
2 no
3 no
. .
. .
Giáo viên Hạng
1 Giảng viên
2 Giáo sư
3 Phó giáo sư
. .
. .
Với dữ liệu định tính, 
tất cả những gì chúng ta 
có thể làm là, tính toán 
tỷ lệ mà các dữ liệu rơi 
vào mỗi thang đo.
Giảng viên GS PhóGS Trợ giảng Tổng
15 25 5 15 60
25% 41.67% 8.33% 25%
Dữ liệu định tính & Dữ liệu định lượng
(Categorical/Qualitative & Quantitative Data)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
10/4/2017
3
• Hiểu rõ về kiểu dữ liệu sẽ giúp chọn lựa được các kỹ thuật 
phù hợp để sử dụng.
• Đôi khi, đặc biệt là khi thực hiện các kỹ thuật phi tham số, 
cần phải biết liệu dữ liệu có thứ tự (rank) hay không. 
• Kiểu phân tích cho phép đối với mỗi kiểu dữ liệu:
• Dữ liệu định lượng – Các tính toán số học
• Dữ liệu định tính – đếm số lượt quan sát của mỗi cấp 
thang đo
• Dữ liệu có thứ tự – các tính toán dựa trên một trình tự 
(ordering process)
Chọn kiểu dữ liệu
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Dữ liệu cắt ngang/thời điểm (Cross-sectional Data) được 
thu thập tại một thời điểm nhất định: Khảo sát thị trường 
(quan sát các sở thích theo giới tính, tuổi,), Điểm kiểm tra 
trong một khóa học của môn TKUD, Lương khởi điểm của 
sinh tốt nghiệp ngành XD,
• Dữ liệu chuỗi thời gian (Time-series data) được thu thập 
qua các thời điểm liên tiếp: Giá vàng lúc đóng cửa hàng 
tuần, Lượng dầu thô nhập khẩu hàng tháng,
• Dữ liệu cross-section chỉ ghi nhận sự kiện tại một thời 
điểm, trong khi dữ liệu time-series phải theo dõi đối tượng 
trong một thời gian có thể là nhiều năm tháng. Do đó, các 
nghiên cứu theo thời gian thường tốn kém hơn và công 
phu hơn các nghiên cứu tại một thời điểm.
Dữ liệu thời điểm & Dữ liệu chuỗi thời gian
(Cross-Sectional & Time-Series Data)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
KỸ THUẬT ĐỒ HỌA 
CHO DỮ LIỆU ĐỊNH LƯỢNG
GRAPHICAL TECHNIQUES 
FOR QUANTITATIVE DATA
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Ví dụ: Cung cấp thông tin liên quan đến hóa đơn hàng 
tháng của thuê bao mới trong tháng đầu tiên sau khi ký 
kết hợp đồng với một nhà mạng điện thoại.
• Các bước thực hiện:
• Thu thập dữ liệu
• Lập bảng phân phối tần suất
• Vẽ biểu đồ
10/4/2017
4
Thu thập dữ liệu
Bills
42.19
38.45
29.23
89.35
118.04
110.46
0.00
72.88
83.05
.
.
(Có 200 điểm dữ liệu)
Lập bảng phân bố tần suất
Cần phần thành bao nhiêu lớp/nhóm?
Số quan sát Số lớp
< 50 5-7
50 - 200 7-9
200 – 500 9-10
500 - 1,000 10-11
Chiều rộng lớp = [Khoảng giá trị] / [Số lớp/nhóm]
[119.63 - 0] / [8] = 14.95 15
Giá trị quan sát lớn nhấtGiá trị sát lớn nhấti trị qan sát lớn nhấtGiá trị quan sát lớn nhất Giá trị quan sát nhỏ nhấti trị quan sát nhỏ nhấtGiá trị quan sát nhỏ nhấti trị quan sát nhỏ nhất
0
20
40
60
80
1
5
3
0
4
5
6
0
7
5
9
0
1
0
5
1
2
0
M
o
re
Bills
F
re
q
u
e
n
c
y
Vẽ biểu đồ
Bin Frequency
15 71
30 37
45 13
60 9
75 10
90 18
105 28
120 14
More 0
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
0
20
40
60
80
1
5
3
0
4
5
6
0
7
5
9
0
1
0
5
1
2
0
M
o
re
Bills
F
re
q
u
e
n
c
y
Biểu đồ cho ta thông tin gì?
Khoảng ½ số hóa 
đơn có giá trị nhỏ
71+37=108 13+9+10=32
Chỉ vài hóa đơn trong 
khoảng trung bình
Khá nhiều hóa 
đơn có giá trị cao
18+28+14=60
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Đôi khi tần suất tương đối (tỉ lệ) sẽ thích hợp hơn khi 
tần suất để biểu diễn của số quan sát rơi vào trong 
mỗi nhóm.
• Tần suất tương đối thường dùng khi:
• Nghiên cứu tần suất tương đối của tổng thể
• So sánh nhiều biểu đồ 
• Số lượng quan sát khác nhau trong các mẫu 
nghiên cứu
Tần suất tương đối của nhóm =
Tần suất nhóm
Tổng số quan sát
Tần suất tương đối
(Relative frequency)
Đặng Thế Gia, BM Kỹ thuật xây dựng. ĐH Cần Thơ
• Thông thường chiều rộng nhóm/lớp bằng nhau, nhưng đôi 
khi cũng cần sử dụng các chiều rộng nhóm/lớp không 
đồng đều.
• Độ rộng nhóm/lớp không đồng đều được sử dụng khi tần 
số liên quan đến những nhóm/lớp học quá thấp. Khi đó:
• Vài nhóm được kết hợp lại với nhau để tạo thành một 
nhóm rộng hơn và “đông đúc” hơn.
• Có thể tạo thành các nhóm mở ở 2 đầu (cao nhất và 
thấp nhất) của biểu đồ.
Chiều rộng nhóm
(Class width)
10/4/2017
5

File đính kèm:

  • pdfbai_giang_thong_ke_ung_dung_xd_chuong_2_ky_thuat_mo_ta_do_ho.pdf