Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác

Có ba phương pháp cơ bản để so sánh sự tương hợp giữa hai ảnh là SAD, SSD và NCC. Phương pháp NCC sử dụng sự tương quan chéo giữa các điểm ảnh nên các phép toán rất phức tạp. Chúng bao gồm phép toán bình phương, tổng, tích các tổng, khai căn nên việc thực hiện chắc chắn rất tốn thời gian.

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác trang 1

Trang 1

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác trang 2

Trang 2

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác trang 3

Trang 3

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác trang 4

Trang 4

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác trang 5

Trang 5

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác trang 6

Trang 6

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác trang 7

Trang 7

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác trang 8

Trang 8

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác trang 9

Trang 9

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 23 trang Danh Thịnh 10/01/2024 400
Bạn đang xem 10 trang mẫu của tài liệu "Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác

Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác
Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 
 26 
Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh 
stereo ứng dụng trong hệ thống camera thị giác 
Bạch Ngọc Minh* 
Trung tâm Phát triển Đại học Quốc gia Hà Nội, 144 Xuân Thủy, Hà Nội, Việt Nam 
Nhận ngày 16 tháng 7 năm 2014 
Chỉnh sửa ngày 18 tháng 8 năm 2014; Chấp nhận đăng ngày 22 tháng 9 năm 2014 
Tóm tắt: Có ba phương pháp cơ bản để so sánh sự tương hợp giữa hai ảnh là SAD, SSD và NCC. 
Phương pháp NCC sử dụng sự tương quan chéo giữa các điểm ảnh nên các phép toán rất phức tạp. 
Chúng bao gồm phép toán bình phương, tổng, tích các tổng, khai căn nên việc thực hiện chắc chắn 
rất tốn thời gian. Còn hai phương pháp SAD và SSD có độ phức tạp của thuật toán không khác 
biệt quá lớn nên chúng ta cần làm một thực nghiệm để kiểm chứng chất lượng bản đồ độ sâu và 
tốc độ thực hiện. Từ đó chọn ra một phương pháp thích hợp hơn 
So sánh thời gian chạy giữa hai giải thuật SAD và SSD cho thấy việc lựa chọn các thuật toán 
SAD là hợp lý hơn, bởi vì các thuật toán SSD cần gần gấp đôi thời gian chạy. Phương pháp SAD 
có thể giải quyết vấn đề đối với việc tìm độ sâu trong ảnh 3D. Một điểm ở không gian lấy ảnh ở 
hai ống kính máy tại hai vị trí khác nhau. Chính vì thế nên trước khi tìm được độ sâu của điểm 
ảnh, ta cần tìm được các điểm ảnh tương ứng đã. Phương pháp SAD là phương pháp đơn giản nhất 
để tìm được điểm ảnh đó. 
Phương pháp SAD lại có nhiều cách tính toán, tính theo phương pháp SAD truyền thống, 
phương pháp SAD điều chỉnh (dựa vào biên ảnh), phương pháp SAD phân đoạn ( phân vùng ảnh). 
Ở đây ta lại lựa chọn giữa 2 phương pháp SAD điều chỉnh và SAD phân đoạn giảm 20% so với 
SAD truyền thống. 
 Tiếp theo chúng ta xem xét các thuật toán SAD phân vùng lai được tạo ra bởi sự kết hợp của 
hai kỹ thuật: Belief Propagation và các thuật toán phân đoạn Mean Shift. Cách tiếp cận này kết 
hợp những ưu điểm của cả hai phương pháp phân đoạn. Các thuật toán Mean Shift cho kết quả 
nhanh chóng và Belief Propagation thực hiện phân đoạn rất chính xác. 
Từ khóa: Phân vùng ảnh, Belief Propagation, Mean Shift, SAD , hình ảnh 3D. 
1. Giới thiệu* 
Một xu hướng phát triển mới là rô bốt sử 
dụng camera thị giác để quan sát như mắt 
người. Mặc dù việc chiết xuất dữ liệu từ ảnh thị 
_______ 
* ĐT.: 84-913550789 
 Email:minhbn@vnu.edu.vn. 
giác là khó khăn hơn là dùng cảm biến nhưng 
bù lại thì cách thức này cung cấp cho rô bốt và 
con người những dữ liệu trực quan sinh động và 
đầy đủ. 
 Khi xử lý tín hiệu ảnh stereo thị giác 
thường có hai khâu (Hình 1). 
B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 27 
* Khâu đầu tiên là khâu tiền xử lý có nhiệm 
vụ lấy ra các dữ liệu có chứa thông tin hữu ích 
cho việc phát triển các ứng dụng thị giác stereo 
thời gian thực. 
* Khâu thứ hai các ứng dụng thị giác như 
ứng dụng tái tạo môi trường 3D, tìm đường, 
phát hiện đối tượng 
Hình 1. Quá trình xử lý dữ liệu ảnh stereo thị giác. 
Trong khâu tiền xử lý, có một đặc điểm 
chính là khối lượng dữ liệu thu thập bằng 
camera rất lớn (lớn hơn nhiều lần so với dữ liệu 
thu thập bằng cảm biến) cần được xử lý. 
 Mọi cách giải quyết mới đều phải được 
phát triển trên một nền tảng sẵn có. Ở phần tiếp, 
các kỹ thuật cơ bản của xử lý ảnh 3D sẽ được 
đưa ra để làm cơ sở phát triển cho các thuật 
toán về sau. Bước đầu tiên, chúng ta sẽ tìm hiểu 
về ảnh 3D và máy quay 3D, nền tảng cơ sở đầu 
tiên của hệ thống. Sau đó, các kỹ thuật xử lý để 
trích ra nội dung của ảnh sẽ được bàn đến. Các 
thuật toán cơ bản để dựa vào đó mà có các 
nghiên cứu hoàn thiện hơn.
1.1. Ảnh 3D: Là ảnh mà bản thân nó có chứa 
nội dung về chiều sâu. Các điểm ảnh ngoài các 
giá trị về màu sắc, tọa độ theo hai trục cơ bản 
còn có giá trị về chiều sâu. Để tạo nên được tấm 
ảnh 3D, người ta thực hiện đồng thời hai tấm 
ảnh về cùng một nội dung nhưng khác hướng. 
Hình 2. Một cảnh trong phim 3D. 
B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 
28 
(Hình 2) thể hiện một tấm ảnh 3D được 
theo dõi bằng mắt kính chuyên dụng. Ảnh trên 
được cấu tạo từ hai tấm ảnh khác nhau được 
trộn bởi 2 dải màu khác nhau. Khi nhìn ảnh trên 
bằng kính mắt chuyên dụng, mỗi mắt của người 
xem sẽ thấy một ảnh. Sự chênh lệch vị trí trong 
2 tấm ảnh nhìn thấy sẽ tạo nên cảm giác về độ 
sâu cho người xem. Thực tế, khi tách hai tấm 
ảnh của một ảnh 3D, chúng ta sẽ có thể nhận 
được những bức ảnh tương tự như trong ( Hình 3). 
Ảnh 3D có nhiều ứng dụng hơn là để giải 
trí. Nó có khả năng lưu trữ độ sâu điểm ảnh nên 
cũng được sử dụng cho các ứng dụng yêu cầu 
độ sâu điểm ảnh. Nói cách khác, từ một tấm ảnh 
3D, chúng ta có thể mô tả lại không gian hoặc 
lấy những thông tin hữu ích từ độ sâu điểm ảnh 
[1]. Các đối tượng 3D cũng có thể được trích ra 
từ một tấm ảnh 3D. 
a b 
Hình 3. Ảnh 3D sau khi tách ra. a: Ảnh nhìn thấy ở mắt trái; b: Ảnh nhìn thấy ở mắt phải 
1.2. Stereo camera: Là thiết bị thu ảnh 3D hoặc 
thu phim 3D. Về cơ bản, stereo camera cũng 
giống những máy ảnh hoặc máy quay chuyên 
dụng khác, nhưng nó có hai ống kính mắc song 
song ( 
Hình 4)[2]. Hai ống kính của một stereo-camera 
được sử dụng để lấy hai hình ảnh trong một ảnh 
3D. 
Hình 4. Hệ thống Stereo camera Bumblebee [3]. 
B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 29 
(Hình 5). thể hiện hoạt động của một stereo 
camera [3]. Các chi tiết sẽ được thu vào 2 tấm 
ảnh thông qua 2 ống kính của camera cùng một 
lúc. Lúc này, tọa độ của điểm ảnh thu được trên 
hai tấm sẽ có một độ lệch nhất định, ta gọi độ 
lệch đó là . 
Hình 5. Hoạt động của stereo camera. 
Ta có: 
 = x1 – x2 (1-1) 
Và khoảng cách từ điểm A đến camera sẽ 
được tính: 
Như vậy, từ các tọa độ ảnh thu được của 
điểm A trên hai tấm ảnh trái phải, ta sẽ thu 
được khoảng cách từ camera tới điểm A. 
Khoảng cách n ... h cho việc loại bỏ tiếng ồn, làm mịn và 
phân vùng ảnh. Đối với mỗi điểm ảnh của một 
hình ảnh, tập hợp các pixel lân cận được xác 
định. Cho Xi là đầu vào và Yi hình ảnh lọc, 
trong đó i = 1, 2,..., n. Các thuật toán lọc bao 
gồm các bước sau đây [19],[20],[21]: 
B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 
42 
* Khởi tạo , , . 
* Tính toán thông qua Shift bình chế độ, nơi 
hội tụ điểm ảnh. 
* Lưu trữ các thành phần của mức xám của 
các giá trị tính toán tại , 
nơi là thành phần không gian và , là 
thành phần phạm vi. 
Thứ hai, hình ảnh được chia thành các đoạn 
 sử dụng thuật toán phím Mean Shift. Trong 
bước thứ ba, thực hiện sấp xỉ đường bao của 
các phân đoạn. Thứ tư, các phân đoạn nhỏ được 
sáp nhập với nhau thành những đoạn tiếp giáp 
tương tự như hầu hết các phương pháp Belief 
Propagation. Cuối cùng, chúng ta tích hợp thuật 
toán phân đoạn lai đề xuất với thuật toán phù 
hợp stereo SAD. Phương pháp này SAD lai có 
thể cung cấp kết quả bản đồ độ sâu chính xác 
cao.
Hình 22. Thuật toán SAD lai. 
Tính toán độ lệch: Trong mục này, chúng ta 
diễn tả quá trình của sự so sánh chênh lệch nơi 
ảnh được đưa vào là nhưng mảnh (đoạn) lần 
đầu tiên và sau đó những điểm có cùng điều 
kiện ở bên trái và bên phải ảnh được tìm thấy. 
Đây là một ý tưởng được giải thích cho 
vùng 3D duy nhất điểm P trên (hình 23). Để 
đưa ra khoảng cách của vật được quan sát bởi 2 
máy quay cùng nhìn theo một hướng hướng 
nhưng khoảng cách khác nhau được biết (định 
nghĩa) là đường cơ bản. Sau đó, vật thể xuất 
hiện ở vị trí tương tự trong cả hai ảnh 3chiều. 
Khoảng cách giữa vật ở bên trái và bên phải 
ảnh được biết (định nghĩa) là khoảng chênh 
lệch d bởi (8-16). XL và XR là tọa độ x của ước 
lượng tọa độ 3D còn trên ảnh phẳng bên trái và 
bên phải là IL và IR . 
 (8-16) 
 (8-17) 
Khi bên trái và bên phải của ảnh phẳng 
quay được có cùng vị trí phẳng, tọa độ y của 2 
ảnh là bằng nhau (yL = yR) và có độ chênh lệch 
tọa độ ngang (trục x) là (xL - xR).[22] 
Điều này có nghĩa là độ chênh lệch được 
tính toán, cường độ có thể thay đổi được khi 
thay đổi thông số của máy quay: chiều dài tiêu 
cự f và khoảng cách của đường cơ sở B = 2l.
B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 43 
Hình 23. Một hệ thống stereo đơn giản . 
9. Nhận xét và đánh giá: 
9.1. Phương pháp SAD truyền thống 
Hình 24. Một số kết quả Bản đồ chênh lệch SAD truyền thống. 
a .Bản đồ chênh lệch với cửa sổ 5x5; 
b. Bản đồ chênh lệch với cửa sổ 7x7; c. Bản đồ chênh lệch với cửa sổ 11x11; 
Hình 25. Đồ thị thời gian, độ phủ và độ chính xác. 
 a) b) c) 
B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 
44 
9.2. Phương pháp SAD có điều chỉnh: 
Hình 26. Một số kết quả thực hiện tìm SAD trên đường biên. 
Hình 27. Đồ thị thời gian, độ phủ và độ chính xác. 
Thời gian thực hiện tính bản đồ chênh lệch 
theo phương pháp SAD điều chỉnh đã giảm rất 
nhiều so với phương pháp SAD thông thường. 
c.Phương pháp SAD phân vùng: 
Trong cuộc thử nghiệm tiếp theo, các 
phương pháp lai đề xuất được thử nghiệm trên 
bốn hình ảnh stereo thực tế được thực hiện bởi 
hệ thống camera stereo. Thuật toán này được áp 
dụng để ước tính sự chênh lệch của các khối 
9x9 từ hình ảnh bên trái tham chiếu bằng cách 
tìm kiếm các khối ứng cử viên tương ứng của 
hình ảnh bên phải. Bản đồ chênh lệch cuối cùng 
của bốn hình ảnh lập thể thử nghiệm, cụ thể là 
sách, vợt, khối lập phương và tòa được thể hiện 
trong (Hình 28). Cụ thể, các (Hình 28-b) cho 
thấy các bản đồ khác biệt được tạo ra bởi thuật 
toán SAD mà không phân đoạn và hình. (Hình 
28-c) kết quả theo thuật toán phân chia lai. Bản 
đồ chênh lệch sản xuất bởi máy ảnh nổi 
Bumblebee được hiển thị trong (Hình 28-d). 
 a) b) c) 
B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 45 
Hình 28. Kết quả thực nghiệm trên bốn ảnh thử nghiệm màu xám. 
a) Hình ảnh tham khảo, b) Bản đồ chênh lệch sau khi sử dụng thuật toán SAD mà không phân đoạn 
 c) Kết quả của thuật toán SAD lai, d) Hệ thống camera Bumblebee. 
Chất lượng của các bản đồ khác biệt được 
biểu diễn như là tỷ lệ phần trăm của các điểm 
ảnh với các lỗi sai lệch này (pixel có sự phù 
hợp xấu) [6]: 
(9-18) 
trong đó X * Y đại diện cho kích thước của 
hình ảnh, dC là bản đồ chênh lệch tính của hình 
ảnh thử nghiệm và dT là bản đồ chênh lệch sự 
thật. Sự thật chênh lệch bản đồ mặt đất là 
nghịch đảo của khoảng cách thật mặt đất. 
Phương trình (9-19) cho thấy làm thế nào để 
tính toán bản đồ chênh lệch sự thật mặt đất từ 
bản đồ độ 
 (9-19) 
với DT là sự thật bản đồ độ sâu mặt đất, h là 
chiều cao từ mặt phẳng đất, DT * h là khoảng 
cách thật mặt đất, B là cơ sở giữa các máy ảnh, 
IRES có độ phân giải hình ảnh và f là tiêu cự. 
 a) b) c) d) 
B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 
46 
Bảng 1. So sánh kết quả của các giải thuật tính bản 
đồ chênh lệch 
Ảnh 
kiểm tra 
SAD 
thông 
thường 
SAD 
phân 
vùng lai 
Hệ thống 
camera 
Bumblelee 
Quyển 
sách 
9,64% 4,12% 3,59% 
Cái vợt 8,48% 4,72% 3,83% 
Rubic 9,26% 4,37% 3,51% 
Tòa nhà 9,91% 4,21% 3,65% 
Các bản đồ chênh lệch thu được từ việc đề 
xuất lai phân đoạn dựa trên thuật toán SAD 
phân vùng lai được so sánh với các phương 
pháp khác (sử dụng hệ thống camera 
Bumblebee và phương pháp SAD mà không 
phân đoạn). Trong ( bảng 1), sự khác biệt giữa 
tỷ lệ phần trăm điểm ảnh lỗi chênh lệch được 
trình bày. Như có thể thấy trong (hình 28), các 
thuật toán SAD phân vùng lai tạo ra kết quả 
chính xác hơn so với thuật toán SAD mà không 
phân đoạn. Ngoài ra, hiệu suất của phương 
pháp là gần đạt đến hiệu suất của hệ thống 
camera Bumblebee. 
Cuối cùng, các thuật toán phân đoạn lai đã 
tận dụng được lợi thế nhanh chóng của thuật 
toán Mean Shift và chính xác từ thuật toán 
Belief Propagation. Lợi thế lớn của một thuật 
toán SAD lai là bất kỳ phân đoạn đều được phát 
hiện được nhận dạng tự động. Thuật toán này 
đã đạt được một hiệu suất phân đoạn gần thời 
gian thực và kết quả chính xác cao. 
10. Kết luận: 
Bài viết nghiên cứu so sánh cho việc khôi 
phục bản đồ độ sâu dựa trên các thuật toán phân 
vùng lai được đề xuất sử dụng quá trình lọc. 
Các thuật toán đã được thử nghiệm trên thực tế 
với cảnh phức tạp và tình trạng ánh sáng kém 
dựa trên hệ thống camera stereo công nghiệp từ 
Bumblebee, từ kết quả thí nghiệm ta có thể tìm 
một bản đồ chênh lệch, mà dịch chuyển chênh 
lệch giữa hai hình ảnh và cuối cùng là được sử 
dụng để ước tính giá trị chiều sâu. Dựa trên các 
thuật toán tổng bình phương khác biệt (SSD) 
và tổng sự khác biệt tuyệt đối (SAD) có thể tìm 
thấy bản đồ độ sâu trực tiếp. Tùy thuộc vào các 
kỹ thuật phù hợp dựa trên các thuật toán SAD 
và SSD một nguyên tắc giữa thời gian chạy và 
chất lượng cần phải được lựa chọn. Cuối cùng, 
thuật toán SAD phù hợp hình ảnh stereo được 
lựa chọn để thực hiện các thí nghiệm tiếp theo, 
bởi vì các thuật toán SSD đòi hỏi gần như tăng 
gấp đôi thời gian. Kết quả thí nghiệm được 
trình bày trong (Hình 28) cho thấy thuật toán 
SAD phân vùng lai cho kết quả tốt hơn hơn 
thuật toán SAD mà không cần sử dụng pjaan 
vùng và SAD điều chỉnh nhưng hơi kém hơn so 
với máy ảnh nổi của hệ thống Bumblebee. Các 
thuật toán SAD phân vùng lai được đề xuất 
cũng cho thấy hiệu suất cao hơn. Trong tương 
lai, tôi dự định thực hiện nghiên cứu và cũng 
kiểm tra các thuật toán phức tạp hơn. 
Tài liệu tham khảo: 
[1] Dorit Borrmann, Jan Elseberg, Kai Lingemann, 
Andreas Nüchter (2011), “ The 3D Hough 
transform for plane detection in point clouds: A 
Review and a new Accumulator Design”, 
Received: 13 January 2011 / Revised: 13 February 
2011 / Accepted: 10 March 2011, © 3D Research 
Center and Springer 2011 
[2] Yedida, J. S, Freeeman, W. T, Weiss, Y. 
Understanding belief propagation and it is 
genneralizstions. Exploring Artificial Intellrgence 
in the New Millennium, 2003, Chap.8, p, 236 – 
239. 
[3] POINT GREY, Bumblebee Stereo Vision Camera 
Sytems. BB2 – 08S2 (datasheet). 2 pages. 
[Online] Cited 2011-10-23. Advailable at: 
_datasheet.pdf 
[4] Scharstein, D, Szeliski,R, A taxonomy and 
evaluation of dense two frame stereo 
B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 47 
correspondence algorithms. International Jounrnal 
of Computer Vision, 2003, vol, 47, no. (1/2/3), 
p.& - 42 
[5] Brown, M, Z, Burschka, D, Hager, G, D, Bhartia, 
P. Advances in computional stereo. IEEE 
Transactions on Pattenrn Analysis and Machine 
Itelligence, 2003, vol, 25, no.8. 
[6] KUHL, A. Comparison of stereo matching 
algorithms for mobile robots. Centre for 
Intelligent Information Processing Sytem 2005, 
University of Western Australia, p. 4 – 24. 
[7] Cao, X., Foroosh, H, H. Camera calibration using 
symmetric objects. Image Processing IEEE 
Transactions, 2006, vol, 15, no. 11, p.3614 – 
3619. 
[8] Shimizu, M., Okutomi, M, Calibration and 
rectification for reflection stereo. In IEEE 
Conference on Computer Vision and Pattern 
Recognition CVPR Anchorage ( USA), 2008, p.1 
– 8. 
[9] Hartley, R, Zisserman, A, Multiple View 
Geometry in Computer Vision 2
nd
 ed. Cambridge: 
University Press, 2005. 
[10] Zhang, Y. J. Advance in Image and Video 
Segmentation. 1nd ed. USA: IRM Press, 2006. 
[11] Wang, G, JU, H, A disparity map extraction 
algorithm for lunar rover BH 2. In IEEE 
International Conference on Intelligent 
Computing and Intelligent Sytems ICIS 2009. 
Shanghai, 2009, vol. 4, p. 385 – 389. 
[12] Mckinnon, B., Baltes, J. Practical region – based 
matching for stereo vision. In IWCIA, 2005, vol. 
3322 of Lecture Notes in Computer Science, 
Springer, p. 726 – 738. 
[13] Craig Watman, “Fast Sum of Absolute 
Differences Visual Landmark Detector”, Robotic 
Systems Laboratory Department of Systems 
Engineering, RSISE, Australian National 
University, Canberra, ACT 0200 Australia, Email: 
d.austin@computer.org 
[14] Christor Georgoulas, Georgios CH, Real-time 
stereo vision applicasions.Laboratory of 
Electronics,Democritris University of Thrace 
Xanthi, Greece p.267-292. 
[15] Guan, S, Klette, R, Belief Propagation on edge 
image sequences. InmProceedingx Robot Vision 
LNCS 4931, 2006, p. 291 – 302. 
[16] Siqiang, L., Wei, L, Image segmentation basedon 
the Mean – Shift in the HSV space. In 26
th
Chinese Control Conference, 2007. [Online], p. 
476 – 479. 
[17] Benco, M., Hudec, R, The advances image 
segmentation techniques for broadly useful 
retrieval in large image database. In NSSS IX, 
Tatranske Zruby (Slovakia), 2006, p. 40 – 44. 
[18] He, R, Zhu, Y. A hybrid image segmentation 
approach based on Mean Shift and fuzzy C – 
Means. In Asia Pacific Conference on Information 
Processing. [Online], 2009. 
[19] Comaniciu, D., Meer, P. Mean Shift: A robust 
approach toward feature space analysis IEEE 
Transaction on Pattern Analysis and Machine 
Intel., 2002, vol. 24, no. 5, p. 1 – 18. 
[20] Rodriguez, R., Suarez, A. G. An image 
segmentation algorithm using interatively the 
Mean Shift. Progress in Pattern Recognition, 
Image Analysis and Appliscations. 2006, LNCS 
4225, Berlin Heidelberg: Springer, vol. 
4225/2006, p. 326 – 335. 
[21] Hudec, R. Adaptive Order – statistics L – filters, 
1
st
 ed. University of Zilina: EDIS Press, 155 
pages, ISBN 978 – 80 – 554 – 0248 – 2, 2011 (in 
Slovak). 
[22] Rostam Affendi Hamzah, Hasrul Nisham Rosly, 
“An Obstacle Detection and Avoidance of A 
Mobile Robot with Stereo Vision Camera” , 
Faculty of Electronics & Computer Engineering, 
UTeM, Malaysia. rostamaffendi@utem.edu.my
B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 
48 
Comparative Study of Image Processing Algorithms Calculate 
Depth Stereo Image Camera Applications in the Visual System 
Bạch Ngọc Minh 
Centre Development Vietnam National University, Hanoi, 144 Xuân Thủy, Hanoi, Vietnam 
Abstract: There are three basic methods to compare the similarity between two images, which is 
SAD, SSD and NCC. NCC method is using cross- correlation between the pixels so the calculations 
are complex . These include the arithmetic average, total, multiplication total, square root should this 
method definitely perform very time consuming. Both SAD method and SSD method does’nt much 
difference the complexity of the algorithm so we need to do an experiment to verify the quality of the 
depth maps and the speed of execution. From the results that we choose a more appropriate method 
Comparison of running time between SAD and SSD algorithms show that the choice of the SAD 
algorithm is more reasonable, because the SSD algorithm needs nearly twice the time to run. SAD 
method can solve the problem of finding depth in 3D images. A point in space to acquire images of 
two lenses in two different locations. Therefore so before finding the depth of the pixel, we need to 
find the corresponding pixels. SAD method is the easiest method to find the pixel . 
SAD method has many calculate ways, calculate by traditional methods SAD, adjustment SAD 
method (based on the image border) , segmentation SAD method (image segmentation). In Here we 
choose between two methods of adjustment SAD method and segment SAD method decreased 20 % 
compared with traditional SAD. 
 Then we consider the hybrid algorithm SAD partition is created by the combination to two 
techniques: Belief Propagation and the Mean Shift segmentation algorithm. This approach combines 
the advantages of both methods segment. Mean Shift algorithm is fast results and Belief Propagation 
perform very accurate segmentation. 
Keywords: Image segmentation, Belief Propagation, Mean Shift, SAD, 3D image. 

File đính kèm:

  • pdfnghien_cuu_so_sanh_cac_thuat_toan_xu_ly_anh_tinh_do_sau_anh.pdf