Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác
Có ba phương pháp cơ bản để so sánh sự tương hợp giữa hai ảnh là SAD, SSD và NCC. Phương pháp NCC sử dụng sự tương quan chéo giữa các điểm ảnh nên các phép toán rất phức tạp. Chúng bao gồm phép toán bình phương, tổng, tích các tổng, khai căn nên việc thực hiện chắc chắn rất tốn thời gian.
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Bạn đang xem 10 trang mẫu của tài liệu "Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác
Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 26 Nghiên cứu so sánh các thuật toán xử lý ảnh tính độ sâu ảnh stereo ứng dụng trong hệ thống camera thị giác Bạch Ngọc Minh* Trung tâm Phát triển Đại học Quốc gia Hà Nội, 144 Xuân Thủy, Hà Nội, Việt Nam Nhận ngày 16 tháng 7 năm 2014 Chỉnh sửa ngày 18 tháng 8 năm 2014; Chấp nhận đăng ngày 22 tháng 9 năm 2014 Tóm tắt: Có ba phương pháp cơ bản để so sánh sự tương hợp giữa hai ảnh là SAD, SSD và NCC. Phương pháp NCC sử dụng sự tương quan chéo giữa các điểm ảnh nên các phép toán rất phức tạp. Chúng bao gồm phép toán bình phương, tổng, tích các tổng, khai căn nên việc thực hiện chắc chắn rất tốn thời gian. Còn hai phương pháp SAD và SSD có độ phức tạp của thuật toán không khác biệt quá lớn nên chúng ta cần làm một thực nghiệm để kiểm chứng chất lượng bản đồ độ sâu và tốc độ thực hiện. Từ đó chọn ra một phương pháp thích hợp hơn So sánh thời gian chạy giữa hai giải thuật SAD và SSD cho thấy việc lựa chọn các thuật toán SAD là hợp lý hơn, bởi vì các thuật toán SSD cần gần gấp đôi thời gian chạy. Phương pháp SAD có thể giải quyết vấn đề đối với việc tìm độ sâu trong ảnh 3D. Một điểm ở không gian lấy ảnh ở hai ống kính máy tại hai vị trí khác nhau. Chính vì thế nên trước khi tìm được độ sâu của điểm ảnh, ta cần tìm được các điểm ảnh tương ứng đã. Phương pháp SAD là phương pháp đơn giản nhất để tìm được điểm ảnh đó. Phương pháp SAD lại có nhiều cách tính toán, tính theo phương pháp SAD truyền thống, phương pháp SAD điều chỉnh (dựa vào biên ảnh), phương pháp SAD phân đoạn ( phân vùng ảnh). Ở đây ta lại lựa chọn giữa 2 phương pháp SAD điều chỉnh và SAD phân đoạn giảm 20% so với SAD truyền thống. Tiếp theo chúng ta xem xét các thuật toán SAD phân vùng lai được tạo ra bởi sự kết hợp của hai kỹ thuật: Belief Propagation và các thuật toán phân đoạn Mean Shift. Cách tiếp cận này kết hợp những ưu điểm của cả hai phương pháp phân đoạn. Các thuật toán Mean Shift cho kết quả nhanh chóng và Belief Propagation thực hiện phân đoạn rất chính xác. Từ khóa: Phân vùng ảnh, Belief Propagation, Mean Shift, SAD , hình ảnh 3D. 1. Giới thiệu* Một xu hướng phát triển mới là rô bốt sử dụng camera thị giác để quan sát như mắt người. Mặc dù việc chiết xuất dữ liệu từ ảnh thị _______ * ĐT.: 84-913550789 Email:minhbn@vnu.edu.vn. giác là khó khăn hơn là dùng cảm biến nhưng bù lại thì cách thức này cung cấp cho rô bốt và con người những dữ liệu trực quan sinh động và đầy đủ. Khi xử lý tín hiệu ảnh stereo thị giác thường có hai khâu (Hình 1). B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 27 * Khâu đầu tiên là khâu tiền xử lý có nhiệm vụ lấy ra các dữ liệu có chứa thông tin hữu ích cho việc phát triển các ứng dụng thị giác stereo thời gian thực. * Khâu thứ hai các ứng dụng thị giác như ứng dụng tái tạo môi trường 3D, tìm đường, phát hiện đối tượng Hình 1. Quá trình xử lý dữ liệu ảnh stereo thị giác. Trong khâu tiền xử lý, có một đặc điểm chính là khối lượng dữ liệu thu thập bằng camera rất lớn (lớn hơn nhiều lần so với dữ liệu thu thập bằng cảm biến) cần được xử lý. Mọi cách giải quyết mới đều phải được phát triển trên một nền tảng sẵn có. Ở phần tiếp, các kỹ thuật cơ bản của xử lý ảnh 3D sẽ được đưa ra để làm cơ sở phát triển cho các thuật toán về sau. Bước đầu tiên, chúng ta sẽ tìm hiểu về ảnh 3D và máy quay 3D, nền tảng cơ sở đầu tiên của hệ thống. Sau đó, các kỹ thuật xử lý để trích ra nội dung của ảnh sẽ được bàn đến. Các thuật toán cơ bản để dựa vào đó mà có các nghiên cứu hoàn thiện hơn. 1.1. Ảnh 3D: Là ảnh mà bản thân nó có chứa nội dung về chiều sâu. Các điểm ảnh ngoài các giá trị về màu sắc, tọa độ theo hai trục cơ bản còn có giá trị về chiều sâu. Để tạo nên được tấm ảnh 3D, người ta thực hiện đồng thời hai tấm ảnh về cùng một nội dung nhưng khác hướng. Hình 2. Một cảnh trong phim 3D. B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 28 (Hình 2) thể hiện một tấm ảnh 3D được theo dõi bằng mắt kính chuyên dụng. Ảnh trên được cấu tạo từ hai tấm ảnh khác nhau được trộn bởi 2 dải màu khác nhau. Khi nhìn ảnh trên bằng kính mắt chuyên dụng, mỗi mắt của người xem sẽ thấy một ảnh. Sự chênh lệch vị trí trong 2 tấm ảnh nhìn thấy sẽ tạo nên cảm giác về độ sâu cho người xem. Thực tế, khi tách hai tấm ảnh của một ảnh 3D, chúng ta sẽ có thể nhận được những bức ảnh tương tự như trong ( Hình 3). Ảnh 3D có nhiều ứng dụng hơn là để giải trí. Nó có khả năng lưu trữ độ sâu điểm ảnh nên cũng được sử dụng cho các ứng dụng yêu cầu độ sâu điểm ảnh. Nói cách khác, từ một tấm ảnh 3D, chúng ta có thể mô tả lại không gian hoặc lấy những thông tin hữu ích từ độ sâu điểm ảnh [1]. Các đối tượng 3D cũng có thể được trích ra từ một tấm ảnh 3D. a b Hình 3. Ảnh 3D sau khi tách ra. a: Ảnh nhìn thấy ở mắt trái; b: Ảnh nhìn thấy ở mắt phải 1.2. Stereo camera: Là thiết bị thu ảnh 3D hoặc thu phim 3D. Về cơ bản, stereo camera cũng giống những máy ảnh hoặc máy quay chuyên dụng khác, nhưng nó có hai ống kính mắc song song ( Hình 4)[2]. Hai ống kính của một stereo-camera được sử dụng để lấy hai hình ảnh trong một ảnh 3D. Hình 4. Hệ thống Stereo camera Bumblebee [3]. B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 29 (Hình 5). thể hiện hoạt động của một stereo camera [3]. Các chi tiết sẽ được thu vào 2 tấm ảnh thông qua 2 ống kính của camera cùng một lúc. Lúc này, tọa độ của điểm ảnh thu được trên hai tấm sẽ có một độ lệch nhất định, ta gọi độ lệch đó là . Hình 5. Hoạt động của stereo camera. Ta có: = x1 – x2 (1-1) Và khoảng cách từ điểm A đến camera sẽ được tính: Như vậy, từ các tọa độ ảnh thu được của điểm A trên hai tấm ảnh trái phải, ta sẽ thu được khoảng cách từ camera tới điểm A. Khoảng cách n ... h cho việc loại bỏ tiếng ồn, làm mịn và phân vùng ảnh. Đối với mỗi điểm ảnh của một hình ảnh, tập hợp các pixel lân cận được xác định. Cho Xi là đầu vào và Yi hình ảnh lọc, trong đó i = 1, 2,..., n. Các thuật toán lọc bao gồm các bước sau đây [19],[20],[21]: B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 42 * Khởi tạo , , . * Tính toán thông qua Shift bình chế độ, nơi hội tụ điểm ảnh. * Lưu trữ các thành phần của mức xám của các giá trị tính toán tại , nơi là thành phần không gian và , là thành phần phạm vi. Thứ hai, hình ảnh được chia thành các đoạn sử dụng thuật toán phím Mean Shift. Trong bước thứ ba, thực hiện sấp xỉ đường bao của các phân đoạn. Thứ tư, các phân đoạn nhỏ được sáp nhập với nhau thành những đoạn tiếp giáp tương tự như hầu hết các phương pháp Belief Propagation. Cuối cùng, chúng ta tích hợp thuật toán phân đoạn lai đề xuất với thuật toán phù hợp stereo SAD. Phương pháp này SAD lai có thể cung cấp kết quả bản đồ độ sâu chính xác cao. Hình 22. Thuật toán SAD lai. Tính toán độ lệch: Trong mục này, chúng ta diễn tả quá trình của sự so sánh chênh lệch nơi ảnh được đưa vào là nhưng mảnh (đoạn) lần đầu tiên và sau đó những điểm có cùng điều kiện ở bên trái và bên phải ảnh được tìm thấy. Đây là một ý tưởng được giải thích cho vùng 3D duy nhất điểm P trên (hình 23). Để đưa ra khoảng cách của vật được quan sát bởi 2 máy quay cùng nhìn theo một hướng hướng nhưng khoảng cách khác nhau được biết (định nghĩa) là đường cơ bản. Sau đó, vật thể xuất hiện ở vị trí tương tự trong cả hai ảnh 3chiều. Khoảng cách giữa vật ở bên trái và bên phải ảnh được biết (định nghĩa) là khoảng chênh lệch d bởi (8-16). XL và XR là tọa độ x của ước lượng tọa độ 3D còn trên ảnh phẳng bên trái và bên phải là IL và IR . (8-16) (8-17) Khi bên trái và bên phải của ảnh phẳng quay được có cùng vị trí phẳng, tọa độ y của 2 ảnh là bằng nhau (yL = yR) và có độ chênh lệch tọa độ ngang (trục x) là (xL - xR).[22] Điều này có nghĩa là độ chênh lệch được tính toán, cường độ có thể thay đổi được khi thay đổi thông số của máy quay: chiều dài tiêu cự f và khoảng cách của đường cơ sở B = 2l. B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 43 Hình 23. Một hệ thống stereo đơn giản . 9. Nhận xét và đánh giá: 9.1. Phương pháp SAD truyền thống Hình 24. Một số kết quả Bản đồ chênh lệch SAD truyền thống. a .Bản đồ chênh lệch với cửa sổ 5x5; b. Bản đồ chênh lệch với cửa sổ 7x7; c. Bản đồ chênh lệch với cửa sổ 11x11; Hình 25. Đồ thị thời gian, độ phủ và độ chính xác. a) b) c) B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 44 9.2. Phương pháp SAD có điều chỉnh: Hình 26. Một số kết quả thực hiện tìm SAD trên đường biên. Hình 27. Đồ thị thời gian, độ phủ và độ chính xác. Thời gian thực hiện tính bản đồ chênh lệch theo phương pháp SAD điều chỉnh đã giảm rất nhiều so với phương pháp SAD thông thường. c.Phương pháp SAD phân vùng: Trong cuộc thử nghiệm tiếp theo, các phương pháp lai đề xuất được thử nghiệm trên bốn hình ảnh stereo thực tế được thực hiện bởi hệ thống camera stereo. Thuật toán này được áp dụng để ước tính sự chênh lệch của các khối 9x9 từ hình ảnh bên trái tham chiếu bằng cách tìm kiếm các khối ứng cử viên tương ứng của hình ảnh bên phải. Bản đồ chênh lệch cuối cùng của bốn hình ảnh lập thể thử nghiệm, cụ thể là sách, vợt, khối lập phương và tòa được thể hiện trong (Hình 28). Cụ thể, các (Hình 28-b) cho thấy các bản đồ khác biệt được tạo ra bởi thuật toán SAD mà không phân đoạn và hình. (Hình 28-c) kết quả theo thuật toán phân chia lai. Bản đồ chênh lệch sản xuất bởi máy ảnh nổi Bumblebee được hiển thị trong (Hình 28-d). a) b) c) B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 45 Hình 28. Kết quả thực nghiệm trên bốn ảnh thử nghiệm màu xám. a) Hình ảnh tham khảo, b) Bản đồ chênh lệch sau khi sử dụng thuật toán SAD mà không phân đoạn c) Kết quả của thuật toán SAD lai, d) Hệ thống camera Bumblebee. Chất lượng của các bản đồ khác biệt được biểu diễn như là tỷ lệ phần trăm của các điểm ảnh với các lỗi sai lệch này (pixel có sự phù hợp xấu) [6]: (9-18) trong đó X * Y đại diện cho kích thước của hình ảnh, dC là bản đồ chênh lệch tính của hình ảnh thử nghiệm và dT là bản đồ chênh lệch sự thật. Sự thật chênh lệch bản đồ mặt đất là nghịch đảo của khoảng cách thật mặt đất. Phương trình (9-19) cho thấy làm thế nào để tính toán bản đồ chênh lệch sự thật mặt đất từ bản đồ độ (9-19) với DT là sự thật bản đồ độ sâu mặt đất, h là chiều cao từ mặt phẳng đất, DT * h là khoảng cách thật mặt đất, B là cơ sở giữa các máy ảnh, IRES có độ phân giải hình ảnh và f là tiêu cự. a) b) c) d) B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 46 Bảng 1. So sánh kết quả của các giải thuật tính bản đồ chênh lệch Ảnh kiểm tra SAD thông thường SAD phân vùng lai Hệ thống camera Bumblelee Quyển sách 9,64% 4,12% 3,59% Cái vợt 8,48% 4,72% 3,83% Rubic 9,26% 4,37% 3,51% Tòa nhà 9,91% 4,21% 3,65% Các bản đồ chênh lệch thu được từ việc đề xuất lai phân đoạn dựa trên thuật toán SAD phân vùng lai được so sánh với các phương pháp khác (sử dụng hệ thống camera Bumblebee và phương pháp SAD mà không phân đoạn). Trong ( bảng 1), sự khác biệt giữa tỷ lệ phần trăm điểm ảnh lỗi chênh lệch được trình bày. Như có thể thấy trong (hình 28), các thuật toán SAD phân vùng lai tạo ra kết quả chính xác hơn so với thuật toán SAD mà không phân đoạn. Ngoài ra, hiệu suất của phương pháp là gần đạt đến hiệu suất của hệ thống camera Bumblebee. Cuối cùng, các thuật toán phân đoạn lai đã tận dụng được lợi thế nhanh chóng của thuật toán Mean Shift và chính xác từ thuật toán Belief Propagation. Lợi thế lớn của một thuật toán SAD lai là bất kỳ phân đoạn đều được phát hiện được nhận dạng tự động. Thuật toán này đã đạt được một hiệu suất phân đoạn gần thời gian thực và kết quả chính xác cao. 10. Kết luận: Bài viết nghiên cứu so sánh cho việc khôi phục bản đồ độ sâu dựa trên các thuật toán phân vùng lai được đề xuất sử dụng quá trình lọc. Các thuật toán đã được thử nghiệm trên thực tế với cảnh phức tạp và tình trạng ánh sáng kém dựa trên hệ thống camera stereo công nghiệp từ Bumblebee, từ kết quả thí nghiệm ta có thể tìm một bản đồ chênh lệch, mà dịch chuyển chênh lệch giữa hai hình ảnh và cuối cùng là được sử dụng để ước tính giá trị chiều sâu. Dựa trên các thuật toán tổng bình phương khác biệt (SSD) và tổng sự khác biệt tuyệt đối (SAD) có thể tìm thấy bản đồ độ sâu trực tiếp. Tùy thuộc vào các kỹ thuật phù hợp dựa trên các thuật toán SAD và SSD một nguyên tắc giữa thời gian chạy và chất lượng cần phải được lựa chọn. Cuối cùng, thuật toán SAD phù hợp hình ảnh stereo được lựa chọn để thực hiện các thí nghiệm tiếp theo, bởi vì các thuật toán SSD đòi hỏi gần như tăng gấp đôi thời gian. Kết quả thí nghiệm được trình bày trong (Hình 28) cho thấy thuật toán SAD phân vùng lai cho kết quả tốt hơn hơn thuật toán SAD mà không cần sử dụng pjaan vùng và SAD điều chỉnh nhưng hơi kém hơn so với máy ảnh nổi của hệ thống Bumblebee. Các thuật toán SAD phân vùng lai được đề xuất cũng cho thấy hiệu suất cao hơn. Trong tương lai, tôi dự định thực hiện nghiên cứu và cũng kiểm tra các thuật toán phức tạp hơn. Tài liệu tham khảo: [1] Dorit Borrmann, Jan Elseberg, Kai Lingemann, Andreas Nüchter (2011), “ The 3D Hough transform for plane detection in point clouds: A Review and a new Accumulator Design”, Received: 13 January 2011 / Revised: 13 February 2011 / Accepted: 10 March 2011, © 3D Research Center and Springer 2011 [2] Yedida, J. S, Freeeman, W. T, Weiss, Y. Understanding belief propagation and it is genneralizstions. Exploring Artificial Intellrgence in the New Millennium, 2003, Chap.8, p, 236 – 239. [3] POINT GREY, Bumblebee Stereo Vision Camera Sytems. BB2 – 08S2 (datasheet). 2 pages. [Online] Cited 2011-10-23. Advailable at: _datasheet.pdf [4] Scharstein, D, Szeliski,R, A taxonomy and evaluation of dense two frame stereo B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 47 correspondence algorithms. International Jounrnal of Computer Vision, 2003, vol, 47, no. (1/2/3), p.& - 42 [5] Brown, M, Z, Burschka, D, Hager, G, D, Bhartia, P. Advances in computional stereo. IEEE Transactions on Pattenrn Analysis and Machine Itelligence, 2003, vol, 25, no.8. [6] KUHL, A. Comparison of stereo matching algorithms for mobile robots. Centre for Intelligent Information Processing Sytem 2005, University of Western Australia, p. 4 – 24. [7] Cao, X., Foroosh, H, H. Camera calibration using symmetric objects. Image Processing IEEE Transactions, 2006, vol, 15, no. 11, p.3614 – 3619. [8] Shimizu, M., Okutomi, M, Calibration and rectification for reflection stereo. In IEEE Conference on Computer Vision and Pattern Recognition CVPR Anchorage ( USA), 2008, p.1 – 8. [9] Hartley, R, Zisserman, A, Multiple View Geometry in Computer Vision 2 nd ed. Cambridge: University Press, 2005. [10] Zhang, Y. J. Advance in Image and Video Segmentation. 1nd ed. USA: IRM Press, 2006. [11] Wang, G, JU, H, A disparity map extraction algorithm for lunar rover BH 2. In IEEE International Conference on Intelligent Computing and Intelligent Sytems ICIS 2009. Shanghai, 2009, vol. 4, p. 385 – 389. [12] Mckinnon, B., Baltes, J. Practical region – based matching for stereo vision. In IWCIA, 2005, vol. 3322 of Lecture Notes in Computer Science, Springer, p. 726 – 738. [13] Craig Watman, “Fast Sum of Absolute Differences Visual Landmark Detector”, Robotic Systems Laboratory Department of Systems Engineering, RSISE, Australian National University, Canberra, ACT 0200 Australia, Email: d.austin@computer.org [14] Christor Georgoulas, Georgios CH, Real-time stereo vision applicasions.Laboratory of Electronics,Democritris University of Thrace Xanthi, Greece p.267-292. [15] Guan, S, Klette, R, Belief Propagation on edge image sequences. InmProceedingx Robot Vision LNCS 4931, 2006, p. 291 – 302. [16] Siqiang, L., Wei, L, Image segmentation basedon the Mean – Shift in the HSV space. In 26 th Chinese Control Conference, 2007. [Online], p. 476 – 479. [17] Benco, M., Hudec, R, The advances image segmentation techniques for broadly useful retrieval in large image database. In NSSS IX, Tatranske Zruby (Slovakia), 2006, p. 40 – 44. [18] He, R, Zhu, Y. A hybrid image segmentation approach based on Mean Shift and fuzzy C – Means. In Asia Pacific Conference on Information Processing. [Online], 2009. [19] Comaniciu, D., Meer, P. Mean Shift: A robust approach toward feature space analysis IEEE Transaction on Pattern Analysis and Machine Intel., 2002, vol. 24, no. 5, p. 1 – 18. [20] Rodriguez, R., Suarez, A. G. An image segmentation algorithm using interatively the Mean Shift. Progress in Pattern Recognition, Image Analysis and Appliscations. 2006, LNCS 4225, Berlin Heidelberg: Springer, vol. 4225/2006, p. 326 – 335. [21] Hudec, R. Adaptive Order – statistics L – filters, 1 st ed. University of Zilina: EDIS Press, 155 pages, ISBN 978 – 80 – 554 – 0248 – 2, 2011 (in Slovak). [22] Rostam Affendi Hamzah, Hasrul Nisham Rosly, “An Obstacle Detection and Avoidance of A Mobile Robot with Stereo Vision Camera” , Faculty of Electronics & Computer Engineering, UTeM, Malaysia. rostamaffendi@utem.edu.my B.N. Minh / Tạp chí Khoa học ĐHQGHN: Khoa học Tự nhiên và Công nghệ, Tâp̣ 30, Số 3 (2014) 26-48 48 Comparative Study of Image Processing Algorithms Calculate Depth Stereo Image Camera Applications in the Visual System Bạch Ngọc Minh Centre Development Vietnam National University, Hanoi, 144 Xuân Thủy, Hanoi, Vietnam Abstract: There are three basic methods to compare the similarity between two images, which is SAD, SSD and NCC. NCC method is using cross- correlation between the pixels so the calculations are complex . These include the arithmetic average, total, multiplication total, square root should this method definitely perform very time consuming. Both SAD method and SSD method does’nt much difference the complexity of the algorithm so we need to do an experiment to verify the quality of the depth maps and the speed of execution. From the results that we choose a more appropriate method Comparison of running time between SAD and SSD algorithms show that the choice of the SAD algorithm is more reasonable, because the SSD algorithm needs nearly twice the time to run. SAD method can solve the problem of finding depth in 3D images. A point in space to acquire images of two lenses in two different locations. Therefore so before finding the depth of the pixel, we need to find the corresponding pixels. SAD method is the easiest method to find the pixel . SAD method has many calculate ways, calculate by traditional methods SAD, adjustment SAD method (based on the image border) , segmentation SAD method (image segmentation). In Here we choose between two methods of adjustment SAD method and segment SAD method decreased 20 % compared with traditional SAD. Then we consider the hybrid algorithm SAD partition is created by the combination to two techniques: Belief Propagation and the Mean Shift segmentation algorithm. This approach combines the advantages of both methods segment. Mean Shift algorithm is fast results and Belief Propagation perform very accurate segmentation. Keywords: Image segmentation, Belief Propagation, Mean Shift, SAD, 3D image.
File đính kèm:
- nghien_cuu_so_sanh_cac_thuat_toan_xu_ly_anh_tinh_do_sau_anh.pdf