Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu ảnh. Cho đến nay chưa có định nghĩa chính xác về biên, trong mỗi ứng dụng người ta đưa ra các độ đo khác nhau về biên, một trong các độ đo đó là độ đo về sự thay đổi đột ngột về cấp xám. Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh. Tập hợp các điểm biên tạo nên biên hay đường bao của đối tượng. Xuất phát từ cơ sở này người ta thường sử dụng hai phương pháp phát hiện biên cơ bản:
Phát hiện biên trực tiếp: Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh. Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là dựa vào sự biến đổi cấp xám theo hướng. Cách tiếp cận theo đạo hàm bậc nhất của ảnh dựa trên kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh dựa trên biến đổi gia ta có kỹ thuật Laplace.
Phát hiện biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới giữa các vùng đó gọi là biên. Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được phân lớp thành các đối tượng, do đó có thể phát hiện được biên.
Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh hưởng của nhiễu, song nếu sự biến thiên độ sáng không đột ngột, phương pháp tỏ ra kém hiệu quả, phương pháp phát hiện biên gián tiếp tuy khó cài đặt, song lại áp dụng khá tốt trong trường hợp này.
Hay còn gọi là phương pháp phát hiện biên trực tiếp, trong phương pháp này có các kỹ thuật sau:
Theo định nghĩa, gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh, ta có:
Trong đó, dx, dy là khoảng cách (tính bằng số điểm) theo hướng x và y.
* Nhận xét:
Tuy ta nói là lấy đạo hàm nhưng thực chất chỉ là mô pháng và xấp xỉ đạo hàm bằng các kỹ thuật nhân chập (cuộn theo mẫu) vì ảnh số là tín hiệu rời rạc nên đạo hàm không tồn tại.
Ví dụ: Với dx = dy = 1, ta có:
Chẳng hạn, ta có ma trận ảnh sau:
Kỹ thuật sử dụng 2 mặt nạ nhập chập xấp xỉ đạo hàm theo 2 hướng x và y là:
Các bước tính toán của kỹ thuật Prewitt
Ví dụ ta có ảnh I:
Tương tự như kỹ thuật Prewitt kỹ thuật Sobel sử dụng 2 mặt nạ nhân chập theo 2 hướng x, y là:
Các bước tính toán tương tự Prewitt
Bài tập dành cho sinh viên, hãy tính toán tương tự với ảnh I đã tính toán với kỹ thuật Prewitt.
Kỹ thuật sử dụng 8 mặt nạ nhân chập theo 8 hướng 00, 450, 900, 1350, 1800, 2250, 2700, 3150
Các bước tính toán thuật toán La bàn:
Trong đó, Hi được cho như sau:
Các phương pháp đánh giá gradient ở trên làm việc khá tốt khi mà độ sáng thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc hai Laplace.
Toán tử Laplace được định nghĩa như sau:
Nên ta dùng:
Trong thực tế, người ta thường dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ rời rạc đạo hàm bậc hai Laplace. Dưới đây là ba kiểu mặt nạ thường dùng:
Bài tập cho sinh viên, hãy tính toán dùng mặt nạ H, cho ảnh sau:
Bài tập 4.1. Viết chương trình đọc vào 1 ảnh và sử dụng kỹ thuật Prewitt để phát hiện biên cho ảnh, hiển thị biên của ảnh.
Bài tập 4.2. Viết chương trình đọc vào 1 ảnh và sử dụng kỹ thuật Sobel để phát hiện biên cho ảnh, hiển thị biên của ảnh.
Bài tập 4.3. Viết chương trình đọc vào 1 ảnh và sử dụng kỹ thuật la bàn để phát hiện biên cho ảnh, hiển thị biên của ảnh.
Bài tập 4.4. Viết chương trình đọc vào 1 ảnh và sử dụng kỹ thuật phát hiện biên Laplace để phát hiện biên cho ảnh, hiển thị biên của ảnh.