Bài trước: Bài 1: NHẬP MÔN XỬ LÝ ẢNH
2) Mở ống kính để phẳng mặt cong màn hình, do vậy ảnh sẽ dàn đều hơn
3) Tắt phím sang tối (Brightness) và phím tương phản (Contrast) của màn hình để tạo độ rõ cho ảnh. Các màu chói, cường độ cao trên ảnh sẽ giảm đi.
4) Đặt tốc độ ống kính từ 1/8 đến 1/2 giây.
Tuy nhiên, các máy in ghép nối với máy tính không có khả năng sắp xếp các chấm đen có kích thước khác nhau của ảnh. Do đó, người ta dùng một số kỹ thuật biến đổi như: phân ngưỡng, chọn mẫu, dithering (dithering sẽ định nghĩa dưới đây).
Phân ngưỡng:
Kỹ thuật này đặt ngưỡng để hiển thị các tông màu liên tục. Các điểm trong ảnh được so sánh với ngưỡng định trước. Giá trị của ngưỡng sẽ quyết định điểm có được hiển thị hay không. Do vậy ảnh kết quả sẽ mất đi một số chi tiết. Có nhiều kỹ thuật chọn ngưỡng áp dụng cho các đối tượng khác nhau :
- Hiện thị 2 màu: chỉ dùng ảnh đen trắng có 256 mức xám. Bản chất của phương pháp này là chọn ngưỡng dựa trên lược đồ mức xám của ảnh. Để đơn giản có thể lấy ngưỡng với giá trị là 127. Như vậy:
trong đó u(m, n) là mức xám tại tọa độ i(m, n).
Nhìn chung kĩ thuật này khó chấp nhận vì ảnh mất khá nhiều chi tiết.
- Hiện thị 4 màu: hiện 4 màu để khắc phục nhược điểm của kỹ thuật hiển thị 2 màu.
THU NHẬN ẢNH
Các thiết bị thu nhận ảnh và kỹ thuật phân tích màu
Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết
bị thu nhận này có thể cho ảnh đen trắng
Các thiết bị thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh
thông dụng Raster, Vector.
Các thiết bị thu nhận ảnh thông thường Raster là camera các
thiết bị thu nhận ảnh thông thường
Vector là sensor hoặc bàn số hoá Digitalizer hoặc được chuyển đổi từ ảnh
Raster.
Nhìn chung các hệ thống thu nhận ảnh thực hiện 1 quá trình
·
Cảm biến: biến đổi năng lượng quang học thành
năng lượng điện
·
Tổng hợp năng lượng điện thành ảnh
Biểu diễn ảnh
Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số
hoá được nhúng trong các thiết bị kỹ thuật khác nhau. Quá trình lưu trữ ảnh nhằm
2 mục đích:
·
Tiết kiệm bộ nhớ
·
Giảm thời gian xử lý
Việc lưu trữ thông tin trong bộ nhớ có ảnh hưởng rất lớn đến
việc hiển thị, in ấn và xử lý ảnh được xem như là 1 tập hợp các điểm với cùng
kích thước nếu sử dụng càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và
càng thể hiện rõ hơn chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải.
Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử
dụng và đặc trưng của mỗi ảnh cụ thể,
trên cơ sở đó các ảnh thường được biểu diễn theo 2 mô hình cơ bản
Biểu diễn bằng mã chạy (Run-Length Code)
Biểu diễn bằng mã xích (Chaine -Code)
Biểu diễn bằng mã tứ phân (Quad-Tree Code)
Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành
phần để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch)
trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa
chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để
nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi,
làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào
công đoạn này
Lấy mẫu và lượng tử hoá
Trong nội dung này chưa đề cập đến phần lấy
mẫu và lượng tử hóa.
Một số phương pháp biểu diễn ảnh
Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh
đã phân đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số
liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính.
Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection)
gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc
làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh
nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các
đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác.
Biểu diễn bằng mã chạy
Phương pháp này thường
biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân. Một vùng ảnh R có thể mã
hoá đơn giản nhờ một ma trận nhị phân:
U(m, n) = 1 nếu (m, n) thuộc R
U( m, n) = 0 nếu (m, n) không thuộc R
U(m, n) = 1 nếu (m, n) thuộc R
U( m, n) = 0 nếu (m, n) không thuộc R
Trong đó: U(m, n) là hàm
mô tả mức xám ảnh tại tọa độ (m, n). Với cách biểu diễn
trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1.
Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ (x, y) theo
các chiều và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có thể
là: (x, y)r; trong đó (x, y) là toạ
độ, r là số lượng các bit có giá trị “1” liên tục theo
chiều ngang hoặc dọc.
Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một đường bất kỳ được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các đoạn thẳng kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các đoạn. Các hướng có thể chọn 4, 8, 12, 24,… mỗi hướng được mã hoá theo số thập phân hoặc số nhị phân thành mã của hướng.Biểu diễn bằng mã tứ phân
Phương pháp mã tứ phân được dùng để mã hoá cho
vùng ảnh. Vùng ảnh đầu tiên được chia làm bốn phần thường là bằng nhau. Nếu mỗi
vùng đã đồng nhất (chứa toàn điểm đen (1) hay trắng (0)), thì gán cho vùng đó
một mã và không chia tiếp. Các vùng không đồng nhất được chia tiếp làm bốn phần
theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất. Các mã phân chia
thành các vùng con tạo thành một cây phân chia các vùng đồng nhất.
Các định dạng cơ bản trong xử lý ảnh
Mô hình Raster
Đây là cách biểu diễn ảnh thông dụng nhất hiện nay, ảnh được
biểu diễn dưới dạng ma trận các điểm (điểm
ảnh). Thường thu nhận qua các thiết bị
như camera, scanner. Tuỳ theo yêu cầu thực thế mà mỗi điểm ảnh được biểu diễn
qua 1 hay nhiều bít
Mô hình Raster thuận lợi cho hiển thị và in ấn. Ngày nay
công nghệ phần cứng cung cấp những thiết bị thu nhận ảnh Raster phù hợp với tốc
độ nhanh và chất lượng cao cho cả đầu vào và đầu ra. Một thuận lợi cho việc hiển
thị trong môi trường Windows là Microsoft đưa ra khuôn dạng ảnh DIB (Device Independent Bitmap) làm trung
gian. Hình 1.4 thể hình quy trình chung để hiển thị ảnh Raster thông qua DIB.
Một trong những hướng nghiên cứu cơ bản trên mô hình biểu diễn
này là kỹ thuật nén ảnh các kỹ thuật nén ảnh lại chia ra theo 2 khuynh hướng là
nén bảo toàn và không bảo toàn thông tin nén bảo toàn có khả năng phục hồi hoàn toàn dữ liệu ban đầu còn nếu không bảo
toàn chỉ có khả năng phục hồi độ sai số
cho phép nào đó. Theo cách tiếp cận này người ta đã đề ra nhiều quy cách khác nhau như BMP, TIF,
GIF, PCX…
Hiện nay trên thế giới có trên 50 khuôn dạng ảnh thông dụng
bao gồm cả trong đó các kỹ thuật nén có khả năng phục hồi dữ liệu 100% và nén
có khả năng phục hồi với độ sai số nhận được.
Quá trình hiển thị và chỉnh sửa, lưu trữ ảnh thông qua DIB |
Mô hình Vector
Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lưu trữ dễ
dàng cho hiển thị và in ấn còn đảm bảo dễ
dàng trong lựa chọn sao chép di chuyển tìm kiếm… Theo những yêu cầu này kỹ thuật
biểu diễn vector tỏ ra ưu việt hơn.
Trong mô hình vector người ta sử dụng hướng giữa các vector
của điểm ảnh lân cận để mã hoá và tái tạo hình ảnh ban đầu ảnh vector được thu
nhận trực tiếp từ các thiết bị số hoá như Digital hoặc được chuyển đổi từ ảnh Raster thông qua các chương trình số hoá
Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ
nhanh và chất lượng cho cả đầu vào và ra nhưng lại chỉ hỗ trợ cho ảnh Raster.
Do vậy, những nghiên cứu về biểu diễn vectơ đều tập trung từ
chuyển đổi từ ảnh Raster.
Sự chuyển đổi giữa các mô hình biểu diễn ảnh |
Các kỹ thuật tái hiện ảnh
Kỹ thuật chụp ảnh
Phương pháp sao chụp ảnh là phương pháp đơn giản, giá thành thấp, chất lượng
cao. Sau bước chụp là kỹ thuật phòng tối nhằm tăng cường ảnh như mong muốn. Ví
dụ kỹ thuật phòng tối như: phóng đại ảnh, thu nhỏ ảnh…, tùy theo ứng dụng. Kỹ
thuật chụp ảnh màn hình màu khá đơn giản. Nó bao gồm các bước sau :
1) Đặt camera trong phòng tối, cách màn
hình khoảng 10 feet (1feet=0,3048m)2) Mở ống kính để phẳng mặt cong màn hình, do vậy ảnh sẽ dàn đều hơn
3) Tắt phím sang tối (Brightness) và phím tương phản (Contrast) của màn hình để tạo độ rõ cho ảnh. Các màu chói, cường độ cao trên ảnh sẽ giảm đi.
4) Đặt tốc độ ống kính từ 1/8 đến 1/2 giây.
Kỹ thuật in ảnh
Người ta dùng kỹ thuật nửa cường độ để thể hiện ảnh trên sách báo, tạp chí.
Theo kỹ thuật này, một ảnh tạo nên bởi một chuỗi các điểm in trên giấy. Thực chất,
mỗi điểm ảnh thường gồm một hình vuông trắng bao quanh một chấm đen. Do vậy, nếu
chấm đen càng lớn ảnh sẽ càng xẫm màu. Màu xám có thể coi như chấm đen chiếm nửa
vùng trắng. Vùng trắng là vùng gồm một chùm các điểm ảnh có rất ít hoặc không
có chấm đen.
Từ đặc điểm cảm nhận của mắt người, sự
thay đổi cường độ chấm đen trong các phần tử ảnh trắng tạo nên mô phỏng của một
ảnh liên tục. Như vậy, mắt người cảm nhận từ một ảnh mà màu biến đổi từ đen qua
xám rồi đến trắng. Tổng số cường độ duy nhất hiện diện sẽ xác định các kích
thước khác nhau của chấm đen. Thông thường, báo ảnh tạo ảnh nửa cường độ với độ
phân giải từ 60 đến 80 dpi (dot per inchs : số điểm ảnh trên một inch), sách có
thể in đến 150 dpi.Tuy nhiên, các máy in ghép nối với máy tính không có khả năng sắp xếp các chấm đen có kích thước khác nhau của ảnh. Do đó, người ta dùng một số kỹ thuật biến đổi như: phân ngưỡng, chọn mẫu, dithering (dithering sẽ định nghĩa dưới đây).
Phân ngưỡng:
Kỹ thuật này đặt ngưỡng để hiển thị các tông màu liên tục. Các điểm trong ảnh được so sánh với ngưỡng định trước. Giá trị của ngưỡng sẽ quyết định điểm có được hiển thị hay không. Do vậy ảnh kết quả sẽ mất đi một số chi tiết. Có nhiều kỹ thuật chọn ngưỡng áp dụng cho các đối tượng khác nhau :
- Hiện thị 2 màu: chỉ dùng ảnh đen trắng có 256 mức xám. Bản chất của phương pháp này là chọn ngưỡng dựa trên lược đồ mức xám của ảnh. Để đơn giản có thể lấy ngưỡng với giá trị là 127. Như vậy:
trong đó u(m, n) là mức xám tại tọa độ i(m, n).
Nhìn chung kĩ thuật này khó chấp nhận vì ảnh mất khá nhiều chi tiết.
- Hiện thị 4 màu: hiện 4 màu để khắc phục nhược điểm của kỹ thuật hiển thị 2 màu.
Khái niệm ảnh đen trắng, ảnh màu.
Ảnh có thể biểu diễn dưới dạng tín hiệu tương tự hoặc tín hiệu
số. Trong biểu diễn số của các ảnh đa mức xám, một ảnh được biểu diễn dưới dạng
một ma trận hai chiều. Mỗi phần tử của ma trận biểu diễn cho mức xám hay cường
độ của ảnh tại vị trí đó.
Biểu diễn mức xám của ảnh số. |
Trong hình trên, một lưới chia ô vuông tưởng tượng được đặt
lên ảnh. Độ lớn mỗi ô vuông của lưới xác định kích thước của một điểm ảnh. Mức
xám của một điểm được tính bằng cường độ sáng trung bình tại mỗi ô vuông này. Mắt
lưới càng nhỏ thì chất lượng ảnh càng cao. Trong kỹ thuật truyền hình tiên tiến,
(mục đích là cung cấp cho người xem), hình ảnh cần chất lượng cao với độ phân
giải gấp hai lần so với các chuẩn hiện nay.
Trong kỹ thuật tương tự, một bức ảnh thường được biểu diễn
dưới dạng các dòng nằm ngang kế tiếp nhau. Mỗi dòng là một tín hiệu tương tự
mang theo các thông tin về cường độ sáng dọc theo một đường nằm ngang trong ảnh
gốc. Ảnh trên một chiếc TV được hiện lên qua các dòng quét này. Mặc dù thuật ngữ
"tương tự" được dùng để mô tả cho các ảnh quét liên tiếp nhưng thực tế
ảnh chỉ tương tự dọc theo hướng nằm ngang. Nó là rời rạc khi xét theo hướng dọc
và chính vì vậy mà tín hiệu ảnh là tín hiệu lai nửa tương tự, nửa số.
Một máy truyền hình được thiết kế để thu tín hiệu truyền
hình mã hoá theo tiêu chuẩn NTSC của Mỹ có khả năng hiển thị xấp xỉ 525 dòng.
Công nghệ truyền hình tiến bộ nỗ lực để cung cấp cho chúng ta số lượng các dòng
gấp hai lần, cho độ phân giải tốt hơn là TV màn ảnh rộng. Một TV có màn ảnh lớn
hơn 28 inch được coi là một TV có màn ảnh rộng. Một điều cần chú ý là TV có khả
năng hiện một số dòng như nhau cho dù nó là 5 inch hay là 50 inch. Màn ảnh lớn
nhất của loại TV dòng quét xen kẽ mà mắt người có khả năng phân biệt được từ
khoảng cách thông thường vào khoảng 3 mét.
Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu trắng. Người
ta phân mức đen trắng đó thành L mức Nếu sử dụng số bit B=8 bít để
mã hóa mức đen trắng (hay mức xám) thì L được xác định :
L=2B (trong ví dụ của ta L=28= 256 mức)
L=2B (trong ví dụ của ta L=28= 256 mức)
Nếu L bằng 2, B=1, nghĩa là chỉ
có 2 mức: mức 0 và mức 1, còn gọi là ảnh
nhị phân. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Nếu L lớn hơn
2 ta có ảnh đa cấp xám.
Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hóa
trên 1 bit, còn với ảnh 256 mức, mỗi điểm ảnh được mã hóa trên 8 bit. Như vậy,
với ảnh đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám
có thể biểu diễn được là 256. Mỗi mức xám được biểu diễn dưới dạng là một số
nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen
nhất và 255 biểu diễn cho mức cường độ sáng nhất.
Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như
các phần tử logic. Ứng dụng chính của nó được dùng theo tính logic để phân biệt
đối tượng ảnh với nền hay để phân biệt điểm biên với điểm khác.
Ảnh màu
Ảnh màu theo lý thuyết
của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ (R), lục (G), lơ (B) và thường thu
nhận trên các dải băng tần khác nhau. Với ảnh màu, cách biểu diễn cũng tương tự
như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn
cho ba màu riêng rẽ gồm: đỏ (red), lục (green) và lam (blue). Để biểu diễn cho
một điểm ảnh màu cần 24 bit. 24 bit này được chia thành ba khoảng 8 bit. Mỗi
màu cũng phân thành L cấp màu khác nhau (thường L=256).
Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính.
Do đó, để lưu trữ ảnh màu người ta có thể lưu trữ từng màu
riêng biệt, mỗi màu lưu trữ như một ảnh đa cấp xám. Do đó, không gian nhớ dành
cho một ảnh màu lớn gấp 3 lần một ảnh đa cấp xám cùng kích cỡ.
Bài tập cuối bài.
Nghiên cứu mức xám? Kỹ thuật thể
hiện mức xám với ảnh đa cấp xám và ảnh màu ?
Bài tiếp theo: