Sử dụng ai xử lý ảnh

Các bước cơ bản của ứng dụng xử lý ảnh gồm 3 bước chính: Tiền xử lý -> Phát hiện -> Nhận diện. Tuy nhiên tùy theo yêu cầu mà không cần phải có đủ 3 bước.

Nội dung chính Show

Lý thuyết
Bước 1: Tiền xử lý
Bước 2: Phát hiện
Bước 3: Nhận diện (Nhận dạng)
Kết luận

Xử lý ảnh hay bị nhầm với chỉnh sửa ảnh bằng Photoshop, do đó gọi là Thị giác máy tính (TGMT) cho gọn.

Lý thuyết

Ứng dụng TGMT có input là ảnh và ouput là thông tin. Thông tin output dùng để trả lời các câu hỏi của bài toán như:
– Có vật thể trong ảnh không?
– Vật thể ở vị trí nào?
– Có bao nhiêu vật thể trong ảnh?
– Vật thể đó loại gì?
– Ảnh có đủ chất lượng không? (nét, nhiễu,…)
….

Bài viết này sử dụng 2 bài toán kinh điển là đọc biển số xe và nhận diện khuôn mặt làm ví dụ. 2 bài toán này nhiều người biết nên dễ phân tích.

Bước 1: Tiền xử lý

Tiền xử lý có mục đích làm cho ảnh dễ nhận dạng hơn, loại bỏ các yếu tố không cần thiết. Các công việc thường gặp như:
– Crop ảnh, resize ảnh
– Biến đổi ảnh thành dạng ảnh khác: ảnh màu sang ảnh xám, ảnh xám sang nhị phân, RGB -> HSV,…
– Cân bằng sáng
– Lọc nhiễu
– Xoay ảnh, warp ảnh
….

Ảnh sau khi warp để góc nhìn được trực diện hơn

Ảnh sau khi đã lọc nhiễu (internet)

Trong ứng dụng nhận diện khuôn mặt thì tiền xử lý biến đổi ảnh thành ảnh xám. Ngoài ra tùy theo yêu cầu về độ chính xác mà có thể áp dụng nhiều phương thức để ảnh dễ nhận diện hơn. Thường là cân bằng sáng, tăng độ tương phản để nhận diện chính xác hơn.

Còn đọc biển số xe cũng chuyển sang ảnh xám, và tùy theo size ảnh của camera (1MP hay 2MP) mà resize lại. Cần phải resize vì kích cỡ ảnh quá lớn sẽ làm tốn thời gian xử lý.

Bước 2: Phát hiện

Phát hiện vật thể dùng để tìm vật thể trong ảnh. Sau bước này sẽ biết được có vật thể cần tìm không, nếu có thì ở vị trí nào & số lượng bao nhiêu.

Tùy theo loại đối tượng cần tìm mà có các cách khác nhau, như Cascade là 1 cách. Các bài toán đơn giản như tìm màu sắc chỉ cần dùng kênh màu HSV là được.

Khi xong bước phát hiện khuôn mặt bạn sẽ biết được số lượng khuôn mặt trong ảnh (0 -> n). Nếu 0 có khuôn mặt thì dừng lại & trả về kết quả, nếu có thì qua bước 3 để nhận diện.

Biển số xe cũng tương tự, cần phải xác định là có biển số xe trong ảnh hay không. Nếu không có thì trả về kết quả cho người dùng là không có biển số. Còn có biển số thì lặp lại bước Phát hiện một lần nữa để tìm ký tự trong biển. Sau khi tách xong các ký tự thì mới đưa sang bước 3 để nhận diện.

Bước 3: Nhận diện (Nhận dạng)

Sau khi đã phát hiện được vật thể và muốn nhận diện vật thể loại nào thì cần bước này. Bước này phải sử dụng Machine Learning để phân lớp (classification) đối tượng.

Để nhận diện khuôn mặt cần crop khuôn mặt để Machine Learning nhận diện. Bước phân lớp tác dụng là tìm xem giống khuôn mặt đã học nào nhất. Kết quả trả về là khuôn mặt giống nhất kèm tỉ lệ giống (confident).

Các ký tự sau khi segment khỏi ảnh thì tiến hành phân loại lớp để lấy kết quả:

Kết luận

Tiền xử lý luôn có trong mọi ứng dụng TGMT, còn bước Nhận diện tùy theo yêu cầu mà thực hiện. Bước Nhận diện cần phải chuẩn bị đầy đủ dữ liệu để training và kiến thức về ML.

Tuy nhiên bước 2 và bước 3 đều có thể phải cần đến Machine Learning nếu như vật thể cần tìm có cấu trúc phức tạp. Đôi khi phải lặp lại nhiều lần các bước 1-2-3 mới ra được kết quả. Do đó các bước cơ bản chỉ mang tính chất tham khảo tương đối, không áp dụng cho mọi hoàn cảnh.

Thứ tự của các bước cũng chỉ mang tính tương đối, tùy theo các loại yêu cầu của bài toán. Do đó cần có tư duy linh hoạt, sẵn sàng thử nghiệm, so sánh cái mới để tìm ra cách chính xác nhất.

Nghiên cứu và ứng dụng AI ngày càng được quan tâm và áp dụng nhiều vào thực tế cuộc sống. Ngay từ đợt dịch COVID-19 bùng phát đầu tiên tại Việt Nam, tháng 03/2020 Công ty Công nghệ thông tin Điện lực miền Trung (CPCIT) đã ứng dụng công nghệ nhận diện khuôn mặt (Face detect) để phát triển hệ thống tự động phát hiện, nhắc nhở người không đeo khẩu trang, đeo khẩu trang không đúng cách. Năm 2021 với chủ đề “Chuyển đổi số trong Tập đoàn Điện lực Quốc gia Việt Nam”, AI cũng được quan tâm nghiên cứu ứng dụng vào lĩnh vực kỹ thuật, cụ thể EVNCPC được EVN giao thử nghiệm ứng dụng AI trong công nghệ xử lý và nhận diện hình ảnh. Một vài đơn vị đã xây dựng các mô hình AI, áp dụng trong việc xử lý và nhận diện để kiểm tra, phân tích hình ảnh hượng hiện trường áp dụng vào PMIS phục vụ công tác quản lý kỹ thuật, giúp phát hiện sớm nhằm ngăn ngừa các tồn tại trên lưới điện như vi phạm hành lang tuyến, hư hỏng cách điện và các nguyên nhân khác…

Tại các buổi thảo luận và xây dựng phương án thực hiện thử nghiệm AI trong nhận diện và xử lý hình ảnh của Công ty Điện lực Thừa Thiên Huế về giải pháp nhận diện sứ cách điện vỡ, nứt, bám bẩn, vệt phóng điện; hay đề xuất của Công ty Điện lực Quảng Ngãi về giải pháp nhận diện đứt dây buộc cổ sứ, dao cách ly bị rỉ sét, xà rỉ… và nhiều đề xuất khác như nhận điện dộ võng dây dẫn, dây dẫn bị tổn thương nhận được các đánh giá và sự quan tâm từ các cấp lãnh đạo EVNCPC. Ngoài ra, các giải pháp về hướng áp dụng thực tế cũng được phân tích cụ thể trong quá trình xem xét lựa chọn thử nghiệm AI như phân tích hình ảnh từ flycam, kiểm tra hiện trường… để xây dựng các bài toán áp dụng phù hợp với thực tế.

Một vài hình ảnh thực tế từ đề xuất thử nghiệm AI của đơn vị:

Đứt dây buộc cổ sứ (Ảnh: PC Quảng Ngãi)

Nhận diện sứ cách điện (Ảnh:PC Thừa Thiên Huế)

Quá trình xây dựng chương trình thử nghiệm được chia thành 2 giai đoạn:

Giai đoạn 1: Thu thập dữ liệu hình ảnh, gắn nhãn hình ảnh, xây dựng thuật toán và huấn luyện AI.
Giai đoạn 2: Xây dựng các bài toán nghiệp vụ từ kết quả đầu ra của AI để áp dụng vào chương trình quản lý kỹ thuật PMIS.

Quá trình xây dựng và áp dụng công nghệ AI cần nhiều chất xám và tái sử dụng nhiều hơn nữa nguồn dữ liệu hình ảnh hiện có. Trong đó, việc xây dựng kho dữ liệu gắn nhãn thiết bị được phân loại, tập trung lưu trữ và chia sẻ cho mục đích tái sử dụng nguồn dữ liệu đã gắn nhãn nhằm rút ngắn thời gian xây dựng các ứng dụng. Ngoài ra, các Server chạy các ứng dụng AI cũng cần có cấu hình cao, đáp ứng được sự tăng trưởng về mặt dữ liệu, xử lý thuật toán nhanh, tăng tốc độ xử lý. Cuối cùng, việc lựa chọn các mô hình và thuật toán phù hợp là yếu tố quan trọng, góp phần ứng dụng AI trong công tác quản lý kỹ thuật nói riêng và áp dụng vào ngành điện nói chung.

xử lý