Nhận diện và trích xuất dữ liệu chữ viết tay với FPT.AI Reader
Dữ liệu khách hàng là “tài sản” vô giá của mọi doanh nghiệp. Việc xử lí, lưu trữ thông tin khách hàng là vấn đề cực kì quan trọng. Giải pháp chuẩn hóa dữ liệu đầu vào FPT.AI Reader có khả năng diện và trích xuất dữ liệu tự động hàng nghìn giấy tờ chỉ trong vài giây, thay thế hoàn toàn phương pháp nhập liệu thủ công truyền thống.
Thực tế ứng dụng của OCR trong nhận diện & trích xuất tài liệu
Trích xuất và xử lí thông tin trên giấy tờ là bài toán nan giải đối với nhiều doanh nghiệp, đặc biệt là những ngành có khối lượng giấy tờ khổng lồ phải giải quyết mỗi ngày như ngành dịch vụ, y tế, hành chính công… Xử lí dữ liệu đầu vào tưởng chừng là một việc đơn giản nhưng chiếm khá nhiều thời gian. Bên cạnh đó, những sai sót trong quá trình nhập liệu thủ công có thể gây ra những rắc rối không đáng có về sau cho cả doanh nghiệp và khách hàng.
Công nghệ Nhận diện kí tự quang học (OCR) ra đời đã giải quyết xuất sắc bài toán trích xuất dữ liệu. Theo khảo sát được công bố trên Nanonets, quy mô thị trường OCR dự kiến sẽ đạt 13,38 tỷ USD vào năm 2025. Sự tăng trưởng này được thúc đẩy nhanh chóng bởi cuộc cách mạng số hóa vận hành trên toàn cầu. Các doanh nghiệp tận dụng tối đa sức mạnh của OCR để nâng cao hiệu suất, giảm chi phí lao động, tiết kiệm thời gian quý giá của con người. Nhờ có OCR, 80% công việc trích xuất dữ liệu và nhập liệu được hoàn thành chỉ với 20% nhân viên so với trước đó.
OCR đã và đang giải quyết hiệu quả bài toán trích xuất thông tin đối với các văn bản đánh máy, tuy nhiên, nhận diện chữ viết tay vẫn là một bài toán khó. Những thách thức lớn trong nhận dạng chữ viết tay như sự đa dạng về kiểu chữ và cách viết mỗi người, nét chữ không rõ ràng hoặc các chữ bị dính nhau, viết không thẳng hàng, hay chất lượng của văn bản viết tay kém cũng gây ra những trở ngại đáng kể trong việc nhận diện và chuyển đổi thành văn bản có thể đọc được bằng máy.
Nhận diện chữ viết tay không chỉ là trăn trở đối với các công ty công nghệ trên thế giới, mà nó thực sự gian nan đối với các công ty công nghệ tại Việt Nam. Không có nhiều công ty công nghệ tại Việt Nam dám đương đầu với bài toán này. Tuy nhiên, sau một thời gian dài nghiên cứu chuyên sâu về đặc trưng của tiếng Việt với nhiều dấu, nhiều nét nối giữa các chữ, FPT.AI Reader ra mắt giải pháp nhận diện và trích xuất chữ viết tay với độ chính xác hàng đầu tại thị trường Việt Nam.
FPT.AI Reader – Bước tiến mới trong nhận diện & xử lý chữ viết tay từ ảnh chụp văn bản
Nhận diện chữ viết tay được coi là bước tiến vượt bậc trong việc số hóa giấy tờ một cách đồng bộ và toàn diện của doanh nghiệp. Đối với các văn bản in, FPT.AI Reader dễ dàng xử lí khoảng 80% quy trình trích xuất và nhập liệu thông tin, với tỉ lệ chính xác trên 95%. Tuy nhiên, để nhận diện chữ viết tay yêu cầu công nghệ tiên tiến hơn nhiều. Thay vì sử dụng mô hình xác nhận hình dạng chữ cái, FPT.AI Reader tích hợp mô hình đào tạo Học máy, Học sâu, kết hợp công nghệ Thị giác máy tính ưu việt để nhận dạng các kí tự số và chữ viết tay của con người, với tỉ lệ chính xác từ 80 – 85%.
Đặc biệt, FPT.AI Reader được trang bị mô hình kiểm tra tính đúng của thông tin để chỉ ra chỗ bất thường trên các trường thông tin cần trích xuất như thừa thiếu kí tự, sai ngày tháng… Mô hình cũng có khả năng kiểm tra chéo thông tin trên các văn bản trong cùng một bộ giấy tờ, hoặc đối chiếu dữ liệu khách hàng trên hệ thống CRM của doanh nghiệp. Bên cạnh đó, FPT.AI Reader xây dựng tính năng gán nhãn cảnh báo đối với các trường thông tin có tỉ lệ chính xác không đạt chuẩn, nhằm thuận tiện cho việc con người can thiệp kiểm tra.
Hiện nay, FPT.AI Reader đã và đang được triển khai để tự động hóa quy trình xử lí dữ liệu đầu vào là các văn bản viết tay của khách hàng cho nhiều doanh nghiệp Bảo hiểm, Tài chính, Ngân hàng… để xử lí các giấy tờ khách hàng tự điền như Bệnh án, Ủy nhiệm chi…
FPT.AI Reader giải quyết hiệu quả những vấn nạn trong quá trình nhập liệu chữ viết tay như tỉ lệ sai sót cao, tốn quá nhiều thời gian và nhân sự. Đặc biệt, sự chuyển giao thông tin từ văn bản qua con người có thể bị lộ những thông tin nhạy cảm của khách hàng như thông tin cá nhân, dịch vụ tài chính, tình trạng sức khỏe… Trong ngành Ngân hàng, thông tin khách hàng không được bảo mật tuyệt đối có thể gây ra những sự cố đáng tiếc.
FPT.AI Reader là công cụ nhận diện và trích xuất dữ liệu tối ưu nhất trên thị trường hiện nay. Toàn bộ quy trình số hóa dữ liệu cồng kềnh sẽ được tinh gọn, mang đến những lợi ích lâu dài cho mọi doanh nghiệp trên hành trình chuyển đổi số toàn diện và nâng cao chất lượng dịch vụ, bứt phá hiệu suất vận hành để tăng trưởng bền vững.
https://fpt.ai/vi/reader?utm_source=PR&utm_medium=paid&utm_campaign=reader_handwriting
Ánh Dương
Theo Nhịp Sống Kinh Tế