Chuyển đổi hình ảnh thành tài liệu có thể chỉnh sửa bằng công cụ OCR miễn phí

Tôi đảm bảo rằng ít nhất một lần trong đời bạn đã phải nhập thủ công văn bản của một tờ giấy in vào một tài liệu kỹ thuật số và tôi chắc chắn rằng giữa chừng bạn đã nguyền rủa bàn phím của mình và ước rằng bạn có thể quét trang đó thành một trang có thể chỉnh sửa được. dữ liệu văn bản. Chắc chắn, điều đó có thể dễ dàng được xử lý bằng máy quét và ứng dụng OCR theo ý của bạn. Nhưng đối với những lúc bạn không chuẩn bị trước hoặc đang di chuyển, một tính năng mới của Google Tài liệu có thể giúp ích.

Khoảng hai tuần trước, Google đã âm thầm giới thiệu tính năng OCR miễn phí trong Google Docs. Giống như bất kỳ công cụ OCR (nhận dạng ký tự quang học) nào khác, dịch vụ dựa trên đám mây này trích xuất văn bản từ hình ảnh rồi đặt văn bản đó vào tài liệu dựa trên văn bản có thể chỉnh sửa điển hình của bạn.

API OCR của Google Documents chưa được triển khai chính thức nhưng vẫn có sẵn để sử dụng. Công cụ này có thể phân tích các tệp hình ảnh JPG, GIF và PNG có kích thước 10MB hoặc nhỏ hơn. Google trích dẫn một vài hạn chế khác, gợi ý rằng hình ảnh phải có độ phân giải khá cao với các ký tự có chiều cao khoảng 10 pixel.

Đọc thêm:  Tập lệnh AutoHotKey tiết kiệm thời gian

svg+xml,%3Csvg%20xmlns= Chuyển đổi hình ảnh thành tài liệu có thể chỉnh sửa bằng công cụ OCR miễn phí

Giả sử hình ảnh của bạn đáp ứng các điều kiện lý tưởng, Google cho biết thao tác OCR sẽ mất khoảng 15 giây cho tệp 500KB và 40 giây cho tệp 2MB. Sau khi chơi với nó một lúc, tôi thấy nó nhanh hơn nhiều, với hình ảnh 250-500KB chỉ mất 10-20 giây để xử lý tối đa.

Để cho bạn thấy một ví dụ, tôi đã chuyển đổi ảnh chụp màn hình của một đoạn trích từ bài đánh giá HIS Radeon HD 5850 của TechSpot và kết quả khá tốt. Trong ảnh chụp màn hình đã tải lên của tôi, tôi đã phóng to tối đa trên Chrome và văn bản lớn hơn một chút so với chiều cao 10 pixel được đề xuất của Google. Đúng là có một vài ký tự bị sai, nhưng nhìn chung, tôi đã nhận lại được bản trình bày chính xác những gì tôi đã gửi. Trong khi đó, hình ảnh mẫu do Google cung cấp rất rõ ràng – vì vậy tôi cho rằng phải có sự cân bằng giữa những gì hiệu quả và những gì không.

svg+xml,%3Csvg%20xmlns= Chuyển đổi hình ảnh thành tài liệu có thể chỉnh sửa bằng công cụ OCR miễn phí

Mặc dù tất cả những điều này có vẻ kỳ diệu, nhưng các dịch vụ OCR dựa trên Web không hoàn toàn mới. Giải pháp của Google khá tiện dụng, đặc biệt nếu bạn đã là người dùng Google Docs cuồng nhiệt, nhưng các dịch vụ như OnlineOCR, FineReaderOnline, Free-ORC và OCRTerminal cung cấp các tính năng bổ sung. Một số cung cấp hỗ trợ ngôn ngữ rộng hơn, nhập và xuất loại tệp và một số khác chỉ đơn giản là ít hạn chế hơn với kích thước tệp – mặc dù tôi không thể nói mức độ đọc của bất kỳ hình ảnh văn bản nào.

Đọc thêm:  Giá GPU thậm chí còn giảm hơn nữa - Radeon mới sắp ra mắt

Ngoài ra còn có nhiều cách để OCR miễn phí trên máy tính để bàn của bạn. Phần mềm máy tính để bàn OCR truyền thống như OmniPage rõ ràng phải trả phí, nhưng nếu bạn đang tìm kiếm một giải pháp OCR dựa trên máy tính để bàn chắc chắn hơn thì bạn có thể đã có một giải pháp mà không biết. Onenote 2007 của Microsoft Office đi kèm với chức năng OCR đơn giản có thể được kích hoạt bằng cách nhấp chuột phải vào hình ảnh và chọn “Sao chép văn bản từ hình ảnh”. Ngoài ra, nếu bạn tìm trong menu chương trình của Office, bạn sẽ tìm thấy Công cụ Microsoft Office > Hình ảnh Tài liệu Microsoft Office, cũng hoạt động mặc dù có một số hạn chế nhất định.

Các ứng dụng OCR phần mềm miễn phí độc lập cũng có sẵn, hãy kiểm tra FreeOCR và TopOCR.