Tesseract.js นำการแปล OCR ภาพไปใช้กับเบราว์เซอร์

การแปล OCR ยังคงไม่สมบูรณ์แบบ แต่ได้ปรับปรุงอย่างรวดเร็วในช่วงไม่กี่ปีที่ผ่านมา ผู้นำทางคือ Tesseract เครื่องมือแปล เปิดแหล่งที่มาในปัจจุบัน C++.

แม้ว่านี่จะเป็นห้องสมุดที่น่าทึ่ง แต่ก็ จำกัด เฉพาะซอฟต์แวร์ โชคดีที่มีคนสร้างพอร์ตของ Tesseract เป็น JavaScript ซึ่งเรียกว่า Tesseract.js มัน รองรับได้ถึง 60 ภาษา และแม้ว่ามันจะไม่สมบูรณ์แบบ แต่ก็ทำงานได้ดี.

การติดตั้งและตั้งค่าเป็นเรื่องง่ายที่คุณสามารถทำได้ กำหนดเป้าหมายองค์ประกอบภาพใด ๆ บนหน้าและเรียกใช้ Tesseract.recognize () ฟังก์ชัน การทำเช่นนี้สามารถใช้รูปแบบใดก็ได้โดยอัตโนมัติ บีบอัดและแปล ในเบราว์เซอร์.

คุณสามารถซับซ้อนมากขึ้น แต่ความงามคือ วิธีที่คุณสามารถรัน OCR ด้วยรหัสบรรทัดเดียว.

ลองดูหน้า Landing Page ของ Tesseract.js หากคุณต้องการดูตัวอย่างสด สิ่งนี้ใช้ได้ในเบราว์เซอร์ที่คุณสามารถทำได้ ลากและวางรูปภาพที่สแกนใด ๆ ของข้อความเพื่อรับการแปล OCR อัตโนมัติ.

คุณยังสามารถดาวน์โหลดตัวอย่างนี้แบบโลคัลผ่านหน้า GitHub หรือคุณสามารถสร้างแอพของคุณเองได้โดยใส่สคริปต์ Tesseract.js ไว้จาก CDN.

ตัวอย่างโค้ดที่ง่ายที่สุดจะมีลักษณะดังนี้ myImage เป็นการอ้างอิงโดยตรงกับองค์ประกอบภาพ HTML:

 Tesseract.recognize (myImage) .then (ฟังก์ชั่น (ผลลัพธ์) console.log (ผลลัพธ์));

ไม่ว่าจะทางใดก็ตามห้องสมุดนี้มีประโยชน์มากในการเคลื่อนย้ายด้วย OCR บนเว็บ มันไกลจากที่สมบูรณ์แบบ แต่ก็ยังเป็น แหล่งข้อมูลที่ดีที่สุดสำหรับนักพัฒนาเว็บที่ต้องการฟังก์ชั่น OCR ในหน้าแบบไดนามิก.

หากต้องการเรียนรู้เพิ่มเติมโปรดไปที่หน้า Tesseract.js GitHub ที่คุณสามารถตรวจสอบการสาธิตสดและเรียกดูเอกสารออนไลน์.