OCR

ocr 为文本识别模块，包括两个模型：ocr_detection 和 ocr_recognition。ocr_detection 模型检测图片中文本所在区域，ocr_recognition 模型可识别每个文本区域内的字符（中文/英文/数字）。

模块提供简单易用的接口，使用者只需上传图片即可获取文本识别结果。

ocr_detection和ocr_recognition模型是PaddleOCR发布PP-OCRv3模型的压缩版本，在损失一小部分精度的情况下，大幅提升在js上的运行速度。

ocr_recognition模型输入shape为[1, 3, 48, 320],模型推理前会对图片文本框选区域进行处理：图片文本框选区域宽高比 <= 10，将整个框选区域传入识别模型；框选区域宽高比 > 10，则对框选区域按宽度进行裁剪，将裁剪区域传入识别模型，最终拼接裁剪区域每一部分的识别结果。

使用

import * as ocr from '@paddle-js-models/ocr';
// 模型初始化
await ocr.init();
// 获取文本识别结果API，img为用户上传图片，option为可选参数 
// option.canvas as HTMLElementCanvas：若用户需要绘制文本框选区域，传入canvas元素
// option.style as object：若用户需要配置canvas 样式，传入style 对象
// option.style.strokeStyle as string：文本框选颜色
// option.style.lineWidth as number：文本框选线段宽度
// option.style.fillStyle as string：文本框选填充颜色
const res = await ocr.recognize(img, option?);
// 识别文字结果
console.log(res.text);
// 文本区域坐标
console.log(res.points);

在线体验

https://paddlejs.baidu.com/ocr

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_cn.md

README_cn.md

OCR

使用

在线体验

效果

Files

README_cn.md

Latest commit

History

README_cn.md

File metadata and controls

OCR

使用

在线体验

效果