OCR技术其实说白了就是一种识别技术,比如说将图片上的文字经过识别扫面的方式转化成TXT文档或者是word格式,也可以将音频转化成文字的一种技术。具体的话,它包含的有什么语音识别,截图识别,银行卡识别,车票识别,营业执照识别,驾驶证识别等等这些功能吧。如果你还有点不懂的话,可以实际去操作一些OCR文字识别软件的功能。
当前的OCR技术并不是完美的,很多复杂形式的文本系统也是无法精准的识别出来,这就需要我们人工去让Ai学习,标注大量的数据给系统学习。可理解为数据标注是通过数据加工人员借助类似于BasicFinder这样的标记工具,对人工智能学习数据进行加工的一种行为。
在一些简单环境下OCR的准确度已经比较高了(比如电子文档),但是在一些复杂环境下的字符识别,在当今还没有人敢说自己能做的很好。现在大家都很少会把目光还放在如何对电子文档的文字识别该怎么进一步提高准确率了,因为他们把目光放在更有挑战性的领域。OCR传统方法在应对复杂图文场景的文字识别显得力不从心,越来越多人把精力都放在研究如何把文字在复杂场景读出来,并且读得准确作为研究课题,用学界术语来说,就是场景文本识别(文字检测+文字识别)。
标签:
本文标题与链接:Ai数据标注ocr是做什么的?https://www.lingeyizhan.com/gov/240.html