个人技术分享

OCR是什么，主要应用和未来发展趋势

2024-07-01
ocr
340人已看

OCR，即光学字符识别（Optical Character Recognition），是一种能够将图像文件中的文字资料转化为电子文本的技术。它广泛应用于多个领域，涉及的主要技术包括。

TTime：截图翻译/OCR

2024-05-27
ocr
98人已看

日常网页翻译Translate Web Pages完全足够，TTime最重要的功能，还是截图翻译，还有个厉害的功能，就是静默OCR，相比之前的分享的识字精灵效率更高。

通过分析当前OCR中深度学习模型的可解释性问题，探讨提高可解释性的方法，并结合实际案例和挑战，旨在促进深度学习模型在OCR领域的更广泛应用。针对OCR中深度学习模型的可解释性问题，通过采取相关方法和工具，提高模型的可解释性，可以使其在实际应用中更加可靠和可信赖，促进深度学习模型在OCR领域的更广泛应用。d. 设计OCR领域特定的解释性指标：根据OCR领域的需求，设计相应的解释性指标，从而更好地满足实际应用的需求。b. 特征可视化：通过可视化文字特征的方式，使模型对文字识别的逻辑更加清晰，增强可解释性。

天若OCR 识别 (本地文字识别转换工具)

2024-05-28
ocr
91人已看

天若OCR文字识别本地版是一款在天若OCR文字识别工具v5.0免费开源版的基础上采用Chinese-lite框架和Paddle-ocr框架本地化识别接口编译而成,无需联网也无需申请密钥，纯本地运算，识别准确度和速度很快，操作和天若OCR免费版一样，F4是截图，可以翻译，段落合并等，推荐使用Paddle-OCR识别，可以在识别结果切换接口。

CV之Nougat：Nougat(一种基于神经网络实现OCR功能的视觉转换器模型)的简介、安装和使用方法、案例应用之详细攻略

CV之Nougat：Nougat(一种基于神经网络实现OCR功能的视觉转换器模型)的简介、安装和使用方法、案例应用之详细攻略目录相关论文Nougat的简介Nougat的安装和使用方法Nougat的案例应用相关论文《Nougat: Neural Optical Understanding for Academic Documents》的翻译与解读地址论文地址：https://arxiv.org/abs/2308.13418时间202

如何使用OCR批量提取短剧和电视剧内的字幕？

2024-05-22
ocr
101人已看

视频字幕提取是将视频中的字幕转换为 SRT 格式文本的过程。传统方法是使用自动语音识别 (ASR) 技术，但对于某些类型的视频（例如短剧、电视剧、电影、访谈等节目），由于这类型视频的声音波动大、场景声音和背景音乐的干扰多，通过ASR识别的字幕有很多错误。因此通过OCR 技术可以提供更高的准确率。OCR 技术具有以下优点：更高的准确率：OCR 可以直接识别视频帧中的文本，不受音频质量的影响。因此，对于具有噪音环境或低质量音源的视频，OCR 可以提供更高的准确率。

【MiniCPM-V】win10本地部署OCR等性能测试

2024-05-23
ocr
102人已看

本地配置如下。

纸质名片变成结构化数据：浅析OCR名片识别技术的原理与应用

2024-05-20
ocr
96人已看

综上所述，OCR名片识别技术以其独特的魅力，将名片上的文字转化为可编辑、结构化的电子数据，极大地提升了名片信息的利用效率。然而，在实际应用中，我们仍需不断优化算法和技术，克服挑战，提高识别的准确性和应用范围，让这项技术在信息管理的舞台上绽放更加璀璨的光芒。优秀的采集设备与适宜的采集环境，犹如精心布置的舞台，为后续的识别过程奠定了坚实的基础。它凭借光学字符识别的智慧，历经图像采集、文字提取、识别算法、结果结构化及人工智能技术的融合等精妙步骤，实现了对名片文字的自动化解码与转化。

python 使用OCR 识别woff字体文件

解析woff文件，并将woff字体转为图片，并将字体编码与字体图片相对应，便于之后的数据解密解析。做数据获取安**时发现请求返回的数据跟woff字体有关，这里写一个使用OCR识别方法记，使用的是muggle_ocr，当然可以使用其他的图片识别技术。该部分代码仅用于学习使用。

离线文字识别软件Umi-OCR

2024-05-23
ocr
105人已看

在日常工作与生活中，经常需要从图片中提取文字信息。传统的手动方法既费时又易出错。为此，可以尝试Umi-OCR，这款强大且高效的文字识别工具，免费且开源。光学字符识别（Optical Character Recognition, OCR）是指对文本材料的图像文件进行分析识别处理，以获取文字和版本信息的过程。也就是说将图象中的文字进行识别，并返回文本形式的内容。

如何使用OCR批量提取短剧和电视剧内的字幕？

2024-05-22
ocr
106人已看

视频字幕提取是将视频中的字幕转换为 SRT 格式文本的过程。传统方法是使用自动语音识别 (ASR) 技术，但对于某些类型的视频（例如短剧、电视剧、电影、访谈等节目），由于这类型视频的声音波动大、场景声音和背景音乐的干扰多，通过ASR识别的字幕有很多错误。因此通过OCR 技术可以提供更高的准确率。OCR 技术具有以下优点：更高的准确率：OCR 可以直接识别视频帧中的文本，不受音频质量的影响。因此，对于具有噪音环境或低质量音源的视频，OCR 可以提供更高的准确率。

纸质名片变成结构化数据：浅析OCR名片识别技术的原理与应用

2024-05-20
ocr
97人已看

综上所述，OCR名片识别技术以其独特的魅力，将名片上的文字转化为可编辑、结构化的电子数据，极大地提升了名片信息的利用效率。然而，在实际应用中，我们仍需不断优化算法和技术，克服挑战，提高识别的准确性和应用范围，让这项技术在信息管理的舞台上绽放更加璀璨的光芒。优秀的采集设备与适宜的采集环境，犹如精心布置的舞台，为后续的识别过程奠定了坚实的基础。它凭借光学字符识别的智慧，历经图像采集、文字提取、识别算法、结果结构化及人工智能技术的融合等精妙步骤，实现了对名片文字的自动化解码与转化。

纸质名片变成结构化数据：浅析OCR名片识别技术的原理与应用

2024-05-20
ocr
116人已看

综上所述，OCR名片识别技术以其独特的魅力，将名片上的文字转化为可编辑、结构化的电子数据，极大地提升了名片信息的利用效率。然而，在实际应用中，我们仍需不断优化算法和技术，克服挑战，提高识别的准确性和应用范围，让这项技术在信息管理的舞台上绽放更加璀璨的光芒。优秀的采集设备与适宜的采集环境，犹如精心布置的舞台，为后续的识别过程奠定了坚实的基础。它凭借光学字符识别的智慧，历经图像采集、文字提取、识别算法、结果结构化及人工智能技术的融合等精妙步骤，实现了对名片文字的自动化解码与转化。

【多模态】32、TextMonkey | 一个 OCR-Free 的专门针对文档理解的大型多模态模型

本文主要介绍多模态模型 TextMonkey

纸质名片变成结构化数据：浅析OCR名片识别技术的原理与应用

2024-05-20
ocr
116人已看

综上所述，OCR名片识别技术以其独特的魅力，将名片上的文字转化为可编辑、结构化的电子数据，极大地提升了名片信息的利用效率。然而，在实际应用中，我们仍需不断优化算法和技术，克服挑战，提高识别的准确性和应用范围，让这项技术在信息管理的舞台上绽放更加璀璨的光芒。优秀的采集设备与适宜的采集环境，犹如精心布置的舞台，为后续的识别过程奠定了坚实的基础。它凭借光学字符识别的智慧，历经图像采集、文字提取、识别算法、结果结构化及人工智能技术的融合等精妙步骤，实现了对名片文字的自动化解码与转化。

python实名认证开发文档-接口文档-身份证ocr接口

2024-05-15
python, ocr
89人已看

想象一下，当用户因为简便快捷的认证过程而露出满意的微笑，那份由技术带来的温暖，正是翔云身份证实名认证接口提供平台不懈追求的目标。每一次准确无误的识别，都是翔云对“科技让生活更美好”这一信念的践行。众多行业领军者已选择并信赖翔云实名认证解决方案，从金融科技到在线教育，从政府服务到医疗健康，翔云与您一起步入实名认证的新纪元，用技术的力量重塑信任，开启业务增长的新篇章！Python实名认证开发文档，特别是深度优化的OCR接口，正是您跨越信任鸿沟、构建坚不可摧业务防线的金钥匙！

OCR文本识别模型CRNN

OCR文本识别模型CRNN网络原理和代码

【项目】使用Yolov8 + tesseract 实现“营业执照”信息解析（OCR） + 输入可为图片或者pdf + 完整代码 + 整体方案 + 全网首发

2024-05-09
yolo, pdf, 运维, linux, ocr
200人已看

使用Yolov8 + tesseract 实现“营业执照”信息解析（OCR） + 输入可为图片或者pdf + 完整代码 + 整体方案 + 全网首发