AI编程 · 架构思考 · 技术人生
共 15 篇文章

标签:ocr

开源OCR神器:一键捕获文本并用大模型优化

开源项目“ohmytext”提供一键OCR功能,智能捕获鼠标下的图片文本区域,自动拼接文本,并利用大模型清理输出,提升文本提取准确性。核心基于PaddleOCR文本检测模块,适用于图片识别场景。该工具极大简化了文本提取流程,告别手动框选的繁...

赞(0)ToyToy前沿 阅读(48)去评论

AI工具一键转换图片为Excel,解放双手

开发者因老板要求整理发票表格,现有OCR工具效果不佳,于是利用AI技术开发了图片转Excel工具。该工具支持批量上传图片,通过AI OCR自动识别表格结构,生成可编辑的Excel文件,适用于发票、清单等场景。相比手动输入,工具能大幅提高效率...

赞(0)ToyToy前沿 阅读(33)去评论

豆包手机OCR提速:端侧+云端协同优化

豆包手机的OCR技术可能主要在端侧进行。在一个做题流程中,系统首先将整张截图上传至云端,云端仅返回文字区域和按钮位置的信息。随后,题目的OCR处理在本地设备上完成,而云端只接收按钮位置变动的更新。这种云端与本地结合的处理方式,显著提升了响应...

赞(0)ToyToy前沿 阅读(72)去评论

十年稳如初 — LocVPS,用时间证明实力

10+ 年老牌云主机服务商,全球机房覆盖,性能稳定、价格厚道。

老品牌,更懂稳定的价值你的第一台云服务器,从 LocVPS 开始