创作收集素材不易,点个【关注】支持一下吧!

NAS文档搜索需求

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

日常工作涉及泛行业的解决方案

必不可少要搜集一些各行各业的相关文档

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

一方面,这些文档都是碎片化的

并且很多都不是文本格式

基于纯文本的搜索,需要转换格式

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

另一方面,这些资料来之不易

考虑到数据安全问题

通过NAS来存储这些文档就显得很有必要

NAS的磁盘阵列可以很好的保护数据

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

当然顺带解决了

各类云盘跑路、资源和谐等问题

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

这时候在NAS系统上对文档内容进行搜索就成了问题

我需要多端统一的搜索体验

威联通-qsirch

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

最终发现了威联通-qsirch这个神器

我愿称之为目前全平台地表最强!包括mac、win、其它品牌NAS在内。

当然有更好方案的可以评论区交流

设置

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

首先需要在“设置”-“高级索引”里面把OCR选上

这样就会用到AI套件的服务能力了

等索引完毕就可以正常使用了

标准内容识别

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

打开qsirch,挑一张标准文档,但格式为图片的内容进行搜索

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

很轻松就找到了

图片内容搜索

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!qsirch 2-1 OCR效果.png

搜索一个存在于图片上的词

右侧提示有命中结果,包括文件名,相关段落上下文

点击可以快速查看文件

还可以突出显示OCR识别的结果

搜索体验可以说是非常好了

低精度图片内容搜索

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

特意找了一个“包浆图”来难为qsirch

可以看到这张图的精度已经糊到人眼识别都有困难的程度了

没想到qsirch还是能识别个大概

纵向文字搜索

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

组织架构或者清单类信息通常会以纵向文字的方式呈现

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

一般来说OCR是无法识别这种纵向排列的文字的

qsirch当然也不例外

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

查看对应内容的识别结果

发现qsirch不光是不能识别纵向

连单字都没有识别

我猜,它应该是为了保证正确率,采用了词组识别策略

在纵向文字的场景下

一行只有一个字,不构成词组

所以直接就没有识别

PPT内容搜索

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

PPT的内容一般为图文混合

找了PPT中的一个存在于图片中的内容进行搜索

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

居然也很准确的找到了

就是上下文有点一言难尽

应该不是qsirch的问题

这个PPT是网上下载的,包含了标签信息

上下文里面明显就是那些标签信息

不过无所谓,能搜到我要的内容就行

套件联动

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

在FileStation的搜索中可以选择开启qsirch,好评!

对于闭源系统的自研套件来说,打通多个套件的使用并不是什么难事

友商门可以好好学习一下,如何从用户的角度设计产品

关于我的威联通

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

是的!你没有看错!

我的威联通是一台电视盒子改装的。

它的配置是:RK3566处理器,四核64位Cortex-A55,8G内存

稍好于原厂QNAP的TS-416

【宝藏神器】威联通qsirch,NAS地表最强全文搜索!

QNAP的TS-416型号NAS搭载了瑞芯微RK3568处理器,这是一款中高端SoC,四核64位Cortex-A55,主频最高2.0GHz,并且支持Docker,标配的4G内存。

以上就是本文的全部内容,感谢观看!

创作收集素材不易,点个【关注】支持一下吧!

,

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。