创作收集素材不易,点个【关注】支持一下吧!
NAS文档搜索需求
日常工作涉及泛行业的解决方案
必不可少要搜集一些各行各业的相关文档
一方面,这些文档都是碎片化的
并且很多都不是文本格式
基于纯文本的搜索,需要转换格式
另一方面,这些资料来之不易
考虑到数据安全问题
通过NAS来存储这些文档就显得很有必要
NAS的磁盘阵列可以很好的保护数据
当然顺带解决了
各类云盘跑路、资源和谐等问题
这时候在NAS系统上对文档内容进行搜索就成了问题
我需要多端统一的搜索体验
威联通-qsirch
最终发现了威联通-qsirch这个神器
我愿称之为目前全平台地表最强!包括mac、win、其它品牌NAS在内。
当然有更好方案的可以评论区交流
设置
首先需要在“设置”-“高级索引”里面把OCR选上
这样就会用到AI套件的服务能力了
等索引完毕就可以正常使用了
标准内容识别
打开qsirch,挑一张标准文档,但格式为图片的内容进行搜索
很轻松就找到了
图片内容搜索
qsirch 2-1 OCR效果.png
搜索一个存在于图片上的词
右侧提示有命中结果,包括文件名,相关段落上下文
点击可以快速查看文件
还可以突出显示OCR识别的结果
搜索体验可以说是非常好了
低精度图片内容搜索
特意找了一个“包浆图”来难为qsirch
可以看到这张图的精度已经糊到人眼识别都有困难的程度了
没想到qsirch还是能识别个大概
纵向文字搜索
组织架构或者清单类信息通常会以纵向文字的方式呈现
一般来说OCR是无法识别这种纵向排列的文字的
qsirch当然也不例外
查看对应内容的识别结果
发现qsirch不光是不能识别纵向
连单字都没有识别
我猜,它应该是为了保证正确率,采用了词组识别策略
在纵向文字的场景下
一行只有一个字,不构成词组
所以直接就没有识别
PPT内容搜索
PPT的内容一般为图文混合
找了PPT中的一个存在于图片中的内容进行搜索
居然也很准确的找到了
就是上下文有点一言难尽
应该不是qsirch的问题
这个PPT是网上下载的,包含了标签信息
上下文里面明显就是那些标签信息
不过无所谓,能搜到我要的内容就行
套件联动
在FileStation的搜索中可以选择开启qsirch,好评!
对于闭源系统的自研套件来说,打通多个套件的使用并不是什么难事
友商门可以好好学习一下,如何从用户的角度设计产品
关于我的威联通
是的!你没有看错!
我的威联通是一台电视盒子改装的。
它的配置是:RK3566处理器,四核64位Cortex-A55,8G内存
稍好于原厂QNAP的TS-416
QNAP的TS-416型号NAS搭载了瑞芯微RK3568处理器,这是一款中高端SoC,四核64位Cortex-A55,主频最高2.0GHz,并且支持Docker,标配的4G内存。
以上就是本文的全部内容,感谢观看!
创作收集素材不易,点个【关注】支持一下吧!
,