你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
没有找到相关结果
大慈大悲掌 - 要我一直笑吗?https://www.jianshu.com/u/bfa06856a726
赞同来自:
fujun - 90
Acepcs - ES
laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net
要回复问题请先登录或注册
90
7 个回复
大慈大悲掌 - 要我一直笑吗?https://www.jianshu.com/u/bfa06856a726
赞同来自:
fujun - 90
赞同来自:
大慈大悲掌 - 要我一直笑吗?https://www.jianshu.com/u/bfa06856a726
赞同来自:
{
"filename":"xxx",
"createTime":xxxx
"title":"xxx",
"content":"xxx",
"path":"xxxx"
...
}
然后搜索的时候做类似filename:keyword and title:keyword and content:keyword的逻辑,更多的比如标题和内容要做什么分词,要不要冗余字段等等
fujun - 90
赞同来自:
Acepcs - ES
赞同来自:
一个word文档文件名为myword.docx,里面的文章标题为mytitle,里面包含1个表格,5张图片,大段文字。
先将图片/多媒体数据存到一些云对象存储产品里,将本地的“图片”转换成云上的一条“url”。接着再对表格进行一些结构上的解析。
那么你可以先预处理将其整合成
{
"file_name" : "myword.docx",
"file_path" : "mypath",
"title" : "mytitle",
"length" : LONG,
"content" : "mycontent",
"tables" : [
{
"table_title" : "mytabletitle",
"table_headers" : [],
"table_rows" : []
}
],
"pictures": [
{
"url" : "picurl",
"size" : "picsize"
}
]
}
fujun - 90
赞同来自:
laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net
赞同来自: