你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!

token filter 中的stop token filter如何设置空格为 stop word

Elasticsearch | 作者 chencc | 发布于2021年08月10日 | 阅读数：1584

这里的stopwords_path文件中设置了空格字符（直接输入的），结果无效（除了空格外的其他字符都能生效）

PUT  jieba_test

{

  "settings": {

    "analysis": {

      "filter": {

        "jieba_stop": {

          "type":        "stop",

          "stopwords_path": "stopwords.txt"

        }

      },

      "analyzer": {

        "my_ana": {

          "tokenizer": "jieba_index",

          "filter": [

            "lowercase",

            "jieba_stop"

          ]

        }

      }

    }

  }

}

但是换成这样是有效的，想请教一下如何在文件中配置空格



PUT  jieba_test02

{

  "settings": {

    "analysis": {

      "filter": {

        "jieba_stop": {

          "type":        "stop",

          "stopwords": [ " ", "is", "the" ]

        }

      },

      "analyzer": {

        "my_ana": {

          "tokenizer": "jieba_index",

          "filter": [

            "lowercase",

            "jieba_stop"

          ]

        }

      }

    }

  }

}

1 个回复

caster_QL

stopwords_path文件采用UTF-8 encoded，每行一个单词，可以试一下UTF-8的空格表示形式：

要回复问题请先登录或注册

token filter 中的stop token filter如何设置空格为 stop word

1 个回复

发起人

活动推荐

相关问题

问题状态

token filter 中的stop token filter如何设置空格为 stop word

与内容相关的链接

1 个回复

发起人

活动推荐

相关问题

问题状态