Support katakana stemming #197

hackartisan · 2020-01-29T20:01:03Z

Example from Martin H:

"Katakana: does アメリカ (amerika) finds アメリカン (amerikan)? It should, it doesn't, but practical consequences are not great (unlike hiragana, if two words in katakana follow each other, there usually is a middle dot in between, which is recognized as a word boundary.)"

We could add bigrams for this use case, or use specialized parsing from Stanford: https://github.com/sul-dlss/sul-solr-configs/blob/master/searchworks-prod/schema.xml#L493

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Support katakana stemming #197

Support katakana stemming #197

hackartisan commented Jan 29, 2020

Support katakana stemming #197

Support katakana stemming #197

Comments

hackartisan commented Jan 29, 2020