aboutsummaryrefslogtreecommitdiffstats
path: root/isuifang_solr/solr/conf/lang/stopwords_ja.txt
diff options
context:
space:
mode:
authorAlvin Li <liweitianux@gmail.com>2013-08-13 14:42:32 +0800
committerAlvin Li <liweitianux@gmail.com>2013-08-13 14:42:32 +0800
commit755463eed74ed7de9a3c1a12495d2dad655d31d5 (patch)
treef2a77a7a95cd5135ef7b253aa765652ba8323a90 /isuifang_solr/solr/conf/lang/stopwords_ja.txt
parent9636d4a6767f49384d5c386bc3f1142c88b90613 (diff)
download97dev-755463eed74ed7de9a3c1a12495d2dad655d31d5.tar.bz2
added 'isuifang_solr'
Diffstat (limited to 'isuifang_solr/solr/conf/lang/stopwords_ja.txt')
-rw-r--r--isuifang_solr/solr/conf/lang/stopwords_ja.txt127
1 files changed, 127 insertions, 0 deletions
diff --git a/isuifang_solr/solr/conf/lang/stopwords_ja.txt b/isuifang_solr/solr/conf/lang/stopwords_ja.txt
new file mode 100644
index 0000000..d4321be
--- /dev/null
+++ b/isuifang_solr/solr/conf/lang/stopwords_ja.txt
@@ -0,0 +1,127 @@
+#
+# This file defines a stopword set for Japanese.
+#
+# This set is made up of hand-picked frequent terms from segmented Japanese Wikipedia.
+# Punctuation characters and frequent kanji have mostly been left out. See LUCENE-3745
+# for frequency lists, etc. that can be useful for making your own set (if desired)
+#
+# Note that there is an overlap between these stopwords and the terms stopped when used
+# in combination with the JapanesePartOfSpeechStopFilter. When editing this file, note
+# that comments are not allowed on the same line as stopwords.
+#
+# Also note that stopping is done in a case-insensitive manner. Change your StopFilter
+# configuration if you need case-sensitive stopping. Lastly, note that stopping is done
+# using the same character width as the entries in this file. Since this StopFilter is
+# normally done after a CJKWidthFilter in your chain, you would usually want your romaji
+# entries to be in half-width and your kana entries to be in full-width.
+#
+の
+に
+は
+を
+た
+が
+で
+て
+と
+し
+れ
+さ
+ある
+いる
+も
+する
+から
+な
+こと
+として
+い
+や
+れる
+など
+なっ
+ない
+この
+ため
+その
+あっ
+よう
+また
+もの
+という
+あり
+まで
+られ
+なる
+へ
+か
+だ
+これ
+によって
+により
+おり
+より
+による
+ず
+なり
+られる
+において
+ば
+なかっ
+なく
+しかし
+について
+せ
+だっ
+その後
+できる
+それ
+う
+ので
+なお
+のみ
+でき
+き
+つ
+における
+および
+いう
+さらに
+でも
+ら
+たり
+その他
+に関する
+たち
+ます
+ん
+なら
+に対して
+特に
+せる
+及び
+これら
+とき
+では
+にて
+ほか
+ながら
+うち
+そして
+とともに
+ただし
+かつて
+それぞれ
+または
+お
+ほど
+ものの
+に対する
+ほとんど
+と共に
+といった
+です
+とも
+ところ
+ここ
+##### End of file