日本語はそもそも句読点以外、空白は無視してインデックスしていいのでは感。どうせ形態素解析よりNGramで索引作るでしょ。人間が機械に合わせるより機械が人間に合わせてくれ。googleの検索キーワードを上手く選べる人間を育てるより、siriがきちんと自然言語を解除してくれるほうがいいでしょ。「文字の間に空白を開けるような人がいた」も事件の記録の一つとなるだろうし。なので、あれを批判するのに機械可読性を出すのは筋が悪い気がする。技術者ならなおさら。単純につまらないって言って良いと思うよ。
解除→解釈
@osapon 俳句を発見しました!『単純に つまらないって 言って良い』
思考の /dev/null
解除→解釈