なんとなく日本語の形態素解析などを調べている

@klim0824
形態素分解とマルコフ連鎖するAPIあたりを触ったことあるので、その延長線上にLLMがあるんだなあって思ってます。形態素は日本語の品詞分解と微妙に違うのが舶来もの感。

@masamix
ありがとうございます。
試してみましたが、これは英語圏の英数字のみ対応で、日本語のかなは非対応でした…

@klim0824

ああ、だから、日本語の作例だと仮名に開いて変換してるんですね。

日本語対応の例
tenjiflip.hakononaka.net/

フォロー

@masamix
どうしても、かなと点字が対応している関係上、漢字混じりを受け付けないものが多数のようですね…

@masamix
ありがとうございます!

後出しで恐縮ですが、漢字変換だけでなく文節などで分かち書きや表記変換も必要になるため、形態素解析とルビ変換をベースとしてもうひと工夫が必要になりそうと考えてます

日本語の点字のわかち書き
ja.wikipedia.org/wiki/%E3%82%8

ja.wikipedia.org/wiki/%E7%82%B

@klim0824
ああ、そうなると形態素解析器かもですね。点字はそうやって作るんですね。勉強になりました。

ログインして会話に参加
:realtek:

思考の /dev/null