とりあえず、上のものを実装してみた。 やはり単語ではない頻度の高い文字列を多数拾ってしまう。それから類似性の判断も何とかしたいところ。
うん、人工無脳よりもこっちの方がしっくりくる。辞書無しで学習するためにはどうしたらよいか。 単語学習は統計的にのみ扱えばよい。 つまり、番目の文字に対してその出現確率を定義し、同様に文字列に対してその出現確率を定義する。とを比較し、出現確率…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。