アルゴリズム/文字列の類似度

アルゴリズム/文字列の類似度

ある文字列が別の文字列にどのぐらい似ているかどうか。 いくつか指標はあるとは思うのだがその文字列が何を意味しているかでその指標の強さが変わると思う。

レーベンシュタイン距離

レーベンシュタイン距離 - Wikipedia

ある文字列からある文字列への編集をやるとして、その編集操作の作業量をもってして類似度を測る。

単純にやってしまうとこのスコアは文字数に依存することになるので標準化する必要がある。

algorithm/relatedness_strings.txt · 最終更新: 2018-09-14 10:18 by ore