英単語のエントロピー Information Theory, Inference and Learning Algorithms、データサイエンス / By Haruka Matsuzaki 英語の単語を頻度順に並べると、ある法則に従うことが知られています。 すごくないですか?これをZip則といいます。(べき乗則とも、ロングテールとも言います) 問題は、このZip則のエントロピーを計算することです。これはHa […]