じゆうちょう

自由帳です

Tonguessで「強い単語」は何か?【データから見る強い単語ランキング:3文字ルール編】

f:id:timtom_qqq:20200611151120j:plain

ランキングだけ見たい方は目次から4までジャンプしてください! 

1. はじめに 

Tonguessにハマっています。以下の攻略記事では、「?IP」や「?AY」などありふれた文字の繋がりを含む単語が推定されにくいということを書きました。

 

timtom-qqq.hatenablog.com

本記事ではTonguessの辞書を実際に見て、強い単語は何かを調べていきます。今回は3文字ルールを対象にします。 

2. Tonguessにおいて「強い単語」とは

Tongussでは単語の一部が決まった時に全体を推測することが難しい単語が強いです。例えば相手の単語が「?IP」まで確定した状況だとすると、「?」に入るものは「S」、「L」、「R」...などたくさんあるため、相手の単語は推測しづらい単語であることが分かると思います。

 

この記事では、このような推定されにくい単語を「強い単語」と定義し、実際に利用されている辞書を用いてランキングを作成します。以降ではTounguessで実際に利用されている以下の辞書をダウンロードして使用しています。 

kujirahand.com

この辞書から3文字の単語を抜き出し、特殊な文字を含む単語を削除(&、'、/など)、同じ文字を含む単語を削除しました。すべては確認していませんが、ほぼ同じものが作成できているはずです。総単語数は716文字でした。 

3. 単語の点数を計算する

単語の推定のしにくさを2文字が確定している場合、1文字が確定している場合を考えて点数化していきます。

① 2文字が確定している時の推定しにくさ

次に子音について、前向き、中央、後ろ向きで探索することを考えます。例えば「GAP」についてであれば、「GA?」の「?」は何通りか(前向き探索)、「?AP」の「?」は何通りか(後ろ向き探索)、「G?P」の「?」は何通りか(中央探索)というのをそれぞれ考えて、「GAP」に対して点数をつけていきます。

 

単純に和をとったランキングでは片方だけ大きいものが上位にきてしまうことがあります。例えば、前向きが10通りあっても、中央探索と後ろ向きが1通りだけであれば、後ろの2文字が確定した時点で単語が分かってしまうので非常に弱いです。そのような単語が上位にこないように、前向き、中央、後ろ向きの点数の積を利用します。 (やっていることは分母を無視して確率計算をするイメージです。)

② 1文字が確定している時の推定しにくさ

①と同様に計算します。「GAP」であれば「G??」、「?A?」、「??P」の「??」がそれぞれ何通りか、つまり単語が何個存在するかを考えます。こちらも①と同じように3つの数の積を点数とします。

③ 最終的な点数

上記の①②の点数を掛け合わせたものを、その単語の推定しにくさの最終的な点数とします。

 

上記の点数計算を716単語、全てに対して行います。簡単なコードを書いて計算しますが長くなるので詳細は割愛。 

4. データから見る「強い単語」ランキング:3文字ルール

ランキングにすると以下のようになります(ここでは長くなるので30位まで)。単語と点数を載せておきます。ここから見た方は戦闘力みたいなものだと思ってください。括弧内は上で計算した点数で、1位の「SAT」であれば、左から「SA?」、「S?T」、「?AT」、「S??」、「?A?」、「??T」の点数(何通り単語が存在しているか)を表しています。

順位: 単語 点数

1位:SAT 458662500点(10, 5, 15, 54, 151, 75)

2位:PAT 449489250点(9, 6, 15, 49, 151, 75)

3位:CAT 437598000点(14, 4, 15, 46, 151, 75)

4位:SAY 385276500点(10, 7, 15, 54, 151, 45)

5位:SOT 379080000点(12, 5, 13, 54, 120, 75)

6位:RAT 373725000点(11, 4, 15, 50, 151, 75)

7位:SAP 337086360点(10, 6, 13, 54, 151, 53)

8位:CAP 335005580点(14, 5, 13, 46, 151, 53)

9位:COT 301392000点(14, 4, 13, 46, 120, 75)

10位:RAM 292336000点(11, 8, 11, 50, 151, 40)

11位:POT 275184000点(8, 6, 13, 49, 120, 75)

12位:PAN 273289464点(9, 6, 12, 49, 151, 57)

13位:SOP 247276800点(12, 6, 10, 54, 120, 53)

14位:HAT 244620000点(8, 5, 15, 36, 151, 75)

15位:CAD 218215536点(14, 4, 11, 46, 151, 51)

16位:MAT 217440000点(10, 4, 15, 32, 151, 75)

17位:ROT 210600000点(9, 4, 13, 50, 120, 75)

18位:TAP 208078000点(10, 5, 13, 40, 151, 53)

19位:TAN 206568000点(10, 5, 12, 40, 151, 57)

20位:COP 204792000点(14, 5, 10, 46, 120, 53)

21位:BAT 202151250点(7, 5, 15, 34, 151, 75)

22位:CAN 199544688点(14, 3, 12, 46, 151, 57)

23位:CAY 196919100点(14, 3, 15, 46, 151, 45)

24位:GAT 195696000点(9, 4, 15, 32, 151, 75)

25位:LAG 180203400点(10, 6, 10, 39, 151, 51)

26位:SON 177292800点(12, 4, 10, 54, 120, 57)

27位:RAP 171664350点(11, 3, 13, 50, 151, 53)

28位:WAN 170418600点(11, 5, 12, 30, 151, 57)

29位:RAG 169422000点(11, 4, 10, 50, 151, 51)

30位:LAD 165186450点(10, 5, 11, 39, 151, 51)

以降のランキングはこちら

timtom-qqq.hatenablog.com

5. 母音の数と位置について

中央に母音がくるものがほとんどになったので、単語数で少し分析してみます。「A」「I」「U」「E」「O」の数と位置を考えます。

・母音の数

3文字の単語のうち、母音の数が1〜3であるものを数えてみると

母音3つ:2単語

母音2つ:48単語

母音1つ:569単語

・母音の位置

母音が1つ含まれる単語のうち、母音の位置ごとに数えてみると

最初:57単語

中央:466単語

最後: 46単語

このように母音が1つで中央にあるものの数が圧倒的に多いです。母音だけで入力してくる相手がいることも考えると、中央に1つというのが推定されにくいことが分かります。

6. おわりに

今回はTonguessの「強い単語」について書きました。実際の辞書から単語の点数を計算し、データからみた「強い単語」をランキングとしてまとめました。母音は推定されやすいことや、一般に使用されやすい単語かどうかなども考慮できると、より正確なランキングが作成できるかもしれません。そのうち4文字編もあげます。

 

ではまた!