英語母音ミニアプリ
F1-F2母音空間の可視化と、母音・二重母音の再生を試せるミニアプリ
母音の位置感覚を視覚的・聴覚的に確認できるミニアプリを作成し、ブログ内に追加しました。
学術的なデータや現代英語の音声を参考に設定していますが、ブラウザ上で動作する簡易的なアプリです。厳密な音声分析ツールではないので、発音の相対的な位置関係を目と耳で同時に確認したり、自分の声がどう判断されるかを気楽に楽しんだりしてみてください。
※ マイク入力による母音推定は、機能は残していますが実験段階で実用的な精度には達していません。詳しくは マイク入力について をご覧ください。
※ マイク入力による母音推定機能は、当面の間 一旦廃止 しています(精度が安定しないため)。チャート操作とお手本の再生のみご利用ください。
ミニアプリ
Vowel Space Explorer
チャートを触って母音の響き(F1/F2)を聞きながら、位置関係を確認できます。
アクセント(チャート・再生の基準):
アンダーシュート時は [ə] 方向への中央化・到達率の制限・フォルマント強調の弱化を適用します。
母音を鳴らす(英語(米)):
二重母音を鳴らす(英語(米)):
このアプリでできること
母音というのは、大きく分けて「2種類の音の響き」の組み合わせで成り立っています。このアプリの図(チャート)は、その2つの響きを縦軸と横軸にして、空間上に発音記号を配置したものです。
以下の機能があります。
- 図を触って音を鳴らす: 図の中をクリックしたり、押したままスライドしたりすると、その位置の音が滑らかに変化しながら連続して鳴ります。基音(声の高さ)の参考値はチャート右上に F0 として表示されます(既定 150Hz 前後)。
マイクで自分の声を見る: マイクをオンにして声を出すと、あなたの声が図のどのあたりに位置するのかを大まかに推定してリアルタイムで表示します。(実験機能)- お手本の音を聞く: 発音記号の書かれたボタンを押すとその音を聞くことができます。アクセント(米・英・豪・加・日本語・Classical GA)ごとに切り替え可能です。
- 他の言葉も確認する: 図にはデフォルトで現代アメリカ英語の母音が配置されていますが、設定を切り替えることで、イギリス英語・オーストラリア英語・カナダ英語・日本語・昔のアメリカ英語などの母音の位置も表示して見比べることができます。
おすすめの練習手順:
まずはボタンで基準音を聞いた後にその響きを真似し、マイク入力時に目標の記号に近づくように練習してみましょう。
ネイティブでも個人差があるので、記号の位置に完全に重ならなくても大丈夫です。
詳しく知りたい人向け:フォルマントと調音の関係
チャートの縦軸と横軸に設定されている「F1」「F2」は、音声の周波数特性であるフォルマント(Formants)を表しています。これらは、よく見るIPA(国際音声記号)の母音四辺形(Vowel Quadrilateral)とほぼ逆相関の形で対応しています。
縦軸(F1)と「口の開き」
- F1が低い(上) = 口の開きが狭い(閉母音: [i], [u] など)
- F1が高い(下) = 口の開きが広い(開母音: [a], [æ] など)
厳密には、F1は喉の奥(咽頭腔)の容積と関連しています。顎を下げて口を大きく開けると、結果として咽頭腔が狭まり、F1の周波数が上がります。
横軸(F2)と「舌の前後位置」
- F2が高い(左) = 舌が前にある(前舌母音: [i], [ɛ] など)
- F2が低い(右) = 舌が後ろにある(後舌母音: [u], [ɔ] など)
F2は口腔の前方(舌より前の空間)の容積と関連しており、舌を前に出すほどその空間が狭くなり、F2の周波数が高くなります。
補足:舌の高さという表現について
このような音声学の図表では、縦軸を「舌の高さ(High/Low)」と表現することがよくあります。[i] のような前舌母音を発音する際は、実際に舌が硬口蓋(上あご)に向かって持ち上がるため、この表現は直感と一致します。
けれど、[u] や [ɔ] などの後舌母音(Back vowels)を発音する際、舌を高く上げているという感覚はあまり得られないと思います。 後舌母音における調音は「舌の根元を、軟口蓋(奥)や咽頭壁(喉の壁)へ近づけて狭い部分(狭窄)を作る」ということなので、前舌母音のように「上に持ち上げる」というよりは、「奥へ引く」や「後ろの壁に近づける」というイメージを持った方が実際の感覚と近くなります。
おまけ:子音(半母音や L/R)とフォルマントの関係
このアプリでは母音のみを扱っていますが、実は一部の子音もフォルマントでその響きを説明することができます。摩擦音(sやfなど)はノイズ音ですが、声帯の震えを伴って滑らかに流れる子音は母音に近い性質を持っているためです。
-
半母音(YとW)
- Y(/j/)の音: 母音の [i] に非常に近く、F2が極端に高い状態から始まります。
- W(/w/)の音: 母音の [u] に非常に近く、F1とF2が共に低い状態から始まります。
- 母音との違い: [i] や [u] はその場に「留まる」音ですが、半母音はそこから次の母音へ向かって「素早く滑り落ちる(グライドする)」という時間的な動きの速さが最大の特徴です。
-
日本人が苦手な L と R
LとR(流音)もフォルマントで形作られます。どちらもF1とF2の数値はある程度似た動きをします。
この2つを区別する大きな違いは、「第3フォルマント(F3)」です。(残念ながら本アプリでは解析していません)- R(/r/): 舌の根元を強く引き舌先を浮かせることにより、F3が急降下します。このF3の急降下がRのこもった響きです。
- L(/l/): 舌先を上の歯茎につけるため、F3は下がらず、高いまま維持されます。
日本人はどうしても「らりるれろ」で判断したり弾き音の有無で区別しようとしてしまいがちですが、F3の響きを手がかりに区別できるようになると、リスニングも発音も良くなると思います。
マイク入力について
現状のマイク入力機能は、UI上は残していますが「正しく母音を判定できる機能」としてはまだ未完成です。
実装上、リアルタイムにマイクの音からフォルマント(F1/F2)を推定していますが、実運用では精度と安定性に課題があります。
そのため当面は、「図を触って母音の響きを聞く」「基準の母音や二重母音の音を確認する」 という用途での利用となります。
2026年6月時点で、マイク入力による母音推定機能は 一旦廃止 しました。チャート操作とお手本の再生のみをご利用ください。
課題メモ
- 話者差(男性/女性/子ども、個人差)により、同じ母音でも絶対的な周波数(Hz)が大きく変わる
- マイク特性や周囲ノイズ、発話の仕方で推定が揺れやすい
- リアルタイム推定では、子音・息・瞬間的な音変化の影響を受けやすい
- 二重母音のように時間的に動く発音は、安定表示と追従性の両立が難しい
改善案メモ
- 個人キャリブレーション、WebAssembly(実績のあるアルゴリズム)の導入を検討
- 区間推定を用いると安定性は高くなるはずだが、リアルタイム表示の目的と反するのでトレードオフ
最後に
音声学は素人なので調査しながらの作成で不正確な部分もあるかと思いますが、少しでも参考になれば幸いです。