コミュ障だから明日が僕らをよんだって返事もろくにしなかった

何かを創る人に憧れたからブログをはじめたんだと思うよ

ドットインストールやってみたよ 音声認識回

ドットインストールやった

はい。おはようございます。僕です。今日もネタもないのにブログ更新していきます。書くことなければ書かなければいいのにね。でも、クセになってんだ理由もないのにブログ更新するの(笑)。

なんかやった

そうしたわけでドットインストールにある「音声認識サービス」をつくろう講座とかやってみました。利用しているサービスは参考にある「Web Speech API」つかってます。使い方は以下のような感じです。

// APIの利用
var recognition = new webkitSpeechRecognition();

// 設定
recognition.lang = 'en-US';

// 認識
speech.onresult = (e) => {
  console.log(e);
  speech.stop();
};

最小限の構成はこんな感じでnewで呼び出して、設定かいて、実装かいてみたいな感じです。細かいAPIの仕様は参考リンクみていじって(丸投げ)。



んで講座終えるとこんなの作れます。ボタン押して色名言うと背景が変更されます。現状利用できるブラウザはChoromeに限定されてるっぽい(未検証)ので動かなかったらChorome使って確認してね。そして色名リスト並べたけど、9割くらい自分では変更できなかった……。もうマジムリ……。空白行は無視して認識するように加工してるから発音がめっちゃ良ければ認識するはず。一応認識精度のパラメータもあったりはするんですけど、なんか僕がやってもボロボロすぎてアメリカ語で調整と言う方向は若干諦めてます。日本語音声の方は正確な気がするから「日本語=>英語」に変換するようにすればいける気がしますがリスト項目多すぎてそういう変換諦めた。


参考 ドットインストール
JavaScriptで音声認識サービスを作ろう

参考 公式
Web Speech API - Web API | MDN
Web Speech API - Web APIs | MDN

参考 W3C
Web Speech API Specification
6章あたりにサンプルついてます。