

Apple デバイスのアクセシビリティ機能に関する自身の体験を頻繁にシェアしている四肢麻痺の Apple ユーザー、コリン・ヒューズ氏は、Apple が貴重な新しい Mac 音声コントロール機能をひっそりと追加したと報告しています。
リリースノートには記載されていませんが、macOS Monterey 12.3 で追加されたようです…
名前の通り、音声コントロールは、マウスやトラックパッドではなく、音声コマンドでMacを操作できるように設計されています。さらに、テキスト入力はキーボード入力ではなく、音声入力で行うことができます。どちらの機能も、腕が不自由な方にとって非常に重要です。
Appleデバイスにおける音声コントロールとディクテーションの大きな利点は、オフラインでも動作することです。しかし、Macを買い替える際には、これまでカスタムコマンドや語彙を移行する方法がなかったため、問題が発生していました。今回、この機能が追加されました。
macOS 12.3 では、音声コントロールを開くとすぐに表示される新しいドロップダウン メニューから、Mac のアクセシビリティの語彙とカスタム コマンドをインポートまたはエクスポートできるようになりました。
音声コントロールや音声入力した内容はすべてクラウドではなくデバイス上に保存されるため、これらの新機能は、時間をかけて構築したカスタム語彙やコマンドを新しい Mac に転送する際に役立ちます。
音声コントロールが3年前に導入されて以来、そして最近では2021年8月にこの機能を求めてきました。これは待望の改善です。
ヒューズ氏は、音声コントロールは素晴らしいアプリケーションであり、この技術がすべてのMac、iPad、iPhoneに無料でバンドルされているのは同社の大きな功績だと述べ、この最新の開発を歓迎している。
しかし、音声コントロールとディクテーションに関する長年の課題は依然として解決が必要だと彼は述べています。彼は14もの問題点を挙げています。
文字化けした文法
音声コントロールは、多くの文法を必ずしも考慮してくれません。例えば、「will」という単語を音声入力すると、男性の名前の「Will」が誤って大文字になってしまうことがよくあります。これは煩わしく、生産性も低いです。断続的に発生しますが、特に音声入力を一時停止すると発生します。他の単語でも発生するため、音声入力の誤りを何度も修正しなければならず、作業が遅くなります。
誤引用
「open quotes」というコマンドを音声入力すると、音声入力した最後の単語の後にスペースが自動的に入力されないため、音声入力されたテキストは「the quick brown fox" jumped over the fence."」のように表示されます。これは、引用符が音声入力した最後の単語に強く突き出ている誤った書式設定であり、戻って編集し、音声入力した最後の単語 (fox) と jumped の直前の引用符の後にスペースを挿入する必要があります。これは、音声入力時には自動的に行われるべきです。他の音声認識アプリでは行われます。「open quotes」と言う前に「スペースキー」と言ってスペースを挿入することはできますが、これは身体に障害のある人の中には持っていない可能性のある余分な息継ぎとエネルギーであり、必要ではありません。
誤射絵文字
絵文字の音声入力でも似たような状況です。音声入力した最後の単語の後にスペースが入力されていないため、音声入力したテキストは「素早い茶色のキツネがフェンスを飛び越えた👍」のように表示されます。
macOSのメールアプリで音声入力する際、最後に音声入力した単語(フェンス)と絵文字の後にスペースが入力されません。見た目が不自然で、戻って手動でスペースを入力する必要があります。本来は自動的に入力されるはずです。非常に非生産的です。AppleはWWDC 2019のステージ上で、絵文字の音声入力の様子を映像で紹介して喝采を浴びましたが、実際には正しく実装されていません。
WhatsAppでは動作しません
macOSで同社のApp StoreからダウンロードしたWhatsAppアプリのテキストボックスでは、音声コントロールによる音声入力が機能しません。Appleはなぜ、毎日数十億人が利用する人気のメッセージングアプリが音声コントロールによる音声入力に対応していないなど、基本的なアクセシビリティ要件を満たしていないアプリをApp Storeで許可しているのでしょうか?WhatsAppアプリがまだRosetteアプリであることと関係があるかもしれませんが、それでも音声コントロールが対応していないのは残念です。
こういったことはApp Storeの最低要件であるべきです。アクセシビリティは、今や悪名高いAppleのApp Storeポリシーに含まれているのでしょうか?もしそうでないなら、障がい者のアクセスと、社会生活、教育、そして仕事における人生の機会は無視できないほど重要なので、そろそろ取り入れるべき時です。
また、MacでAppleのウェブブラウザSafariのWhatsApp Webテキストボックスにテキストを音声入力すると、ウェブページがフリーズすることがあり、Safariを終了して再起動しないと問題が解決しないことがあります。音声入力していたテキストがすべて失われるため、非常に不便です。音声入力を一時停止したり、テキストを何度も修正したりすると、この問題が発生することがよくあります。1月にこのバグについてAppleに報告したところ、Appleは再現を確認しましたが、macOS 12.3では修正されませんでした。
一部のブラウザでは動作しますが、他のブラウザでは動作しません
音声コントロールの音声入力は、Mac版Firefoxなどのサードパーティ製ブラウザでは機能しません。なぜでしょうか?音声コントロールのユーザーは、WhatsApp Webを含むMac版Firefoxブラウザのテキストボックスに音声入力できないからです。これはFirefoxの問題かもしれませんが、Appleはこの不都合な状況に多大な影響力を発揮できるはずです。Mac版Google Chromeブラウザでも状況はそれほど良くありません。このアクセス不足によって、障害のあるユーザーは大きな打撃を受けています。
一部のテキスト ボックスでは機能しますが、他のテキスト ボックスでは機能しません
頻繁なディクテーションエラーはさておき、音声コントロールはメッセージ、メール、PagesといったApple純正アプリケーションでは問題なく動作しますが、サードパーティ製アプリケーションのテキストボックスが音声認識アプリでより一般的に動作するかどうかは運次第です。アクセシビリティへの配慮を謳うFacebook、Twitter、WhatsAppなど、世界最大級のプラットフォームの中には、音声認識アプリがアクセスできないテキストボックスを備えているものもあります。
非常に知名度の高いプラットフォーム上で、多数のテキストボックスに音声入力できないことは、レストラン、店舗、公共施設が車椅子利用者のためのスロープの提供を拒否するのと同じような、デジタル版です。これは容認できない行為であり、今日では多くの国で違法となっています。
音声認識アプリはプラットフォームを責め、プラットフォームは音声認識アプリを責めますが、アクセスを拒否され、その結果沈黙させられるのは障害のあるユーザーです。
引き継ぐ
「delete that」コマンドは「delete character」コマンドを重複して実行します。「delete that」コマンドで単語全体を削除できるのは一度だけです。一度単語全体を削除した後、「delete that」をもう一度発声すると、音声コントロールは最後に発声した単語の最後の文字のみを削除します。
これはユーザーにとって役に立ちません。2、3語程度の認識エラーであればよくあることですが、なぜ「delete that」と2、3回言って単語全体を削除できないのでしょうか?単語の最後の文字だけを削除しても、ユーザーにとって何の役にも立ちません。「delete that」とコマンドを言うたびに単語全体を複数回削除できる機能の方がはるかに便利です。フレーズ全体を削除することもできますが、「delete that」の方が簡単な場合もあり、これもユーザーの労力を節約できます。ユーザーが必要としているのは、「delete that」を複数回使用できる機能だけです。
外国人の名前を認識しない
音声コントロールは外国人の名前を認識しないことがよくあります。この問題を回避するために、アプリに連絡先の発音をカスタマイズする機能があれば素晴らしいと思います。GoogleはAndroidスマートフォンでこの機能を提供しています。MacとiPhoneの音声コントロールにも同様の機能が適用されるはずです。
困ったことに、名前は既にOSの連絡先アプリに登録されているのに、音声入力では認識されないのです。この解決策を使えば、この問題を回避できるはずです。私の連絡先には、ポーランド語のWojtekとウェールズ語のMorlaisという名前が登録されていますが、語彙にカスタム単語として追加しても、音声入力時に音声コントロールで認識されません。
音声コントロールはスマートではない
もっと広い意味で言えば、Windowsパソコン向けのDragon音声認識アプリは、同じディクテーションの失敗が繰り返し発生しないように単語を学習させる機能を提供しています。この機能は、音声コントロールのディクテーション機能を強化し、生産性を高め、使い勝手を向上させるでしょう。音声コントロールは、使い込むほどに改善され、間違いから学習するアプリケーションであるべきですが、現状はそうではありません。同じディクテーションの失敗を何度も繰り返すのは非常に面倒です。非常に粗雑で、Appleらしくないと私は思います。
ダークモードの非互換性
カスタム コマンド - テキストの貼り付け - では、テキスト ボックスはシステムのダーク モードをサポートしていないため、ダーク モードがオンの場合はこのボックスでテキストを構成することはできません。
フォーマットミス
カスタムコマンドのテキスト貼り付けボックスでは、テキストに使用されているフォントと文字サイズが反映されないことがあります。例えば、Helvetica でテキストを貼り付けると、Microsoft Outlook for Mac では機能しません。また、Apple Mail のデフォルトフォントで貼り付けたいテキストとは異なるサイズで貼り付けられることもあります。
名前に関する問題
人名や会社名を大文字で語彙に追加しても、音声入力では大文字が認識されません。例えば、「SpeechWare」という会社のマイクを持っています。カスタム語彙に正しい形式で入力したにもかかわらず、音声コントロールの音声入力では「speechWare」と認識されてしまいます。
メールアプリの「Delete That」に関する問題
Macのメールアプリでも同じです。メールアプリで音声入力を始めるたびに、最初の数語に間違いがあって「それを削除」と言うと、カーソルが急に飛び出して署名が壊れ、すべてがごちゃごちゃになってしまいます。1語だけ音声入力した場合は起こりませんが、数語音声入力してから「それを削除」と言うと、メール本文の署名が壊れてしまいます。
テキストの貼り付けに関する問題
カスタムコマンドと「テキストをペースト」オプションを使用する場合、Safariの多くのテキストボックス(FacebookやWhatsApp Webを含む)では機能しません。そのため、音声コントロールで作成したカスタムコマンドを使用してテキストボックスにテキストを自動的にペーストすることはできません。
ニッチな問題かもしれないが、重要な問題だ
ヒューズ氏は、これらは Apple ユーザーのごく一部にしか影響しないニッチな問題のように見えるかもしれないと認めているが、アクセシビリティ機能に依存している人にとっては大きな問題であると言う。
障がいのある人たちは、可愛い絵文字を添えた短い「お誕生日おめでとう❤️」というiMessageを音声入力する以上のものを求めています。大学で長文のエッセイを書いたり、就職活動でキャリアアップしたり、ビジネスを経営したり、ライターとして長文のブログ記事を音声入力したり、ソーシャルメディアで友人に長文の投稿をしたりしたいと願っています。しかし、残念ながら、音声コントロールの音声入力では、これらのニーズに応えられないのです。
さらに、Apple 社は、障害者にとっての使いやすさがすべての人にとっての使いやすさにつながると頻繁に述べており、ヒューズ氏もこの見解に同意している。
また、失読症やRSI(脊髄損傷)の患者、医師、弁護士、測量士などの専門家の間では、Macの音声認識機能の改良と精度向上を求める声が強く上がっているとも言えます。障害のあるユーザーにとって使いやすいディクテーションを実現すれば、誰にとっても使いやすくなるはずです。
havebin.com を Google ニュース フィードに追加します。
FTC: 収益を生み出す自動アフィリエイトリンクを使用しています。詳細はこちら。