VoiceXML 2.0勧告案公開

アメニティ&サウンド 音と快適の空間へ vol.46
音響と技術 メールマガジン
DSPボード デジタル信号処理 image DSPボード ソフトウェア開発 image 高速DSP/信号処理 image オーディオ信号処理とデジタル信号処理 image 音響信号とデジタルストレージ image

音響技術とソフトウェア、ハードウェア開発

音響と開発 : Sound & Development
株式会社エーアールアイ / ARI
ARI CO.,LTD.
アメニティ&サウンド 音と快適の空間へ

VoiceXML 2.0勧告案公開

46

メールマガジン「アメニティ サウンド 音と快適の空間へ」は、現在、休刊中です。 バックナンバーのコラムの内、サウンドコラムと技術開発コラムは、 サウンド、技術開発コラム に再編集、一部加筆修正して掲載していますので併せてご利用ください。

■□■□■□■□□□□□□□□□□□□□□□□□□□□□□□□□□
■ アメニティ&サウンド 音と快適の空間へ【Vol.46】2004年2月5日
□    VoiceXML 2.0勧告案公開
□    http://www.ari-web.com/
□■□□□□□□□□□□□□ 株式会社エー・アール・アイ □■□■

□はじめての方へ、
このメールマガジンのご登録をいただきましてありがとうございます。
「アメニティ&サウンド 音と快適の空間へ」は、隔週(第1、第3木曜日)
にお届けしています。内容を充実できるようにがんばりますので、末永く
お付き合いいただけますようお願い申し上げます。

 ■□■□■ CONTENTS Vol.46 □□□□□□□□□□□□□□□■□

  1.技術と開発の閑話(11)
    新Pentium 4 Prescottリリース
  2.サウンド(44)
    VoiceXML 2.0勧告案公開
  3.3GPP音声通信(39)
    GSM音響規格 − 周囲雑音 側音測定
  4.「紙幣の偽造防止」技術(URLクリッピング)

□━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 ■1.技術と開発の閑話(11) Prescottリリース
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━□■□■

 Intelの新CPUコード名"Prescott"がリリースされました。報道サイト
 でも随所で記事が掲載されていましたので、ご存知の方も多いと思いま
 す。

  ▼米インテル、90nmプロセス採用のHTテクノロジ搭載
   Pentium 4-3.40EGHzなど6製品を発表
   ASCII24 ニュース/テクノロジー/デバイス 2004年2月3日
  http://ascii24.com/news/i/tech/article/2004/02/03/648038-000.html
  ▼インテル、新たに5種類のPentium 4をリリース
   CNET Japn 2004年2月2日
  http://japan.cnet.com/news/ent/story/0,2000047623,20064063,00.htm

 ■Intelの新Pentium 4 Prescott
 Intelの新CPUコード名"Prescott"がリリースされました。報道サイト
 各社でも多数ニュースに取り上げられています。Pentium 4として販売
 されますからPrescottなのか従来のPentium4なのかはパソコンのスペ
 ックなどでは解りにくいかもしれません(クロックの表記が異なります)。
 
 同一のクロック速度のPentium 4として2種類のCPUが共存するため、
 搭載されるCPUがどちらかということを重視される場合には注意が必要
 です。

 Prescottという新CPUで新しくなる主な部分は次の点です。

  ・改良されたNetBurst マイクロアーキテクチャ
  ・改良されたHTテクノロジの搭載
  ・SSE3として追加された13インストラクション
  ・L1/L2キャッシュの増量
  ・imulレイテンシの遅い命令の改良

 早速、Prescottのベンチマークについては……

  ▼Prescott、ベンチマークテストで落第
   CNET Japn 2004年2月3日
  http://japan.cnet.com/news/ent/story/0,2000047623,20064117,00.htm

  ▼MYCOM PC WEB 2004年2月4日
  「【特集】Prescottの実力を検証する」という詳細記事があります。
  http://pcweb.mycom.co.jp/

 CNETの記事は、海外のZDNetのベンチマークを紹介しているものです
 が、「概ね処理速度が遅く、また発熱量も多くなっている」,「Intel
 の新しいチップは通常、登場時には同一クロックスピードの前モデル
 より処理性能が低いからだ」などと厳しいものになっています。

 MYCOM PC WEBのベンチマークでは、コメントは穏やか目のコメント
 ですが、PCMark2002のテスト結果は、CPU Detailでは全てに完敗と
 いう状況で、他でも性能が劣っているケースが目立つようです(MPEG
 では成績が良いです)。

 確かにおなじみの新CPUが従来CPUより性能が出ないと見えるかもしれ
 ません(Pentium-Mの高成績は忘れられているかも)

 Prescottで性能を出すソフトウェアは、キャッシュの増量の恩恵の強
 いものと、パイプラインでのペナルティ発生の少ないもの(力仕事タイ
 プ)、そして、今後登場するSSE3対応やPrescottにオプティマイズさ
 れたコードを持つものということになりそうです。

 imul命令のレイテンシが改善されたとなっていてimul命令(整数乗算)
 はコンパイラでもそれなりに利用される命令でますから、この部分に
 ついてはわずかに性能向上するのでしょうが、平均的なレイテンシの
 性能が出ないようなのでマイナス分の方が大きいようです(レイテンシ
 の大きい命令の使用については、Intelのマニュアルでも、他の命令
 を代替しろと推奨してきましたので、使用頻度は低くなっているかも 
 しれません。imul命令は、登場時から早くなったり遅くなったりする
 命令の1つですね)

 パイプラインが、31段と大変に深くなっているので、その影響が強く
 出ているようで、先に発表されている今年中に4GHzのクロックを実現
 するためのものでしょうから、性能は、クロックの高速化によって賄
 うというPentium 4の性質をさらに推し進めたCPUともいえます
 (パイプラインの段数を増加するとクロック速度を向上させやすい)。

  ▼パイプライン【pipeline】
   e-Words IT用語辞典
  http://e-words.jp/w/E38391E382A4E38397E383A9E382A4E383B3.html

 現在PCのソフトウェアを開発する上でパフォーマンスのための最適化
 を図るとき、大きく分けてPentium 4と、Pentium III系のCeleron、
 Pentium-M,そしてAthrionを考慮する必要があります。

 各CPUでの最適なコードは異なるため、最適化が必要な場合には、悩ま
 しい問題となる場合があります(最適コードが、別のCPUではかえって
 性能が劣る場合があるので)。
 
 新Pentium 4 Prescottも傾向が異なるため、新たにPrescottのこと
 も考慮に入れる必要があるかもしれません。もっとも、同一クロック
 で性能が出ない分はクロック速度の向上でカバーする部分が発揮され
 るのだと思いますが……

 それでは、次回もよろしくお付き合いください。(^^)

  ▼ARIはアプリケーションソフトやデジタル機器の開発などを
   お手伝いしています。
  http://www.ari-web.com/develop/index.htm

□━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 ■2.サウンド(44) VoiceXML 2.0勧告案公開
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━□■□■
 このコラムは音や音響機器などについての話題をお届けしています。

 昨年 勧告候補公開されたVoiceXML2.0がW3C(World Wide Web Con-
 sortium)勧告案としてとして公開されました。

  ▼『VoiceXML』仕様がさらに前進
   Japn.internet.com Webテクノロジー 2004年2月4日
  http://japan.internet.com/webtech/20040204/11.html

 VoiceXMLは音声認識や音声合成、音声入出力、対話処理などをWEB
 で利用するためにXMLデータとして記述する標準仕様です。

  ▼XML(eXtensible Markup Language)
   e-Words IT用語辞典
  http://e-words.jp/w/XML.html

 VoiceXML(VXML)の応用範囲は広いのですが、データのフォーマット
 を標準化することで、音声合成や音声認識などの各社サービスや製品
 を利用するアプリケーションや機器で共通の方式が利用できるように
 なることがメリットです。

 VXMLを利用した製品やサービスは、IBMのWebSphere Voice Server
 などの音声対応製品などがありますが、VXMLの形式のテキストを、
 サーバーと送受信することでブラウザで音声合成したり、電話の音声
 をサーバーで認識して結果をVXML形式でのテキストを送信するという
 機能を提供する製品です。

 音声合成はともかく、音声認識には、言葉を認識するボキャブラリ用
 データベースが大量に必要となりますから、音声認識部分をサーバー
 で実現するという解決方法を採ることでデータ蓄積などできない携帯
 端末などでも、通信回線を通じて音声認識の結果を利用することがで
 きます。

 この送信データの形式にVXMLを利用することで、各社の製品に互換
 性を持たせることが容易になります。

 音声サーバー機能やデータベースを独自に開発していると高価になり
 専用のアプリケーションでしか利用できませんが、送信データの形式
 にVXMLを利用することで、各社の製品に互換性を持たせることが容易
 になり、市販製品としてのアプリケーションや製品が作りやすくなり
 ます。

 VoiceXML 2.0では、音声合成、ディジタルオーディオ、音声認識、
 携帯電話やプッシュホンのダイヤルトーン入力、音声の録音、通話、
 音声対話ダイアログの機能と多彩な内容になっています。

  ▼W3C(World Wide Web Consortium)
   2/4日現在NewsのトップにVXML2.0の公開が掲載されています。
  http://www.w3.org/

 VXML2.0のサーバーを廉価に利用できるサービスがあれば、携帯機器
 から音声を送り、送信されてきたXMLテキストに応じて表示し、音声
 合成による対話も行うというような機能が実現できます。

 現在は、企業のコールセンターの電話受付などで音声合成と音声認識
 エンジンが採用されていたり、WEBサイトのナビゲーションに利用
 (ボイス・ポータル)されている例などがありますが、携帯電話やカー
 ナビゲーション、家電製品などから音声によってWeb上のサービスを
 利用したり、音声で操作できるようにする場合などでの利用方法が
 期待されています。

 日本や米国では、自動車に搭載されるカーナビや電話などの車載機器
 は、安全運転のために、走行中はハンズフリー環境であることが求め
 られます(道交法の改定以来、走行中の携帯電話による通話もハンズ
 フリーであることが必要となっています)。

 現在は、リモコン操作のための認識に利用されていますが、ヘッド
 セットや、音声の入出力装置を備えているため、情報端末として高度
 な音声対話機能を提供できる可能性も持っていますが、端末の処理能
 力を超えるような場合であっても、VXMLによってWEBサーバーを介
 することで、高度な処理を簡易に実現できる可能性があります。

 カーナビなどの場合には、情報端末としてのディスプレイや処理能力
 をある程度備えていますが、工場や現場などでのハンズフリーの音声
 応答システムには応用用途が期待されます。

 これらの応用時にVXML形式を採用することで複数のシステムを利用
 したサービスや機能を実現できます。SF映画などでの音声命令が実現
 するというわけではありませんが、VoiceXML 2.0の勧告案公開は、
 高度な音声対話処理をより身近なもの一歩近づけたかもしれません。

 それでは、次回もよろしくお付き合いください。(^^)

 前回までの内容はバックナンバーをご覧ください。
  ▼バックナンバー目次
  http://www.ari-web.com/mm/bn/index.htm

□━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 ■3.3GPP音声通信(39)
  GSM音響規格 − 周囲雑音 側音測定
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━□■□■
 2003年度11月の移動電話国内出荷実績が(社)電子情報技術産業協
 会JEITAの統計情報で発表されました。移動電話国内出荷数量は前
 年度比111.6%と13ヶ月連続のプラスと依然好調となっています。

 携帯・自動車電話は10月に比べ下降していますが、4,158千台、前
 年比112.4%と14ヶ月連続でプラスとなっっています。公衆PHSは
 この8ヶ月連続のプラスだったのですが、11月期は、2001年度から
 の統計記録中最低の出荷総数と落ち込んでいます。

  ▼統計資料-2003年度移動電話国内出荷実績に掲載されています。
   (社)電子情報技術産業協会 JEITA
  http://www.jeita.or.jp

 カメラ付携帯電話と第三世代機への買替需要が携帯・自動車電話
 の好調要因との見解となっています(携帯電話の主力販売モデルは
 カメラ付や3Gでしょうから携帯の需要が伸びたということですね)。

 統計データの変動を見るには、前年度比は判りやすいのですが、
 2001年から2002年度にかけて連続落ち込みの時期になっています
 から、全体の動向という視点で見る場合には総数を前々年度などと
 比較して見ないと判りにくい市況となっているかもしれません。

 □……………………………………………………………………………
  ■13.Listener sidetone (周囲雑音 側音特性)
 ………………………………………………………………………□■□
 前回は送話方向側音測定でした。今回は周囲雑音側音測定です。

  ▼前回までの内容はバックナンバーをご覧ください。
  http://www.ari-web.com/mm/

 携帯端末は通常、さまざまな雑音環境下で使用されます。周囲雑音
 側音測定はその名の通り、携帯端末に周囲から入力される雑音の側
 音のレベルを評価するための測定です。

 前回お話した送話方向側音特性は端末に入力される話者の声(直接
 音)の側音レベルを評価しましたが、周囲雑音側音特性では端末に
 入力された雑音(拡散音)がどの程度側音として受話器から出力さ
 れているかを評価します。

 側音は、話者が端末で話す時のモニターの役割を果たしているので
 端末に入力される話者の声と周囲の雑音が同等のレベルで側音とし
 て聞こえるとモニター音の聞き取り易さに著しく影響します。

 この様なことから、モニター音の明瞭度を確保するため周囲雑音の
 側音レベルは送話方向側音レベルと比較して、どの程度あるか評価
 する必要があります。

  ▼3GPP側音測定については以前にご紹介しました。
  http://www.ari-web.com/mm/bn/20021219.htm

 測定にはLRGP(テストヘッド)を使用します。試験信号には周囲雑
 音を想定したピンクノイズを使用して行います。
 雑音出力用のスピーカを測定環境の任意の位置に設置し、出力レベ
 ルはMRP点で24dB(Pa)得られる様に調整します。

 周囲雑音側音特性は、人工口の口元にセットしたマイクロホン(MR
 P点)で測定した周波数分布をリファレンス値とし、端末の受話器
 より出力される音声を人工耳にセットしたマイクロホン(ERP点)
 で測定した周波数分布との比により求めます。

 人工耳に使用するカプラーはGSM規格では基本的にType1(密閉型)
 を使用、ターミナルの供給者が要求する場合はType3.2(ローリー
 ク型)を使用と規定されています。
 実際には周囲雑音の影響と漏洩のないType1(密閉型)を使用する
 のがより正確な側音レベルが測定できるので望ましいです。
 また、送話方向側音特性との比較を行うために測定は同一環境で行
 う必要があります。

  ▼(参考)3GPP側音測定接続例
  http://www.ari-web.com/mobile/3g/mta01-wb/intro_04.htm#connect05

 計算により求めた側音レベルは、端末別に以下の範囲内で規格値が
 規定されています。
 
 ・Handset   15dB以上
 ・Headset   15dB以上
 ・Handsfree  要求外

 側音の明瞭度を確保するために送話方向側音測定(直接音)と周囲
 雑音側音測定(拡散音)で測定された側音レベルの差は2dB以上が
 推奨されています。
 周囲雑音側音測定は3GPPには無い、GSM特有の測定です。3GPPでは
 周囲雑音に対する性能を評価する測定としてANR(騒音除去性能)
 測定があります。

 次回は側音歪 第3次高調波含有率についてお届します。

  ▼ARIは3GPP,GSM,PDC音響測定に対応した「3G携帯通信開発用
  音響測定システム MTA-01WB-S」を開発・販売しています。
  http://www.ari-web.com/mobile/3g/mta01-wbs/info-3gpp.htm

  ▼GSM端末音響システム 製品概要(MTA-01WB-S)
  http://www.ari-web.com/mobile/3g/mta01-wbs/info-gsm.htm

□━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 ■4.「紙幣の偽造防止」技術(URLクリッピング)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━□■□■
 WEB参照可能な掲載記事などから毎日伝えられるニュースや記事から
 気になる情報や、翌日には埋もれてしまいそうな記事をピックアップ
 してご紹介しています(このメールマガジンの発行周期が隔週という
 こともあって新しい記事ばかりではありません)。

 ■アドビの「紙幣の偽造防止」技術の続き
 【Vol.45】 2004年1月15日のこのコラムで米アドビシステムズ社が
 銀行などの要請でPhotoshop CSに組み込んでいる紙幣偽造防止技術
 に関するニュースをご紹介しました。

  ▼アドビ、自社ソフトに「紙幣の偽造防止」技術をひそかに追加
   Hot Wired 2004年1月11日
  http://www.hotwired.co.jp/news/news/culture/story/20040113204.html

 ユーザーなどに問題にされている技術は、それほど偽造防止効果が高
 いものではないという内容の続報がありました。
 
  ▼アドビの「紙幣の偽造防止」技術、簡単に破れることが判明
   Hot Wired 2004年1月14日
  http://www.hotwired.co.jp/news/news/technology/story/20040115303.html

 先のニュースのように、同社の製品ユーザーの中には、紙幣の画像を
 含んだ広告などを製作している方も含まれているため、製品で紙幣イ
 メージを扱えないようにする技術が問題にされていたように、アドビ
 社が、完全に「紙幣画像らしきもの」を排除することはできないため
 「簡単に破れる」というのは少し酷な表現かなとも思います。

 技術の詳細は、防止の性質上公開されてはいませんが、記事の回避方
 法を見ると、画像を入力するあたりに組み込まれているようです。

 通貨偽造の目的であれば、最終的に紙幣にそっくりに印刷する必要が
 ありますから、入力段ではなくプリンタや出力段に、サイズまで含め
 て本物に近いものを出力する場合を抑止する方が確実性が高いように
 思いますし、紙幣画像を広告などで利用しているユーザーにも不利益
 を生じさせないで済みそうです。

 入力側で防止しようとしているのは、デジタルデータにした後、第三
 国で印刷するなどの犯罪を考慮してのことでしょうか。

 ■新エネルギー導入戦略を考える懇話会
 技術コラムでインテルの新CPU Prescottを話題に取り上げていますが、
 コラム中では触れていませんが、発熱と消費電力は、かなりのことに
 なっている模様です(詳細は、先のリンク先などを参照してください)。

 という折、「新エネルギー導入戦略を考える懇話会」というものが、
 滋賀県で開催されたそうです。これは滋賀県での話ですが……

  ▼「新エネルギーを考える 滋賀県で懇話会開催」
   Yahoo!ニュース/滋賀ニュース 2004年2月4日
  http://headlines.yahoo.co.jp/hl?a=20040204-00000090-kyt-l25

 グリッド・コンピューティングにPrescottのような消費電力型パワー
 CPUが組み合わされると総消費電力も大変なことになるかもしれません。

  ▼環境省、ヒートアイランド対策で来年度中に技術実証
   Yahoo!ニュース/産業ニュース 2004年2月4日
 http://headlines.yahoo.co.jp/hl?a=20040204-00000021-nkn-ind

 という記事もありますが、CPUの低消費電力と熱低下でもがんばって
 ほしいですね。

□━━━━━━━━━━━━━━━━━━━━━━━━━━━━□■□■
 ■編集後記
 前回もお伝えしましたが、Pubzineでの配信は今回が最後となります。
 Pubzine以外のサービスは利用したくないとお考えの方がいらっしゃ
 いましたら、残念ながら今回が最後ということになってしまうかもし
 れません。今までご登録いただきましてありがとうございました。

 ご登録いただいたメールアドレス等は、全て破棄され、他社に移管な
 どはされませんのでご安心ください。

 もし、他のサービスでも受信しても良いとお考えでしたら、他社の無
 料配信サービスをご検討ください。詳しくは、それぞれの利用規約を
 ご覧ください。

 いままで無料で配信サービスを利用させていただきました Pubzine
 には感謝いたします。

 それでは、次回、2004年2月19日Vol.47もよろしくお願いします。
                        ARI A&S 編集部

【配信】…………………………………………………………………□■□
 このメールマガジンは、次のメール配信サービスによって発行
  されています。

 Melma! : http://www.melma.com/
 まぐまぐ: http://www.mag2.com/
 Macky!: http://macky.nifty.com/
 めろんぱん: http://www.melonpan.net
 メルマガ天国:http://melten.com/
 E-Magazine: http://www.emaga.com/
 カプライト: http://kapu.biglobe.ne.jp/

  ■■ Pubzineは今回でサービスが終了します。 ■■

【配信中止】……………………………………………………………□■□
  配信中止をご希望の方がいらっしゃいましたら、お手数ですが、
  登録いただいた各配信先で解除いただきますようお願い申し上げ
  ます。(みなさまにご登録いただいたメールアドレスは弊社では
  記録、収集しておりません)。

 Melma! http://www.melma.com/mag/96/m00058796/index_bn.html
 Pubzine http://www.pubzine.com/detail.asp?id=17084
 まぐまぐ http://www.mag2.com/m/0000086886.htm
 Macky! http://macky.nifty.com/cgi-bin/bndisp.cgi?M-ID=poparimm
 めろんぱん http://www.melonpan.net/melonpa/mag-detail.php?mag_id=002937
 メルマガ天国 http://melten.com/m/10326.html
 E-Magazine http://www.emaga.com/info/arimm.html
 カプライト http://cgi.kapu.biglobe.ne.jp/m/5842.html

【ご意見・ご感想】……………………………………………………□■□
  このメールマガジンが対象としているような技術や音響などの
  内容についてご意見、ご感想、投稿など歓迎いたしますので、
  なんでもお気軽にお寄せください。

  ▼ご意見、ご感想送信はこちらのE-Mailアドレスへお願いします。
  mailto:[email protected]

□■□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□
□ 発行/編集 株式会社エー・アール・アイ
□       Amenity Research Institute Co.,Ltd.
□ 〒192-0081 東京都八王子市横山町6-9 丸多屋ビル8F
□ TEL :0426-56-2771  FAX :0426-56-2654
□ URL : http://www.ari-web.com/
■ お問合せ : mailto:[email protected]
■ Copyright(C) 2004. ARI.CO.,LTD. All Rights Reserved.
□■□□□□□□□□□□□□□□□□□□□□□□□□■□■□■□■
3GPP対応 携帯電話開発用音響測定システム
TS 26.131/ 26.132 V5.0に準拠、ITU-T P.50とP501の試験信号、Windows Vista、Windows XP 3GPP対応 携帯電話開発用オーディオアナライザー MTA-02WB-S

≪ vol.46 VoiceXML 2.0勧告案公開 ≫

株式会社エーアールアイ/ARI CO.,LTD.
東京都八王子市横山町6丁目9番 丸多屋ビル8F
tel:042-656-2771 fax:042-656-2654

ARIはアナログ、デジタル音響機器の ハードウェア開発ソフトウェア開発、 製品、受託開発を行なっています。試作、研究開発や特注機器などのソフト、ハード、システムの設計から製造までご相談いただけます。

エーアールアイ会社情報
製品情報と販売
音響と開発・サービス
音響機器メーカーと代理店

ご利用案内 | 免責事項 | ARI アメニティ&サウンド | 株式会社エーアールアイ | 東京都八王子市横山町6丁目9番 丸多屋ビル8F

Copyright(c) 2001-2024 ARI Co.,Ltd. all rights reserved.