自律分散システム

分散配置された要素をネットワークなどで結合したシステム.ただし,新規結合や結合の切断があっても定常性を失わない性質が要求される.簡単にいえば,「一人でも生きられる」ことを自律と呼ぶ.これは,「一人で生きる」ことである独立とは異なる.このような自律性を持った要素を結合したり,切断することで拡張性や柔軟性を持たせることを特色としている.新幹線やJRの電車などの運行制御などに使われている.

音楽自動採譜

楽譜が演奏されて音楽が聴こえるのが順方向とすれば,逆方向に,音楽を聴いて楽譜を作成することを採譜と呼ぶ.これを機械に行わせる問題が「音楽自動採譜」である.

その用途は,音から楽譜を得るということばかりでない.その中間生成情報を編集することで,いろいろに音楽を扱う大きな可能性が生まれる.この関係を簡単化して図に示すと次のようになる.

(楽譜形式) 演奏者の演奏,
自動演奏など
(MIDI形式など) 楽器発音,
MIDIシーケンサ
(音響信号)

楽譜情報

各音符の音名と長さが表現された情報

演奏情報

各音符の時刻や強さなどをどのように演奏するか

音楽信号

信号波形として聴き手に聴こえる演奏から音響信号

採譜 楽音解析
作曲,編曲,楽曲解析,打ち込み   記録,修正,伝送,カラオケ,着メロ   聴く,録音する,CD,MD,テープ,etc.

「楽音解析」は,演奏された音楽信号から各音符の情報を復元する技術である.人間なら,多重に重なった楽器音や声を聴いて,何の和音が鳴っているか,どんな旋律進行が同時に起こっているか,(多少訓練されていれば)できる. しかし,信号処理の観点では多重信号の解析は容易ではなく,いまだ完全に解決されてはいない問題である. これができれば,音楽を聴いてそのMIDIファイルを作り出せることになる.MIDIファイルは簡単にいじれるので,楽器の音色を変えたり,演奏を少し好みに合わせたりできることになる.また,カラオケの作成支援にも役立ちそうである.

楽音解析によって,MIDIのような音符情報にまで変換できていれば,これから楽譜の形式にするのが,狭い意味の「自動採譜」の部分である.(両者を併せて自動採譜と言うことも多い). 一見易しそうに思われるかも知れないが,これは人間のリズムの認知の問題に拘わる結構難しい問題である.(市販の音楽ソフトにはMIDIキーボードで弾いた音楽を楽譜化する「クォンタイズ」という機能がついていることが多いが,殆んど使い物にならないことを経験した人は多いだろう.) 人間の演奏の中で音符の長さは,規定通りの長さでなく,確率的にも芸術的にも変動するが,それを聴いて違和感無く楽譜の意図するままに聴き手に伝わるのは,人間の認知・認識能力に根ざしていると考えられる.各音符の音長を最も近い音符の長さに量子化しても,決して正しい楽譜は得られない.

以上の音楽の自動採譜は,音声認識と同様に,知的な信号処理として興味深い要素を豊富に含み,いかにも計数工学科らしい問題であり,我々の研究はその最先端を進んでいる.

音声認識

音声認識は,人間と機械が対話する夢の技術と呼ばれて来た。いまや技術は進歩し,少なくとも外国語については,平均的人間より認識能力が高くなった。特に,大語彙連続音声認識は,適切な文法を与えれば,どんな内容の音声でも認識できる技術であり,下の図のように,音声分析,音響モデル,言語モデル,探索過程の4つの部分から成り立っている。まず,入力音声は音声分析により認識に有効な本質的な特徴が抽出される。音響モデルは,あらかじめ大量の学習データから各音素の特徴を隠れマルコフモデル(HMM)により学習しておき,入力音声の各部分が何の音素に近いかを確率値として算出する音響モデルである。言語モデルは,音素列としての単語を規定する語彙,単語列を規定する文法あるいは言語統計などにより,許される発声内容を規定するモデルである。探索過程は,言語モデルで規定された探索空間の中で,入力音声をもっともよく説明できるような音響モデルの列を捜し出す。以上の構成要素により,与えられた文法の中で,もっとも入力された音声特徴時系列に合致する音素列を選び出し,認識結果として出力し,応用システムでヒューマンインタフェースとして使われる.

 

音響モデル

隠れマルコフモデル(HMM)で音素をモデル化し,入力音声の各部分が何の音素かの確率を計算する

 



音声分析

音声中から認識に有効な特徴量を取り出す

探索過程

入力音声にもっともよく合致する音響モデルの列を,言語モデルの拘束下で捜し出す

応用システム

認識結果をヒューマンインタフェースとして利用する

   

言語モデル

発声される内容の可能性を,文法や言語統計などにより規定する

逆問題

MEG計測信号から脳内の活動源を推定する問題は典型的な不良設定問題である.従来,ダイポールモデル法,L2ノルム最小化法等が提唱されそれなりの成果を上げてきたが,まだまだ不十分である.計測4研では,L1ノルムの発展形,ICA, Wavelet,ダイポールの解析解を得る方法等,数理的手法と生理的知見を融合した信頼性が高く高精度な手法の開発を目指している.また,脳活動の可視化手法の開発も行なっている.

ブレイン-マシンインタフェース(BMI)

脳をはじめとした生体の神経系と外部機器との間の直接的な情報入出力を実現するための技術・概念のこと.例えば,感覚野に適切な情報を入力することによって,視覚,聴覚,触覚などの人工感覚を生成することができ,また逆に,運動野などの情報を利用して,自分の手のように自在に動かすことのできる義手の実現も夢ではない. BMIの実現のためには大きく分けて二つの課題がある.それは,いかにして神経系と人工機器とを接続するかというデバイス面での課題と,神経系の信号をいかに解釈し,どのような形で入出力するかというコーディング・デコーディング面での課題である.

遠隔手術システム

医師が遠隔地の患者を手術するためのロボット手術システムの総称.無医村や船舶,戦場,宇宙空間などにおける利用が期待されている.要素技術としては,センサ類を含んだロボット技術やVR技術などが挙げられるが,人間を対象とするため,当然ながら一般の遠隔ロボット制御システムに比べて,はるかに高度の安全性が求められる.このため,現在,特に触圧感覚や温度感覚の提示機能の実現に対して大きな期待が寄せられている.

人工臓器

疾患や事故,加齢などにより失われたりあるいは衰えてしまった臓器や生体器官の機能を補助,代行するために利用される装置であり,狭義には所謂内臓を補助・代行する人工心臓,人工肺,人工腎臓等を指すが,より広く人工血液や,人工内耳,人工視覚システム,さらには義肢をも含めることがある.バイオマテリアル技術や各種電子機械技術の発展を背景に,近年,様々な人工臓器が開発され,一部は臨床応用にまで進んでいるが,最近では,再生医療技術との融合や棲み分け,人工臓器自体の制御方法の研究が注目を集めている.制御に関しては,生体本来の臓器と同様に,液性系,神経系の情報を利用することにより,生体自身に制御を委ねる方法が期待を集めている.

神経電極

神経系を伝わる情報は神経細胞の活動電位(神経信号)によって表現されている.神経細胞の近傍,あるいは内部に電極を置くことにより,この神経信号を計測することができる.また逆に神経細胞を刺激して,神経信号を発生させることもできる.このような電極を神経電極と呼ぶ.神経電極は,微細加工技術の発展を背景として近年著しい技術的進歩を遂げており,様々なタイプの新しい神経電極の開発が進んでいる.特に,神経電極の形状的可能性を広げる,アスペクト比の高い三次元微細加工技術が進歩してきたことが技術的に重要な役割を果たしている.

人工感覚

各種の物理・化学的刺激は,感覚受容器において神経信号に変換され,末梢神経や脳神経を通じて感覚野へと伝達され,さらに連合野などで処理,統合されて,視覚,聴覚,触覚等の感覚が生じる.この一連の感覚路の途中で適切な感覚情報を入力することによって,人工的な感覚を生成することができる.聴神経系を電気的に刺激することによる人工内耳はすでに臨床に応用されており,網膜や視覚野を刺激することによる人工視覚や人工触覚に関する研究も近年注目を集めている.

視機能計測

人間は視覚動物と言われ,人間が使う感覚情報は圧倒的に視覚情報が多い.そのように人間にとって最も大切な視覚情報を人間の眼はどのようにして獲得しているかを調べることが視機能計測である.計測4研では,視線方向,焦点調節,瞳孔反応を同時に計測可能な3次元オプトメータ(TDO:Three Dimensional Optometer)を開発し,それを用いて計測することにより,人間の眼球制御システムが如何に構築されているかを解明する研究とともに,視線方向,調節・瞳孔反応と認知との関係の解明を行っている.