小山 翔一

教員紹介

小山 翔一(こやま しょういち)
小山 翔一

東京大学大学院 情報理工学系研究科
システム情報学専攻
講師

〒113-8656 東京都文京区本郷7-3-1 工学部6号館 242号室
Tel: 03-5841-6904
Fax: 03-5841-6904

E-mail:shoichi_koyama

[ホームページ]

略歴

2007年3月 東京大学 工学部 計数工学科 卒業
2009年3月 東京大学 大学院情報理工学系研究科 システム情報学専攻 修士課程 修了
2009年4月–2014年3月 日本電信電話株式会社 NTTサイバースペース研究所(現・メディアインテリジェンス研究所) 研究員
2014年1月 東京大学 博士(情報理工学)取得
2014年4月–2018年3月 東京大学 大学院情報理工学系研究科 システム情報学専攻 助教
2016年4月–2018年3月 Université Paris Diderot/Institut Langevin 客員研究員(日本学術振興会 海外特別研究員)
2018年4月– 東京大学 大学院情報理工学系研究科 システム情報学専攻 講師

研究テーマ

1. 音場を対象とした逆問題:
音空間の可視化や解析、音源位置や室内音響パラメータの推定など、音場計測における種々の逆問題に対し、最適化や機械学習など様々なアプローチから新たな方法論を探求し、システムとしての構築を行う。
2. 音場の記録・伝送・再生のための信号処理
音場の記録、伝送、再生に関わる諸問題を基本原理から応用まで広く扱い、遠隔コミュニケーションやバーチャルリアリティなどを目的とした新しいシステムを、これらの方法論に基づいて実現する。

主な論文・著書

S. Koyama, K. Furuya, Y. Haneda, and H. Saruwatari, “Source-location-informed sound field recording and reproduction,” IEEE journal of selected topics in signal processing, vol. 9, no. 5, pp. 881-894, 2015.
S. Koyama, K. Furuya, Y. Hiwasaki, and Y. Haneda, “Analytical approach to wave field reconstruction filtering in spatio-temporal frequency domain,” IEEE transactions on audio, speech, and language processing, vol. 21, no. 4, pp. 685-696, 2013.

統計的音声合成・声質変換に関する研究

◆実験内容:
 統計的音声合成・声質変換は、任意のテキスト情報から目的とする声色をもった人工音声を生成する技術である。しかし、本技術は統計的な逆問題を解くことに対応するため、最終出力である任意発話音声の品質を向上させるのは非常に困難であることが知られている。本研究では、音声生成制約等の確率的解釈・導入により、その品質向上を目指す。

非負値独立成分分析に基づく非負値行列因子分解の初期化

◆実験内容:
 非負値行列因子分解は大規模データや音響スペクトログラム分解・分析に有効な手法であるが、一般にその分解における反復最適化は初期値依存性が高いことが知られている。そこで近年、この初期化を非負値独立成分分析によって与える手法が提案されている。しかし独立成分分析はデータのスパース性と相互情報量の両方を同時に制御するため、そのどちらが初期化に効果があるのか解明されていない。そこでスパースな非負値行列生成を行う確率モデル等を用いて上記と比較検討し、有効な初期化は何かについて検討を行う。

識別的基底変形学習に基づく半教師有り楽器音分離

◆実験内容:
 混合音楽信号から精度よく目的楽器音を抽出するため、スペクトル頻出パタン分解(非負値行列因子分解)による手法が提案されている。本手法は事前教師基底を使用するため、未知系を通過した音の分解能力が著しく劣化するという問題がある。そこで、識別的学習論に基づく基底変形を導入し、未知系への適応を行う最適な基底変形法は何かを検討する。

ディジタル信号処理と音響システム

◆実験内容:
 本実験の課題は,ディジタルフィルタの係数と特性の関係を考え,それに基づいて実時間ディジタルフィルタを設計し,その特性を実測により確認することである。さらに実際の信号処理に応用してみることにより,ディジタル信号処理の一端を体験する。
(関連講義:信号処理論第一, 信号処理論第二)
◆助手から学生へのアドバイス:
 時間領域と周波数領域における信号表現の対応関係を良く理解しておく(フーリエ級数展開,フーリエ変換, サンプリング定理, 窓関数).

センサの基礎

◆実験内容:
計測工学とは,長さ・重さといった単一の物理量をはじめとし,環境や人間行動といった複雑なものまでをも含む「自然現象」から必要な情報を抽出する技術体系のことである。そのフロントエンドであるセンサの基本は信号変換であるが,現在の電気文明下では情報を電気信号に変換するのが便利である。その上で,電子回路技術や近年では計算機情報処理により抽出されることが多い。本実験では,市販されている主なセンサ素子について,その原理と使用法,センサシステムの構成法などを考察する。具体的には,光・磁気・温度・力・ガス濃度など種々の物理量を検出するセンサ素子を用い,実際に検出回路を作成して特性を調べることにより,センサ素子の使用法およびセンサ回路の構成法を学ぶ.
(関連講義:半導体概論, 計測通論C,回路学第一, センサ・アクチュエータ工学)
◆助手から学生へのアドバイス:
 センサ素子において物理量が電気信号に変換される仕組みを物理現象のレベルで把握する.センサ出力(電圧, 電流, 電荷,周波数等)を適切に処理するための検出回路の動作や性質を理解しておく.

システム1-猿渡

教員紹介

猿渡 洋(さるわたり ひろし)
猿渡 洋

東京大学大学院 情報理工学系研究科
システム情報学専攻
教授

〒113-8656 東京都文京区本郷7-3-1 工学部6号館 244号室
Tel: 03-5841-8706
Fax: 03-5841-6904

E-mail:hiroshi_saruwatari@ipc.i.u-tokyo.ac.jp

[ホームページ]

略歴

1993年 名古屋大学大学院工学研究科電気系専攻博士前期課程修了
1993年 セコム株式会社IS研究所研究員
2000年 名古屋大学大学院工学研究科電子情報学専攻博士後期課程修了,工学博士
2000年 奈良先端科学技術大学院大学情報科学研究科・助教授
2007年 奈良先端科学技術大学院大学情報科学研究科・准教授
2014年 東京大学大学院情報理工学系研究科教授

研究テーマ

 主に音メディアに関する現象の理解・情報処理・制御を目指し、波動場を意識した新たな信号処理の創出及びそれを応用した情報処理システムの構築に関して研究を行う。具体的には、以下に示す統計数理・機械学習論的信号処理の研究を通じて、人間の音情報処理能力の拡張や新しい芸術創出への工学的貢献を目指す。

1. 音響信号処理に基づくコミュニケーション拡張:
統計的アプローチを駆使し、事前教師情報を必要としない柔軟なブラインド信号処理系を実現する。また、それを応用したヒューマンインターフェイスやユニバーサルコミュニケーション支援システムの構築を行う。
2. 音楽信号処理・音拡張現実感:
多様な音メディアに対し機械学習論的な手法を適用し、時空間頻出パタンに基づく信号解析など、高品質な音楽情報処理系を実現する。また、本処理と波面合成理論に基づく立体音再現を融合し、音拡張現実感システムを構築する。
3. 非線形信号処理系の数理解析と感性定量化:
音声・音響信号処理に用いられる非線形信号処理系の高次統計量解析を通じて、人間にとって「聴覚的に」意味のある統計的推定方法は何かを追求し、新しい信号処理系の枠組みを構築する。

主な論文・著書

R. Miyazaki, H. Saruwatari, et al., “Musical-noise-free speech enhancement based on optimized iterative spectral subtraction,” IEEE Trans. on Audio, Speech and Language Processing, vol.20, no.7, pp.2080-2094, 2012.
H. Saruwatari, et al., “Musical noise controllable algorithm of channelwise spectral subtraction and adaptive beamforming based on higher-order statistics,” IEEE Trans. on Audio, Speech and Language Processing, vol.19, no.6, pp.1457-1466, 2011.
H. Saruwatari, et al., “Blind source separation based on a fast-convergence algorithm combining ICA and beamforming,” IEEE Trans. on Speech and Audio Processing, vol.14, no.2, pp.666-678, 2006.

音メディア情報学研究室

音メディア情報学研究室
– 信号処理:複雑な物理現象からの宝探し –
研究室のHomePage→
猿渡 洋
猿渡 洋

教授
小山 翔一
小山 翔一

講師
教師無し最適化理論に基づく音コミュニケーション拡張
統計的信号処理理論やスパース・低ランクモデリング理論を駆使し、柔軟なブラインド信号処理系及びユニバーサルコミュニケーション支援システムの構築を行う。
非線形信号処理系の数理解析と感性定量化
非線形信号処理系の低次-高次統計量空間に存在する聴覚印象の不動点に基づき、人間にとって聴覚的に意味のある統計的信号推定方法は何かを追求する。
ユーザオリエンテッドな音楽情報処理
多様な多次元音楽メディアに対し機械学習論的な手法を適用し、時空間頻出パタンに基づく高品質かつユーザオリエンテッドな音楽情報処理系を構築する。
音場を対象とした逆問題
音空間の可視化や解析、音源位置や室内音響パラメータの推定など、音場計測における種々の逆問題に対し、最適化や機械学習など様々なアプローチから新たな方法論を探求し、システムとしての構築を行う。
音場の記録・伝送・再生のための信号処理
音場の記録、伝送、再生に関わる諸問題を基本原理から応用まで広く扱い、遠隔コミュニケーションやバーチャルリアリティなどを目的とした新しいシステムを、これらの方法論に基づいて実現する。
音声合成変換によるコミュニケーション拡張
深層学習を含む機械学習論的な手法を適用し、音声を人工的に合成・加工することで、ヒト・人工知能間の音声コニュニケーションを拡張する。