Publications
Papers
-
「条件付確率場とベイズ階層言語モデルの統合による半教師あり形態素解析」.
持橋大地, 鈴木潤, 藤野昭典.
言語処理学会第17回年次大会(NLP2011), B5-2, 2011.
[slides]
- "Gibbs Sampling Based Multi-scale Mixture Model for Speaker Clustering".
Shinji Watanabe, Daichi Mochihashi, Takaaki Hori, Atsushi Nakamura.
ICASSP 2011, pp.4524-4527, 2011.
- "Statistical Modeling of F0 Dynamics in Singing Voices Based on
Gaussian Processes with Multiple Oscillation Bases".
Yasunori Ohishi, Hirokazu Kameoka, Daichi Mochihashi, Hidehisa Nagano,
and Kunio Kashino. INTERSPEECH 2010, pp. 2598-2601, 2010.
- 「複数振動基底に基づく歌声のF0動特性の統計的モデリング」.
大石康智, 亀岡弘和, 持橋大地, 永野秀尚, 柏野邦夫.
日本音響学会2010年秋季研究発表会, 3-P-31.
- "Learning Common Grammar from Multilingual Corpus".
Tomoharu Iwata, Daichi Mochihashi and Hiroshi Sawada.
ACL 2010, pp.184-188, 2010. (short paper)
[PDF]
- 「マルチカーネル線形予測モデルによる音声分析」.
亀岡弘和, 大石康智, 持橋大地, ルルー・ジョナトン.
音響学会2010年春季研究発表会講演論文集 2-Q-24, 2010.
[PDF]
[Poster]
- "Conditional Simultaneous Draws from Hierarchical Chinese Restaurant
Processes",
Takaki Makino, Shunsuke Takei, Daichi Mochihashi, Issei Sato,
Toshihisa Takagi. NPBayes 2009 Workshop at NIPS 2009.
-
"Bayesian Unsupervised Word Segmentation with Nested Pitman-Yor
Language Modeling".
Daichi Mochihashi, Takeshi Yamada, Naonori Ueda.
ACL-IJCNLP 2009, pp.100-108, 2009.
[slides]
-
「ベイズ階層言語モデルによる教師なし形態素解析」.
持橋大地, 山田武士, 上田修功.
情報処理学会研究報告 2009-NL-190, 2009.
[slides]
-
"On the Properties of von Neumann Kernels for Link Analysis".
Masashi Shimbo, Takahiko Ito, Daichi Mochihashi, Yuji Matsumoto.
Machine Learning, 75:37-67, 2009.
- "The Infinite Markov Model".
Daichi Mochihashi and Eiichiro Sumita.
NIPS 2007 (oral&poster).
[slides]
[Spotlight]
[Poster]
-
「階層Pitman-Yor過程に基づく可変長n-gram言語モデル」
持橋大地, 隅田英一郎. 情報処理学会論文誌 Vol.48, No.12, pp.4023-4032,
2007.
-
「Pitman-Yor過程に基づく可変長n-gram言語モデル」
持橋大地, 隅田英一郎. 情報処理学会研究報告 2007-NL-178, pp.63-70, 2007.
[slides]
- 「コミュニティを考慮したカーネル引用解析」
伊藤敬彦, 新保仁, 持橋大地, 松本裕治.
電子情報通信学会論文誌 D Vol.J90-D, No.2, pp.233-244, 2007.
- "Exploring Multiple Communities with Kernel-Based Link Analysis",
Takahiko Ito, Masashi Shimbo, Daichi Mochihashi and Yuji Matsumoto.
in Proc. of ECML/PKDD 2006, pp.246-253, 2006.
-
「自然言語処理におけるベイズ統計」
持橋大地. 電気情報通信学会 ニューロコンピューティング研究会 (招待講演).
NC2006-49, pp.25-30, 2006.
[slides]
- 「無限混合ディリクレ文書モデル」
持橋大地, 菊井玄一郎. 情報処理学会研究報告 2006-NL-172, pp.47-53, 2006.
[PDF]
- 「Gibbs Sampling による確率的テキスト分割と複数観測への拡張」
持橋大地, 菊井玄一郎.
NLP-2006
(言語処理学会第12回年次大会)
発表論文集, pp.212-215, 2006.
[PDF]
[slides]
- "Context as Filtering".
Daichi Mochihashi and Yuji Matsumoto.
NIPS 2005 (Neural Information Processing Systems 18)
pp. 907-914, 2006.
[Poster]
-
「Particle Filter による文脈の動的ベイズ推定」
持橋大地, 松本裕治. 情報処理学会研究報告 2005-NL-165, pp.59-66, 2005.
[slides]
-
「言語表現のベクトル空間モデルにおける最適な計量距離」
[PDF]
持橋大地, 菊井玄一郎, 北研二.
電子情報通信学会論文誌 Vol. J88-D-II No.4, pp.747-756, 2005.
-
"Learning Nonstructural Distance Metric by Minimum Cluster Distortions"
Daichi Mochihashi, Genichiro Kikui, and Kenji Kita.
EMNLP 2004 (Proceedings of Empirical Methods in Natural Language
Processing 2004), pp.341-348, 2004.
[slides]
Invited Talks and Tutorials
- 2011/10/3: IBM東京基礎研究所, "Nonparametric Bayesian Methods in
Language Modeling".
- 2011/01/19: 統計数理研究所
第2回Statistical Machine Learning Seminar.
"Unsupervised and Semi-supervised learning of Nonparametric Bayesian
word segmentation".
- 2010/06/26: 計測制御学会 第46回自律分散システム部会研究会講演,
「ベイズ教師なし形態素解析とその周辺」.
- 2009/11/27: 産業技術総合研究所
メディアインタラクション研究グループ,
「ノンパラメトリックベイズ法による言語モデル」.
- 2009/09/08: 2009年度統計関連学会連合大会 企画セッション "Bayes統計モデル
のための計算技法とその応用"講演,
「ノンパラメトリックベイズ法による教師なし形態素解析」.
- 2008/10/29: IBIS 2008, 企画セッション「ノンパラメトリックベイズ」.
"Nonparametric Bayes for Non-Bayesians".
(オープニング)
- 2008/5/23: The Hong Kong University of Science and Technology,
"Nonparametric Bayesian Methods in Language Modeling".
- 2008/2/13: University of Tokyo, Tokyo Forum on Advanced NLP and TM
(T-FaNT2),
"Present and Future of Text Modeling".
- 2008/1/28: University of British Columbia,
LCI Forum,
"Infinite Markov Models and Related Topics / Unknown Targets and Patterns of Dynamics".
- 2007/08/21: 統計数理研究所, Workshop on Bayesian Inference,
"The Infinite Markov Model: A Nonparametric Bayesian approach".
- 2006/10/11: 電気情報通信学会 ニューロコンピューティング研究会 招待講演,
「自然言語処理におけるベイズ統計」
- 2006/03/13: 言語処理学会第12回年次大会チュートリアル,
「Topicに基づく統計的言語モデルの最前線 ―PLSIからHDPまで―」
山本幹雄, 持橋大地.
- 2005/09/20: Google 東京研究開発センター, "Context Modeling and Adaptive
Statistical Language Modeling".
Books and Magazines
-
「統計的自然言語処理と機械学習・統計学の未来」.
人工知能学会誌 2012年5月号 (Vol.27 No.3) pp.284-287, 2012.
-
「最近のベイズ理論の進展と応用(III) ―ノンパラメトリックベイズ―」.
電子情報通信学会誌 2010年1月号 (Vol.93 No.1) pp.73-79, 2010.
-
「言語処理学事典」, 言語処理学会編, pp.118-137, 2009.
2.1中項目「言語モデル」編集, 2.1.6節執筆.
-
「パターン認識と機械学習:ベイズ理論による統計的予測」(上)(下)
(Pattern Recognition and Machine Learning).
Christopher M. Bishop著,
元田浩, 栗田多喜夫, 樋口知之, 松本裕治, 村田昇 (編),
赤穂昭太郎, 神嶌敏弘, 杉山将, 小野田崇, 池田和司, 鹿島久嗣, 賀沢秀人,
中島伸一, 竹内純一, 持橋大地, 小山聡, 井手剛, 篠田浩一, 山川宏 (訳).
Springer 2007, 2008.
10章「近似推論法」の翻訳を担当.
-
「生きた言葉をモデル化する ― 自然言語処理と数学の接点」.
月刊『数学セミナー』2007年11月号pp.37-43,
特集 "統計科学のすすめ [その2]".
Notes
Selected Slides
- 「統計的自然言語処理におけるMCMC法」
統計数理研究所 MCMC2009研究会, 2010-2-21, 2010.
- "Introduction and Advances in Gaussian
Processes".
SVM 2009 (NAIST cl-lab Summer Camp), 2009.
- "Contrastive Divergence Learning,
Product Models, and Deep Belief Nets"
SVM 2008 (NAIST cl-lab Summer Camp), 2008.
- 「GaP, NMF, and more」
NAIST DMLA 勉強会資料, 2006-5-19, 2006.
-
"Introduction to Hierarchical Pitman-Yor Processes"
"Ultraconservative" SVM 2006 (NAIST cl-lab Summer Camp), 2006.
-
「Topicに基づく統計的言語モデルの最前線 ―PLSIからHDPまで―」
山本幹雄, 持橋大地.
言語処理学会第12回年次大会チュートリアル資料 pp.11-28, 2006.
- 「自然言語処理のための変分ベイズ法」
ATR SLC internal seminar, 2005.
- 「言語モデル」
NAIST cl-lab Doctor Lecture series, 2004.
-
"Latent Dirichlet kernel & Bayesian kernels"
ÜberSVM2004 (Machine Learning summer camp of cl-lab OB/OG's), 2004.
-
"Bayesian Replacement for Good-Turing" (Introduction to MacKay (1994)
"Hierarchical Dirichlet Language Model")
ÜberSVM2004 (Machine Learning summer camp of cl-lab OB/OG's), 2004.
Softwares
- lwlm-0.1
The Latent Words Language Model (Deschacht and Moens, EMNLP 2009),
full Bayesian package.
- lda-0.1
A Latent Dirichlet Allocation package in MATLAB and C.
- dm-0.2
A Dirichlet Mixtures toolkit in C.
- bsets-0.1
"Bayesian Sets" (Ghahramani and Heller, 2005) algorithm in MATLAB.
- matlab-hash-0.2.tar.gz
A hashtable implementation in MATLAB.
- matlab-text-0.1.tar.gz
Text handling utilities in MATLAB, to use with matlab-hash.
- math++.el
Provides an "inferior Mathematica" mode, similarly as cmuscheme.el.
daichi<at>cslab.kecl.ntt.co.jp
Last modified: Wed May 16 21:45:19 2012