Biography


Masumi Shirakawa

CTO at hapicom Inc. (Jan. 2016 - Present)
Guest associate professor of Hara Laboratory, Department of Multimedia Engineering, Graduate School of Information Science and Technology, Osaka University. (Apr. 2017 - Present)

Research assistant professor of Hara Laboratory (former Nishio Laboratory), Department of Multimedia Engineering, Graduate School of Information Science and Technology, Osaka University. (Apr. 2013 - Mar. 2017)

Ph.D. (information science) at Nishio Laboratory, Department of Multimedia Engineering, Graduate School of Information Science and Technology, Osaka University. (Mar. 2013)

Intern at Microsoft Research Asia (MSRA) (Apr. - Sep., 2011, mentor: Haixun Wang).

Research Fellow of Japan Society of the Promotion of Science (DC2) (Apr., 2012 - Mar. 2013).

Research topics: text analysis, Wikipedia mining and knowledge base.

×

Publication etc.

Journal

  • Masumi Shirakawa, Takahiro Hara and Shojiro Nishio: IDF for Word N-grams, ACM Transactions on Information Systems (TOIS), Vol. 36, Issue 1, Article 5 (June 2017). [Paper] [DEMO System] [Code and Processed Data]
  • Masumi Shirakawa, Kotaro Nakayama, Takahiro Hara and Shojiro Nishio: Wikipedia-based Semantic Similarity Measurements for Noisy Short Texts Using Extended Naive Bayes, IEEE Transactions on Emerging Topics in Computing (TETC), Vol. 3, Issue 2, pp. 205-219 (June 2015).
  • Takuya Sugitani, Masumi Shirakawa, Takahiro Hara and Shojiro Nishio: A Method for Detecting Local Events Using the Spatiotemporal Locality of Microblog Posts, International Journal of Web Information Systems, Vol. 11, Issue 1, pp. 2-16 (May 2015).
  • 中村達哉, 白川真澄, 原 隆浩, 西尾章治郎: Wikipediaの記事を素性としたベクトルの生成による短文間の言語非依存な関連度計算, 日本データベース学会論文誌, Vol. 12, No. 2, pp. 7-12 (2013年10月).
  • 白川真澄, 中山浩太郎, 荒牧英治, 原 隆浩, 西尾章治郎: WikipediaとWordNetを利用した膨大なテキストコーパスからのクラス間関係抽出, 日本データベース学会論文誌, Vol. 12, No. 1, pp. 37-42 (2013年6月).
  • 白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: Wikipediaのカテゴリグラフ解析による語句の確率的分類とその応用, 情報処理学会論文誌データベース(TOD), Vol. 5, No. 3, pp. 51-63 (2012年9月).
  • 白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: Wikipediaとベイズ理論を用いた関連エンティティ推測と短文クラスタリングへの応用, 日本データベース学会論文誌, Vol. 11, No. 1, pp. 37-42 (2012年6月).
  • 白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: コンテキストを考慮した複数語からの関連エンティティ抽出手法, 日本データベース学会論文誌, Vol. 10, No. 1, pp. 55-60 (2011年6月).
  • 白川真澄, 中山浩太郎, 荒牧英治, 原 隆浩, 西尾章治郎: WikipediaとWebの情報を組み合わせたオントロジー構築の試み, 電子情報通信学会和文論文誌, Vol. J94-D, No. 3, pp. 525-539 (2011年3月).
  • 白川真澄, 中山浩太郎, 荒牧英治, 原 隆浩, 西尾章治郎: 格助詞付きWeb検索クエリを用いた関連のある概念間の関係抽出, 日本データベース学会論文誌, Vol. 9, No. 1, pp. 35-40 (2010年6月).
  • 中山浩太郎, 伊藤雅弘, Erdmann, Maike, 白川真澄, 道下智之, 原 隆浩, 西尾章治郎: Wikipediaマイニング: Wikipedia 研究のサーベイ, 情報処理学会論文誌: データベース, Vol. 2, No. 4(TOD 44), pp.49-60 (2009年12月).
  • 中山浩太郎, 伊藤雅弘, Erdmann, Maike, 白川真澄, 道下智之, 原 隆浩, 西尾章治郎: Wikipediaマイニング 近未来チャレンジキックオフ編, 人工知能学会論文誌, Vol. 24, No. 6, pp. 549-557 (2009年10月).

International conference

  • Masumi Shirakawa, Takahiro Hara and Takuya Maekawa: Never Abandon Minorities: Exhaustive Extraction of Bursty Phrases on Microblogs Using Set Cover Problem, Conference on Empirical Methods in Natural Language Processing (EMNLP 2017), pp. 2348-2357, Copenhagen, Denmark (Sept. 2017). [Paper] [Code]
  • Sohei Kojima, Akira Uchiyama, Masumi Shirakawa, Akihito Hiromori, Hirozumi Yamaguchi and Teruo Higashino: Crowd and Event Detection by Fusion of Camera Images and Micro Blogs, International Workshop on Crowd Assisted Sensing, Pervasive Systems and Communications (CASPer 2017) in conjunction with PerCom 2017, Kona, Big Island, Hawaii, USA (Mar. 2017).
  • Noriyuki Matsuoka, Masumi Shirakawa, Takahiro Hara and Shojiro Nishio: Representing Interests of Twitter Users Using Wikipedia and Decay Model, International Workshop on Information Search, Integration, and Personalization (ISIP 2016), Lyon, France (Nov. 2016).
  • Masumi Shirakawa, Takahiro Hara and Shojiro Nishio: N-gram IDF: A Global Term Weighting Scheme Based on Information Distance, International World Wide Web Conference (WWW 2015), pp. 960-970, Florence, Italy (May 2015). [Paper] [Slides] [DEMO System] [Code and Processed Data]
  • Masumi Shirakawa, Takahiro Hara and Shojiro Nishio: MLJ: Language-Independent Real-Time Search of Tweets Reported by Media Outlets and Journalists, International Conference on Very Large Data Bases (VLDB 2014), demo paper, pp. 1605-1608, Hangzhou, China (Sept. 2014). [Paper] [Web service]
  • Masumi Shirakawa, Kotaro Nakayama, Eiji Aramaki, Takahiro Hara and Shojiro Nishio: Collecting Conceptualized Relations from Terabytes of Web Texts for Understanding Unknown Terms, IEEE/WIC/ACM International Conference on Web Intelligence (WI 2014), pp. 86-93, Warsaw, Poland (Aug. 2014).
  • Tatsuya Nakamura, Masumi Shirakawa, Takahiro Hara and Shojiro Nishio: Semantic Similarity Measurements for Multi-lingual Short Texts Using Wikipedia, IEEE/WIC/ACM International Conference on Web Intelligence (WI 2014), pp. 22-29, Warsaw, Poland (Aug. 2014).
  • Masumi Shirakawa, Kotaro Nakayama, Takahiro Hara and Shojiro Nishio: Probabilistic Semantic Similarity Measurements for Noisy Short Texts Using Wikipedia Entities, 22nd ACM International Conference on Information and Knowledge Management (CIKM 2013), short paper, pp. 903-908, San Francisco, CA, USA (Oct./Nov. 2013). [Paper] [Slides]
  • Takuya Sugitani, Masumi Shirakawa, Takahiro Hara and Shojiro Nishio: Detecting Local Events by Analyzing Spatiotemporal Locality of Tweets, 6th International Symposium on Mining and Web (MAW 2013), pp. 191-196, Barcelona, Spain (Mar. 2013).
  • Masumi Shirakawa, Kotaro Nakayama, Takahiro Hara and Shojiro Nishio: Wikipedia Sets: Context-oriented Related Entity Acquisition from Multiple Words, IEEE/WIC/ACM International Conference on Web Intelligence (WI 2011), short paper, pp. 274-277, Lyon, France (Aug. 2011).
  • Masumi Shirakawa, Kotaro Nakayama, Eiji Aramaki, Takahiro Hara and Shojiro Nishio: Relation Extraction between Related Concepts by Combining Wikipedia and Web Information for Japanese Language, 6th Asia Information Retrieval Societies Conference (AIRS 2010), poster paper, pp. 310-319, Taipei, Taiwan (Dec. 2010).
  • Masumi Shirakawa, Kotaro Nakayama, Takahiro Hara and Shojiro Nishio: Concept Vector Extraction from Wikipedia Category Network, 3rd International Conference on Ubiquitous Information Management and Communication (ICUIMC 2009), pp. 71-79, Suwon, Korea (Jan. 2009).
  • Kotaro Nakayama, Minghua Pei, Maike Erdmann, Masahiro Ito, Masumi Shirakawa, Takahiro Hara and Shojiro Nishio: Wikipedia Mining - Wikipedia as a Corpus for Knowledge Extraction -, Annual Wikipedia Conference (Wikimania 2008), Alexandria, Egypt (July 2008).

Domestic conference

  • 阿部 隼, 白川真澄, 原 隆浩, 池田和史, 帆足啓一郎: ユーザのツイート履歴に含まれる単語の出現傾向を用いたライフイベント予測モデルの構築, 第8回ソーシャルコンピューティングシンポジウム (SoC 2017), 東京 (2017年6月).
  • 白川真澄, 原 隆浩: ウェーブレット木を用いたN-gram IDFの近似計算手法, 第8回データ工学と情報マネジメントに関するフォーラム (DEIM 2016), 福岡 (2016年2月/3月). [Code]
  • 松岡紀行, 中村達哉, 白川真澄, 原 隆浩, 西尾章治郎: Twitterユーザの関心の表現に適したデータ構造の検証, 第8回データ工学と情報マネジメントに関するフォーラム (DEIM 2016), 福岡 (2016年2月/3月).
  • 宮内天士, 白川真澄, 原 隆浩, 西尾章治郎: 高精度なツイート投稿位置の推定に有効なルールの抽出, 第8回データ工学と情報マネジメントに関するフォーラム (DEIM 2016), 福岡 (2016年2月/3月).
  • 中村達哉, 白川真澄, 原 隆浩, 西尾章治郎: Wikipediaのページビュー数を用いたTwitter上の話題語に対するエンティティリンキング, 第8回Webとデータベースに関するフォーラム (WebDB Forum 2015), 東京 (2015年11月).
  • 白川真澄, 原 隆浩, 西尾章治郎: コルモゴロフ複雑性に基づくIDFの単語N-gramへの適用, 第7回データ工学と情報マネジメントに関するフォーラム (DEIM 2015), 福島 (2015年3月). [Slides] [DEMO System] [Code and Processed Data]
  • 加藤 諒, 原 隆浩, 白川真澄, 駒井友香, 真嶋温佳, 天方大地, 大澤 純, 松尾和哉, 横山正浩, 佐崎 悠, 中村達哉, 水野聖也, 西尾章治郎: 位置プライバシ問題の啓蒙のためのダミーによる位置曖昧化手法の体験システムの実装, マルチメディア通信と分散処理ワークショップ (DPSWS 2014), 島根 (2014年12月).
  • 中村達哉, 白川真澄, 原 隆浩, 西尾章治郎: Wikipediaを用いたソーシャルメディアからの言語横断的な話題抽出システムの試作, 情報処理学会研究報告 データベースシステム研究会, 東京 (2014年11月).
  • 白川真澄, 原 隆浩, 西尾章治郎: 情報距離に基づく単語N-gramの大域的重み付け手法, NLP若手の会 (YANS) 第9回シンポジウム, 神奈川 (2014年9月). [DEMO System] [Code and Processed Data]
  • 松岡紀行, 白川真澄, 原 隆浩, 西尾章治郎: Wikipediaによる語彙拡張と指数減衰モデルを用いたTwitterユーザの動的な関心の抽出, 第5回ソーシャルコンピューティングシンポジウム (SoC 2014), 東京 (2014年6月).
  • 白川真澄, 原 隆浩, 西尾章治郎: Twitter上での多言語ジャーナリズムの実現に向けたシステムの試作, 第6回データ工学と情報マネジメントに関するフォーラム (DEIM 2014), 兵庫 (2014年3月).
  • 真嶋温佳, 白川真澄, 原 隆浩, 西尾章治郎: YAGOを用いた拡張固有表現抽出における新出語のクラス推定精度の検証, 第6回データ工学と情報マネジメントに関するフォーラム (DEIM 2014), 兵庫 (2014年3月).
  • 杉谷卓哉, 白川真澄, 原 隆浩, 西尾章治郎: 教師あり機械学習を用いたツイート投稿時のユーザ位置推定手法, 情報処理学会研究報告 データベースシステム研究会, Vol. 2013-DBS-158, 京都 (2013年11月).
  • 中村達哉, 白川真澄, 原 隆浩, 西尾章治郎: Wikipediaの記事を素性としたベクトルによる短文間の言語非依存な関連度計算手法, 第4回ソーシャルコンピューティングシンポジウム (SoC 2013), 東京 (2013年6月).
  • 白川真澄, 中山浩太郎, 荒牧英治, 原 隆浩, 西尾章治郎: WikipediaとWordNetを用いたテラバイト級Webコーパスからのクラス間関係抽出, 第5回データ工学と情報マネジメントに関するフォーラム (DEIM 2013), 福島 (2013年3月).
  • 白川真澄, 中山浩太郎, 荒牧英治, 原 隆浩, 西尾章治郎: WikipediaとFreebaseの知識を利用したテキストからの上位概念間の関係抽出, 第5回Webとデータベースに関するフォーラム (WebDB Forum 2012), 東京 (2012年11月).
  • 杉谷卓哉, 白川真澄, 原 隆浩, 西尾章治郎: 位置情報付きツイートの時空間的局所性の解析によるローカルイベント検出手法, 情報処理学会マルチメディア, 分散, 協調とモバイルシンポジウム (DICOMO 2012), 石川 (2012年7月).
  • 白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: ナイーブベイズによる文書分類のためのWikipediaカテゴリグラフ解析, 第26回人工知能学会全国大会, 山口 (2012年6月).
  • 白川真澄, Haixun Wang, Yangqiu Song, Zhongyuan Wang, 中山浩太郎, 原 隆浩, 西尾章治郎: ナイーブベイズの拡張による確率的概念辞書を用いた固有表現のクラス推定, 言語処理学会第18回年次大会 (NLP 2012), 広島 (2012年3月).
  • 白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: Wikipediaとナイーブベイズを用いた自然文に対する関連語句取得手法, 第4回データ工学と情報マネジメントに関するフォーラム (DEIM 2012), 兵庫 (2012年3月).
  • 白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: 複数語句から構成されるコンテキストを考慮した連想関係の抽出, 第3回データ工学と情報マネジメントに関するフォーラム (DEIM 2011), 静岡 (2011年2月/3月).
  • 白川真澄, 中山浩太郎, 荒牧英治, 原 隆浩, 西尾章治郎: 格フレームを考慮したWeb検索スニペット解析による動作関係抽出, 情報処理学会研究報告 データベースシステム研究会, Vol. 2010-DBS-151, No. 38, 東京 (2010年11月).
  • 白川真澄, 中山浩太郎, 荒牧英治, 原 隆浩, 西尾章治郎: Web検索を用いた関連のある概念間の関係抽出手法, 第2回データ工学と情報マネジメントに関するフォーラム (DEIM 2010), 兵庫 (2010年2月/3月).
  • 白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: Wikipediaのカテゴリ構造解析とクラスタリングによる概念ベクトルの生成, 第23回人工知能学会全国大会, 高松 (2009年6月).
  • 白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: Wikipediaのカテゴリ解析による概念のベクトル化手法の拡張と評価, 平成20年度情報処理学会関西支部支部大会講演論文集, pp. 117-120, 京都 (2008年10月).
  • 白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: Wikipediaのカテゴリネットワークを用いた概念のベクトル化手法, 情報処理学会研究報告 (データベースシステム/情報学基礎合同研究会 2008-DBS-145 2008-FI-91), Vol. 2008, No. 56, pp. 89-96, 小樽 (2008年6月).

Tech report

  • Masumi Shirakawa, Haixun Wang, Yangqiu Song, Zhongyuan wang, Kotaro Nakayama, Takahiro Hara and Shojiro Nishio: Entity Disambiguation based on a Probabilistic Taxonomy, Microsoft Research Tech Report, MSR-TR-2011-125 (Nov. 2011).

Award

  • 白川真澄: 日本データベース学会 上林奨励賞 (2017年3月).
  • 白川真澄: 大阪大学大学院情報科学研究科 嵩賞 (2015年10月).
  • 白川真澄: 情報処理学会 コンピュータサイエンス領域奨励賞 (2015年8月).
  • 白川真澄, 原 隆浩, 西尾章治郎: 第7回データ工学と情報マネジメントに関するフォーラム (DEIM 2015) 最優秀論文賞 (2015年3月).
  • 白川真澄: 第5回データ工学と情報マネジメントに関するフォーラム (DEIM 2013) 学生プレゼンテーション賞 (2013年3月).
  • 白川真澄, 中山浩太郎, 荒牧英治, 原 隆浩, 西尾章治郎: 第5回Webとデータベースに関するフォーラム (WebDB Forum 2012) チームラボ賞 (2012年11月).
  • 白川真澄, 中山浩太郎, 原 隆浩, 西尾章治郎: 第4回データ工学と情報マネジメントに関するフォーラム (DEIM 2012) 優秀論文賞 (2012年3月).
  • 白川真澄: 情報処理学会 山下記念研究賞 (2011年3月).
  • 白川真澄: 第3回データ工学と情報マネジメントに関するフォーラム (DEIM 2011) 学生奨励賞 (2011年2月/3月).
  • 白川真澄, 中山浩太郎, 荒牧英治, 原 隆浩, 西尾章治郎: 第2回データ工学と情報マネジメントに関するフォーラム (DEIM 2010) 最優秀論文賞 (2010年2月/3月).
  • 白川真澄: 第2回データ工学と情報マネジメントに関するフォーラム (DEIM 2010) 学生奨励賞 (2010年2月/3月).
  • 白川真澄: 第23回人工知能学会全国大会近未来チャレンジ「Wikipediaマイニング」 ベストプレゼンテーション賞 (2009年6月).
  • 白川真澄: 情報処理学会 jDB2008フォーラム データベースシステム/情報学基礎合同研究会 学生奨励賞 (2008年6月).

Research fund

  • 脳の仕組みに基づくWikipediaとWebを組み合わせた知識獲得に関する研究, 日本学術振興会科学研究費補助金 特別研究員奨励費, 900千円.
  • WikipediaとWebの情報を組み合わせた大規模オントロジ構築に関する研究, グローバルCOE 提案型研究企画支援, 平成22年度, 700千円.

Activity

  • Program Committee Member, 19th IEEE International Conference on Multimedia (ISM 2017).
  • Program Committee Member, 11th IEEE International Conference on Semantic Computing (ICSC 2017).
  • Publicity Co-Chair, 13th International Conference on Mobile and Ubiquitous Systems: Computing, Networking and Services (MobiQuitous 2016).
  • iDB特別セッション委員, 第9回Webとデータベースに関するフォーラム (WebDB Forum 2016).
  • Publicity Chair, 6th International Workshop with Mentors on Databases, Web and Information Management for Young Researchers (iDB Workshop 2014).
  • Publicity Co-Chair, The 33rd IEEE International Symposium on Reliable Distributed Systems (SRDS 2014).
  • 実行委員会委員(Web・出版担当),第6回データ工学と情報マネジメントに関するフォーラム (DEIM 2014).

×
×

Private

×

Contact


shirakawa[cat]hapicom.jp

Please replace [cat] by @. Feel free to send me an e-mail:D

×

Coming soon!


×