同志社大学  大学院文化情報学研究科   文化情報学専攻



Text Mining 2018

テキストマイニング(text mining)とは、文字・記号列や言語データを対象とし、自然言語処理、データ科学(統計学、機械学習、情報科学)などの技法を用いて、大量のデータから特定のパターンや使用傾向、情報・知識を見つけ出す分野です。近年様々な領域で研究が進められています。そこで、テキストマイニング研究・応用の促進のため、テキストマイニングに関連する研究の取り組み、及びその成果の報告、テキストマイニングの講習を目的とし、本セミナーを企画しました。 セミナーの初日は、テキストマイニングに関わる研究の構想、及びその研究事例の発表を行い、翌日は研究事例の発表と初心者を対象としたテキストマイニングの講習を行います。
発表をご希望の方は 5月21日(月)9:00時までにお申し込みください。

日    時:2018年6月9日(土)~10日(日)
場    所: 同志社大学文化情報学部夢告館101、102室 京都府京田辺市多々羅都谷1-3
アクセス情報:このリンク
資    格:なし
会    費:無料
登 録  先:Google
お問い合せ先:sonnkou1985アットgmail.com
食事  情報:日曜日は生協食堂はほとんどが休みです。関連情報はこのリンクをご覧ください。
駐 車  場:関連情報
 
共    催:

プログラム(PDFファイルダウンロード)

6月9日(土曜日)
10:00~12:05 MK101 PC環境設定ヘルプディスク
MK102 基調講演
13:10~17:30 MK101 PC環境設定ヘルプディスク
MK102 研究発表
6月10日(日曜日)
10:00~12:00 MK101 研究発表
MK102 講習会 (Rの入門)
13:00~16:00 MK101
MK102 講習会 (MTMineRによるテキストマイニング)

6月9日

10:00~12:05

MK102 セッション1  座長:金 明哲

10:00~10:05

金 明哲 挨拶

10:05~10:25

デーサイエンスに基づいた日本文体分析とその構造のモデリング (Link)

金 明哲 (同志社大学)

10:25~10:50

認知科学・人文学・情報学の統合的研究とテキストマイニング (Link)

大平 英樹 (名古屋大学)

10:50~11:15

小説会話文への話者情報付与とその問題点 (Link)

山崎 誠 (国立国語研究所)

11:15~11:40

日本民謡の旋律と歌詞の音韻の計量比較による地域性の分析

河瀬 彰宏 (同志社大学)

11:40~12:05

チベット・ビルマ系未解読言語シャンシュン語の言語学・統計学的解析 (Link)

長野 泰彦・武内 紹人(国立民俗学博物館、神戸市外国語大学)

12:05~13:10

ランチタイム

13:10~15:15

MK102 セッション2  座長:入江 さやか

13:10~13:35

大規模ブログデータベースを用いた食の流行の現状把握―ベンチャー企業での開発― (Link)

渡邊 隼史 (統計数理研究所)

13:35~14:00

社会科学分野におけるより良い活用のためのツール整備 (Link)

樋口 耕一 (立命館大学)

14:00~14:25

計量文献学の技法を用いた歌詞の通時的分析 (Link)

小林 雄一郎 (日本大学)

14:25~14:50

特許情報とテキストマイニング

井本美子 (放送大学)

14:50~15:15

文体の数量分析に基づく川端康成影武者問題の解明 (Link)

孫 昊 (同志社大学)

15:15~15:25

休憩

15:25~17:30

MK102 セッション3  座長:孫 昊

15:25~15:50

コーパスを用いた条件形に見られる音韻融合に関する計量的比較分析 (Link)

入江 さやか (同志社大学文化情報学研究科)

15:50~16:15

計量文体学の観点からみた宇野浩二の文体変化 (Link)

劉 雪琴 (同志社大学文化情報学研究科)

16:15~16:40

大正・昭和小説における文体の変化に関する計量解析 (Link)

李 広微 (同志社大学文化情報学研究科)

16:40~17:05

テキストマイニングを用いた芥川龍之介と太宰治の文体的特徴の類似性について (Link)

尾城 奈緒子 (同志社大学文化情報学研究科)

17:05~17:30

線形回帰モデルを使った文章難易度の研究 (Link)

李 在鎬 (早稲田大学)


   
6月10日

10:00~12:00

MK101 セッション1 座長:尾城 奈緒子

10:00~10:20

ネットワーク分析による自由想起された中国語の感情語分析 (Link)

劉 雪琴・李 広微 (同志社大学文化情報学研究科)

10:20~10:40

テキスト分類における特徴量選択方法の比較評価 (Link)

鄭 弯弯 (同志社大学文化情報学研究科)

10:40~11:00

データサイエンスの手法による歌謡曲の旋律分析 (Link)

井口 慎也 (同志社大学文化情報学研究科)

11:00~11:20

テキストマイニング手法を用いた絵画作品の計量的分析 (Link)

行村 隆平 (同志社大学文化情報学研究科)

11:20~11:40

菊池寛代作問題に関する計量的研究 (Link)

柳 燁佳 (同志社大学文化情報学研究科)

11:40~12:00

文章の著者識別のための特徴量の提案 (Link)

黄 善玉 (同志社大学文化情報学研究科)

10:00~12:00

MK102 MTMineRを用いたテキストマイニングの基礎 講師: 孫 昊 (Link)

テキストマイニングのプロセス

テキストデータのクリーニング(編集・整形・加工)

テキストマイニングの環境整備(Java、R、形態素&係り受け解析、パスの設定)

R言語の基礎

12:00~13:00

ランチタイム

MK102 MTMineRを用いたテキストマイニング演習1 講師: 劉 雪琴・尾城 奈緒子 (Link)

13:00~14:30

MTMineRの紹介、日本語、英語、ドイツ語とフランス語形態素解析、構文解析、データ集計、

Rとの連携、データの視覚化、ネットワーク分析、主成分分析、対応分析など

14:30~14:40

休憩

MK102 MTMineRを用いたテキストマイニング演習2  講師: 尾城 奈緒子・鄭 弯弯 (Link)

14:40~16:00

階層的クラスター分析、PAM法、トピックモデル、決定木、ランダムフォレスト、サポートベクターマシンなど方法

演習の事前準備

パソコンのOS

MS Windows

関連ソフト:

事前準備マニュアル

各自のマシンのbit数と一致する Javaをインストール

 

形態素解析器 MeCab JUMANのインストールパスの設定

 

 

文節係り受け解析器CaboChaのインストールとパスの設定

 

TreeTagerのインストールと分析する言語環境の整備  Perl のインストール

 

Rのインストールとパスの設定

 

MTMineR:

ソフトを事前に ここ からダウンロードし、解凍してください。

サイズが大きいので、ネット環境によっては時間がかかります。

MTMineRのマニュアルは ここ からダウンロードできます。

MTMineR要点

MTMineRを用いたテキストマイニングの基礎

MTMineRを用いたテキストマイニング演習

 

問い合わせ先: 

teiwanwan(アット)gmail.com

演習について不明なところ、あるいはトラブルがある時、ご連絡ください。

 

Go To Top