■本書添付の統計分析ソフトについて
1)本書添付のCD-ROMには,分析用言語データ(英語・日本語)のほか,高機能統計分析ソフトウェアSeagull Statが収録されています。
2)Seagull Statは,Excel2003専用版と,Excel2007〜2013対応版の2種類が収録されています。
3)Excel2007〜2013対応版は,分析できるデータサイズが10列×20行に制限されています。(※2003版にはサイズの制限はありません。)
■目的別インデックス
「これ」をしたい → 「この章」を参照。
データ間の差を検証したい → 仮説検定(3章)
データ間の関連を調べたい → 相関分析(4章)
あるデータを他のデータを使って説明したい → 回帰分析(5章)
データの識別ルールを発見したい → 判別分析(6章)
データを幾つかの群にグルーピングしたい → クラスター分析(7章)
データを合成して新しい指標を作り出したい → 主成分分析(8章)
データを分解して隠れた要因を探り出したい → 因子分析(9章)
データ間の構造を整理したい → コレスポンデンス分析(10章)
ISBN:978-4-87424-498-2 C3033 |
げんごけんきゅうのためのとうけいにゅうもん 言語研究のための統計入門 |
定価(税込) : ¥3,080 |
著作者よみ : | いしかわしんいちろう/まえだただひこ/やまざきまこと | |
著者名 : | 石川慎一郎/前田忠彦/山崎誠 編【著書を検索】 | |
石川有香/小林雄一郎/高見敏子/中尾桂子/水本篤 著【著書を検索】 | ||
出版社 : |
くろしお出版
|
|
発売日 : | 2010年12月10日 | |
ジャンル : | 数理的言語学・言語情報処理 | |
判型A5/296頁 |
目次
第 1 章 言語統計を学ぶ前に備1. 本書のねらい
2. 本書の構成
3. 本書で使用するコーパス
4. 本書収録の統計ソフトについて
5. まとめ:言語統計を学ぶコツ
第 2 章 言語統計の基礎
1. なぜ言語学に統計が必要か
2. 言語資料のデータ化
3. 記述統計学の基本:度数分布,平均,分散,標準偏差,標準得点
4. 推測統計学の基本:母集団と標本,標本分布,確率
5. 仮説検定
6. 本章のまとめ
第 3 章 仮説検定:データ間の差を検証する
1. 仮説検定とはなにか
2. コーパス研究と仮説検定
3. カイ二乗検定の手順
4. 英語実例研究:母語話者と学習者による1,2人称代名詞の使用
5. 日本語実例研究:夏目漱石の3作品における思考動詞の頻度変化
6. 本章のまとめ
第 4 章 相関分析:データの関連を見る
1. 相関分析とはなにか
2. コーパス研究と相関分析
3. 相関分析の手順
4. 英語実例研究:日本人・中国人・母語話者の英語接続副詞の使用
5. 日本語実例研究:1人称代名詞件数に見る主要検索エンジン間の相関
6. 本章のまとめ
第 5 章 回帰分析:データから説明モデルを作る
1. 回帰分析とはなにか
2. コーパス研究と回帰分析
3. 回帰分析の手順
4. 英語実例研究:助動詞と両性併記型代名詞の関係を探る
5. 日本語研究:各品詞の出現頻度の関係を探る
6. 本章のまとめ
第 6 章 判別分析:データの分類ルールを探る
1. 判別分析とはなにか
2. コーパス研究と判別分析
3. 判別分析の手順
4. 英語実例研究:判別分析を用いた英語母語話者・非母語話者の分類
5. 日本語実例研究:高頻度な文末表現を用いたジャンル判別
6. 本章のまとめ
第 7 章 クラスター分析:データを群に分類する
1. クラスター分析とはなにか
2. コーパス研究とクラスター分析
3. クラスター分析の手順
4. 英語実例研究:高頻度語を用いたシェイクスピア作品の分類
5. 日本語実例研究:作文中の高頻度名詞に見る立論のパターン
6. 本章のまとめ
第 8 章 主成分分析:データの情報を圧縮する
1. 主成分分析とはなにか
2. コーパス研究と主成分分析
3. 主成分分析の手順
4. 英語実例研究:主成分分析を用いた学習語彙表の作成
5. 日本語実例研究:副詞頻度に見る芥川・太宰・夏目の関係
6. 本章のまとめ
第 9 章 因子分析:データに隠れた要因を探る
1. 因子分析とはなにか
2. コーパス研究と因子分析
3. 因子分析の手順
4. 英語実例研究:共起副詞に基づく英語思考動詞の意味傾向の調査
5. 日本語実例研究:日本語接続表現とテクストの内容ジャンル
6. 本章のまとめ
第 10 章 コレスポンデンス分析:データ間の構造を整理する
1. コレスポンデンス分析とはなにか
2. コーパス研究とコレスポンデンス分析
3. コレスポンデンス分析の手順
4. 英語実例研究:高頻度語を用いた習熟度別英語学習者の特徴抽出
5. 日本語実例研究:トピックに基づく総理大臣所信表明演説の分類
6. 本章のまとめ
第 11 章 これからの言語研究と統計
1. 英語コーパス研究と計量手法
2. 日本語コーパス研究と計量手法
著者略歴
[編著者]石川 慎一郎(いしかわ・しんいちろう)
神戸大学国際コミュニケーションセンター/大学院国際文化学研究科外国語教育論講座准教授。神戸大学文学部卒業。神戸大学大学院文学研究科修士課程修了。岡山大学大学院文化科学研究科博士課程修了。博士(文学)。専門分野は応用言語学。主な著書等として『英語コーパスと言語教育:データとしてのテクスト』(大修館書店,2008),English Lexicography in Japan(大修館書店,2006)(共編著)他。
前田 忠彦(まえだ・ただひこ)
統計数理研究所データ科学研究系准教授。早稲田大学第一文学部卒業。早稲田大学大学院文学研究科修士課程修了。同博士課程単位取得退学。専門分野は社会調査・心理学的測定法・計量心理学。主な著書等として『心理統計法への招待:統計をやさしく学び身近にするために』(サイエンス社,2006)(共著),『原因をさぐる統計学:共分散構造分析入門』(講談社,1992)(共著)他。
山崎 誠(やまざき・まこと)
国立国語研究所言語資源研究系准教授。埼玉大学教養学部卒業。筑波大学文芸・言語研究科修士課程修了。同博士課程単位取得退学。専門分野は日本語計量的研究,語柔構造・比較。主な著書等として『複合辞研究の現在』(和泉書院,2006)(共編),『分類語彙表増補改訂版』(大日本図書,2004)(共編)他。
著者からのコメント
(はしがきより)大量の言語データを電子的に蓄積するコーパスの普及によって,言語研究の 世界は様変わりした。言語の研究者は,従来では想像すらできなかった量の膨 大な計量データを手にすることができるようになったのである。 しかし,日進月歩でコーパスのサイズが拡張し,様々な分析ツールや手法が 開発される一方で,得られた量的データをいかに正しく扱うかについて教えて くれる適当な入門書はこれまで存在しなかった。もちろん,統計学そのものの 教科書ならすでに多くのすぐれた書物が出版されているが,統計になじみのな い言語系の学生や研究者にとっては,数式への抵抗感や扱われている実例への 違和感などが障害となって,そうした書物で独学することは決して容易ではな かった。 以上のような現状をふまえ,本書は,統計学の予備知識を持たない学生や言 語研究者が,基礎から無理なく統計的概念を学び,統計的知見や手法を各自の 言語研究に応用できるようになることを目的として編まれた書物である。
![]() |