日本言語研究(講義)

コーパス日本語学入門

2011/06/10 「ひまわり」の検索結果の集計

Excel

「ひまわり」用追加データ

正規表現小テスト

2011/06/03 全文検索システム「ひまわり」

「ひまわり」とは

ひまわりとデータのセットアップ

ひまわりと正規表現

検索とExcelでの集計デモ

2011/05/27 タグ付き正規表現

最長一致の原則(greedy matching)と最小一致

後方参照

テキストデータのダウンロード

2011/05/20 正規表現を使う

正規表現とは

正規表現の応用

#amazon(4873111706) #amazon(4873113598)

2011/05/13 テキストエディタと正規表現

復習

ショートカットキー

grepと置換で簡易KWIC(CSVファイル)を作る

正規表現

正規表現を使ってみる

2011/05/06 テキストエディタ

テキストエディタ

テキストエディタの利用

2011/04/22 テキストファイルとテキストエディタ

先週の補足

狭義のコーパス
言語研究を目的として収集され、言語研究のための情報が付けられたコンピュータ上で利用可能な大規模な言語データ。
広義のコーパス
コンピュータ上で利用可能な大規模な言語データ。必ずしも言語研究向きではないが、言語研究にも利用可能。

授業で利用する主なソフトウェア

テキストエディタ検索・整形
全文検索ソフトひまわり検索・分析
表計算ソフトExcel分析・グラフ作成
ワープロWord「スタイル」を利用したレポート作成

テキストデータ

2011/04/15 イントロダクション


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS