明海2005へ戻る

電子化テキスト・テキストデータとは

コンピュータと文字

コンピュータにできること
スイッチのON/OFF→1と0の組み合わせ→(2進数)→数 →[    ]→文字

36484(10進数)=1000111010000100(2進数)=8E84(16進数)

※ビット 8ビット=1バイト=2^8=256 2バイト=2^8×2^8=2^16=65536

文字コード

文字セット
例) JISコード・ユニコード
エンコード(符号化方式)
例) Shift JIS・ISO 2022-JP・日本語EUC

資料1 JISコードの種類

1969年 JIS X 0201(JISローマ字カナ) ASCII+カタカナ
1978年 JIS X 0208(JIS基本漢字) 〈ISO2022系〉非漢字453字・漢字6349字(第1水準・第2水準)
    78JIS 旧JIS 
    83JIS 非漢字71字・漢字4字追加。字体の変更、第1水準・第2水準間の字体の入れ替え。これ以降を新JIS
    90JIS 漢字2字追加
    97JIS 「包摂規準」
1990年 JIS X 0212(JIS補助漢字) 〈ISO2022系〉非漢字245字・漢字5801字
2000年 JIS X 0213(JIS拡張漢字) 〈ISO2022系〉非漢字659字・漢字3685字(第3水準・第4水準)
    2004年 改正
2001年 JIS X 0221 〈ISO10646(Unicode)系〉

資料2 エンコード別の文字番号の例

文字JIS区点番号Shift JISISO 2022-JP日本語EUC
27区68点16進数8E843B64BBE4
10進数364841520448100
2進数1000111010000100111011011001001011101111100100
4区47点16進数82CD244FA4CF

|~|~|10進数|33485|9295|42191

2進数1000001011001101100100010011111010010011001111

テキストファイル

  1. テキストファイルとは 文字をあらわすコードだけが並んでいるファイル
  2. テキストファイルとワープロファイルとの違い
  3. テキストファイルの種類
    • プレーンテキスト
    • タグ付きテキスト 例) HTML,XML
  4. テキストファイルの利点
  5. テキストファイルの注意点

資料3 機種依存文字?

moji.gif

機種依存文字劇場

 

テキストデータとテキストエディタ


Counter: 10586, today: 1, yesterday: 2

トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS