文字コード復習(ASCII)

文字コードについて復習しました。
あまり好きではない文字コードですが、覚えておいて損ない。
ということで復習がてら書き残しておきます。

ASCII文字セット

ASCIIはAmerican Standard Code for Information Interchangeの略。
ASCII文字セットは4つのグループに分かれる。

◆制御文字グループ($00 – $1F)
アルファベット等の記号を表示するのではなく、
プリンタやディスプレイに対する制御用。
例えば、行頭に戻るキャリッジリターン、
カーソルを1行下に移動させるラインフィード。
カーソルを1文字分左に移動するバックスペースなど。

◆句読文字・特殊文字・数字グループ
ドット、ピリオド、アットマークなど。
あとはスペースや数字も。

◆大文字英字+特殊文字
A~Zまで。残りは特殊文字。

◆小文字英字+特殊文字
a~zまで。特殊文字もある。deleteもここ。

ASCII雑学

ASCIIは標準ではあります。アルファベットはどのマシン上でも
大概同じく表現できることが多いですが、制御文字はそうとは限らない。

共通にサポートされているのはバックスペース、タブ、CR、LF。
この4個くらい。

これらを手で変換しようとおもうと、とってもストレスw
でも今では変換ソフトやライブラリがそろっているので
そこまで意識しなくても大抵オッケー。
簡単なテキストエディタ等で変換は可能だったりします。

プチまとめ

Wikipedia – ASCII
詳細のASCII表はWikipediaを!
というまとめはちょっとヒドイw

今ではほぼ気にすることなく文字コードを扱えるようになりました。
XML等を多く使う今ではutf8が主流だったりするのでしょうね。
アルファベットと数字くらいを使ってプログラミングをする場合は
文字コードを意識する場面は少ないですが、やはりutf8とか
出てくると気になってきますよね。

utf8を使ってプログラミングをする場合、
何パターンか試してみて、うまくいったパターンを採用。
というのが多いような気がします。

この辺りをもうちょっと理解して、うまくプログラミングできると
ちょっとカッコイイ(≧∇≦)b

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です