2009-04-01から1ヶ月間の記事一覧

XML1.0にvalidな文字列の出力

RSSパーサーを使っていて、たまに外部のblogサービス*1のRSSが変な文字を含んでいてパースできないことがあるので、XMLの仕様を再確認してみた。 許可されるのはC0制御文字集合(0x00〜0x1f)のう水平タブ=HT(0x09), 改行=LF(0x0a), 復帰=CR(0x0d)とC1制御文字…