|
Step.2 html文書を XML文書に加工してみる
XMLとはどんなもので歴史文書整理に使うにはどのように扱えば良いのか
XMLの「タグ」の使い方を調べる
慶応4年1月7日の出来事を集めたWORDファイル「h4_0107.doc」を「h4_0107.htm」に変換し、さらに xml文書に加工して見ます。
手作業で加工した xml文書が「h4_0107a.xml」です。
加工の方法:
h4_0107.htm をウィンドウズ付属の Notepadで開いて以下の要領で編集しました。
先頭行に下記の1行を追加する。
<?xml version="1.0" encoding="Shift_JIS" ?>
種々なhtml用のタグは以下を除いて一切削除します。
残したタグは、<p>,</p>,<head>,</head>,<title>,</title>そして<html>,</html> これは<xml>,</xml>に変更しました。
注:タグの削除について..............
<p class=MsoNormal><span style='font-family:"MS 明朝"'>は、<p>にしてしまう、などまず簡単にします。
「h4_0107a.xml」は何の面白みもない、幕末の出来事の記述だけです........が、
-<xml> の−記号をクリックすると、+<xml>のみになってしまいます。すなわち階層構造になっており、下の階層が隠れてしまいます。
-<head>の−記号をクリックすると階層構造であることが良く分かります。
次の Step3で自由に決めることができるタグを、歴史文書用に考えます。
主な参考書:やさしいXML 高橋麻奈著 SOFTBANK
←ご意見、アドバイス等は左をクリックし、掲示板へお願いします。
Copyright (C) onjweb.com, All Rights Reserved.
|