幕末のポータルサイト 実験:幕末の出来事をXMLで表現..??

Introduction Step1Step2Step3Step4 ・ Step5 ・ Step6 ・ Step7 ・Step8 ・ Step9
Introduction
Step.1
Word to html 
Step.2
xml
Step.3
xml Tag
Step.4
SAX.Java
Step.5
Step.6
Step.7
Step.8
Step.9

Step.1 Microsoft WORDで作成した文書を
htm(html)形式に WORDで自動変換する

Microsoft WORD2003(11.6359.6360)SP1の「Webページとして保存」、ファイルの種類「Webページ(フィルタ後)」で、Word文書を htm文書に変換する。


実験に使う幕末の出来事文書として、慶応4年1月7日の出来事を集めたWORDファイル「h4_0107.doc」を使います。

このWORDファイル「h4_0107.doc」を、WORD自身の「Webページとして保存」すると「h4_0107.htm」になります。

htm(html)で書かれた文書は、ご存じの通り「タグ」があちこちに散りばめられています。
<html></html> , <head></head>, <table></table>など、< >で囲まれたものが「タグ」です。

「タグ」を見る場合は、インターネットエクスプローラなどのブラウザでページを開き、ブラウザの「表示」、「ソース」をクリックすると、「タグ」が散りばめられた html文書を見ることができます。

htm(html)では、「タグ」は決められており、勝手に作ることはできませんし、使い方もあらかじめ決められています。

この勝手に作ることができない「タグ」を、勝手に(自由に)作ることができるのが xml です。

Step2で「h4_0107.htm」 を xml に加工した例「h4_0107a.xml」を紹介します。

主な参考書:やさしいXML 高橋麻奈著 SOFTBANK


 ←ご意見、アドバイス等は左をクリックし、掲示板へお願いします。

Copyright (C) onjweb.com, All Rights Reserved.