http://q.hatena.ne.jp/1171495958について

http://q.hatena.ne.jp/1171495958 の話。

まず、これはHTML 4.01仕様書にあるようにSGML規格を参照すれば何が正しいのかは自明。JIS X 4151の6章を読めばよい。また何処かに詳細は書くが、「要素」が何によって構成されるのか、「要素」の「内容」として何が許可されているのかを辿ればよい。

q:id:llusall氏の回答は邦訳とはいえ実際に仕様書にあたり、調査を行った結果を基に記述しているのだが、間違っているので突っ込んでおく。これを読んで誤解する人がいると残念だから。

XHTML 1.0仕様書の邦訳内の記述「整形式は [XML] で導入された新しい概念である。」を根拠に訳のわからない見解を書いているが、その部分をちゃんと読めばこのように書いている。


SGML でも互い違いは不正であったが、既存のブラウザでは広く容認されている。
これを読んで《「HTMLではどちらでも可」》などと解釈する思考が私には全然理解できない。


W3Cの日本語訳では、有益な情報を見つけられませんでした。(見落としかも。すみません。)
明らかにq:id:llusall氏の見落としだ。HTML 4.01仕様書にはちゃんと書いてある。日本語訳に関してもそこを欠落させているわけではない。3.2.1をみれば適正に入れ子にする必要があることは自明だ。念のため http://www.asahi-net.or.jp/~sd5a-ucd/rec-html401j/intro/sgmltut.html#h-3.2.1 から引用しておく。


要素を支配する規則については、SGML標準を参照されたい。例えば、要素は適正に入れ子にする必要があるとか、ある1つの終了タグは、マッチする開始タグまで遡る範囲の途中にある、終了タグが省略されている開始タグのすべてを閉じるとか(7.5.1【JIS X4151の6.3.1】)。