-
Notifications
You must be signed in to change notification settings - Fork 79
/
Copy pathencoding.xml
69 lines (67 loc) · 3.33 KB
/
encoding.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
<?xml version="1.0" encoding="utf-8"?>
<!-- $Revision$ -->
<!-- EN-Revision: af4410a7e15898c3dbe83d6ea38246745ed9c6fb Maintainer: takagi Status: ready -->
<article xml:id="xml.encoding" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink">
<title>文字エンコーディング</title>
<para>
PHPのXML拡張モジュールは、異なった<glossterm>文字エンコーディング
</glossterm>を通じて<link xlink:href="&url.unicode;">Unicode</link>
文字セットをサポートします。<glossterm>ソースエンコーディング
</glossterm>および<glossterm>ターゲットエンコーディング
</glossterm>という2種類の文字エンコーディングがあります。
PHP におけるドキュメントの内部表現は、常に
<literal>UTF-8</literal>でエンコードされます。
</para>
<para>
ソースエンコーディングは、XMLドキュメントが
<link linkend="function.xml-parse">構文解析</link>された際に行わ
れます。<link linkend="function.xml-parser-create">XML パーサの
作成</link>を行う際に、ソースエンコードを指定することができます。
(このエンコーディングは、その XML パーサーが存在する間、後で変更す
ることはできません)サポートされるソースエンコーディングは、
<literal>ISO-8859-1</literal>, <literal>US-ASCII</literal> ,
<literal>UTF-8</literal> です。前の二つは、シングルバイトエンコー
ディングです。これは、各文字がシングルバイトで表現されることを意
味します。<literal>UTF-8</literal> は、1から4バイトの可変ビット
数(最大21ビット)で構成された文字をエンコードすることが可能です。
PHP で用いられるデフォルトのソースエンコーディングは、
<literal>ISO-8859-1</literal>です。
</para>
<para>
ターゲットエンコーディングは、PHPがデータをXMLハンドラ関数に
渡す時に行われます。あるXMLパーサが作成された際、ターゲットエン
コーディングは、ソースエンコーディングと同様に設定されます。
しかし、これは、いつでも変更可能です。ターゲットエンコーディング
は、タグ名と同様に文字データに作用し、命令を処理します。
</para>
<para>
XML パーサがソースエンコーディングが表現できる範囲の外側の文字に
出会った場合、エラーが返されます。
</para>
<para>
解釈するXMLドキュメントにおいてPHPが文字に出会った際に、選択した
ターゲットエンコーディングで表現できない文字に出会った場合、問題
の文字は "降格" されます。現在、このことはこのような文字が疑問符
で置換されることを意味します。
</para>
</article>
<!-- Keep this comment at the end of the file
Local variables:
mode: sgml
sgml-omittag:t
sgml-shorttag:t
sgml-minimize-attributes:nil
sgml-always-quote-attributes:t
sgml-indent-step:1
sgml-indent-data:t
indent-tabs-mode:nil
sgml-parent-document:nil
sgml-default-dtd-file:"~/.phpdoc/manual.ced"
sgml-exposed-tags:nil
sgml-local-catalogs:nil
sgml-local-ecat-files:nil
End:
vim600: syn=xml fen fdm=syntax fdl=2 si
vim: et tw=78 syn=sgml
vi: ts=1 sw=1
-->