XML - 编码

编码是将unicode字符转换为等效二进制表示的过程.当XML处理器读取XML文档时,它根据编码类型对文档进行编码.因此,我们需要在XML声明中指定编码类型.

编码类型

主要有两种类型的编码;

  • UTF-8

  • UTF-16

UTF代表 UCS转换格式,UCS本身代表通用字符集.数字8或16表示用于表示字符的位数.它们是8(一个字节)或16(两个字节).对于没有编码信息的文档,默认设置为UTF-8.

语法

编码类型包含在XML文档的prolog部分中. UTF-8编码的语法如下 :

<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>

UTF-16编码的语法如下 :

<?xml version = "1.0" encoding = "UTF-16" standalone = "no" ?>

示例

以下示例显示编码声明 :

<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
</contact-info>

在上面的示例 encoding ="UTF-8"中,指定使用8位来表示字符.要表示16位字符,可以使用 UTF-16 编码.

使用UTF-8编码的XML文件的大小往往小于编码的XML文件采用UTF-16格式.