一个字符占几个字节_字符转化成字节的方法

  比较少接触编码的人就会有疑问,不知道编码一个字符占几个字节。GBK编码方式是中文占两个字节,英文占1个字节。编码不同,占据的字节数不同,其中的门路还是比较深奥的,不过关于计算机大神来说估计就是小菜一碟了。正常来说一个英文等于两个字节,一个中文(含繁体)等于两个字节。

  一个字符占几个字节

  不同的编码里,字符和字节的对应关系也不同,与编码方式有关,常见的编码字符与字节的对应关系如下:

  1、ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制,最小值0,最大值255。

  2、UTF-8编码中,一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。

  3、Unicode编码中,一个英文等于两个字节,一个中文(含繁体)等于两个字节。

  符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。

  4、GBK编码方式是中文占两个字节,英文占1个字节。

  字符转化成字节的方法

  1.使用 bytes() 功能

  这个想法是使用字节构造函数 bytes(string, encoding) 使用指定的编码从字符串中获取字节数组。要执行相反的操作,即将字节转换为字符串,请将字节传递给使用所用编码的字符串构造函数。如果未指定编码,则它使用 Unicode 实现使用的当前默认编码。

  2.使用 encode() 功能

  另一种选择是使用 str.encode 使用指定编码或默认编码对字符串进行编码的函数 utf-8.要从给定字节解码字符串,可以使用 bytes.decode 函数,它接受编码或使用默认编码 utf-8 当没有指定编码时。这就是在 Python 中将字符串转换为字节的全部内容。

  一个字符占几个字节?还有不清楚的小伙伴就要仔细阅读下文章。英文和数字占一个字节,中文占一个字符,也就是两个字节,要提醒大家的是字符不等于字节。


免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考;文章版权归原作者所有!本站作为信息内容发布平台,页面展示内容的目的在于传播更多信息;本站不提供任何相关服务,阁下应知本站所提供的内容不能做为操作依据。市场有风险,投资需谨慎!如本文内容影响到您的合法权益(含文章中内容、图片等),请及时联系本站,我们会及时删除处理。


为您推荐