javaSE-基础篇-如何获得中文英文混合字符串的字节长度-白红宇的个人博客

发布日期：2021-08-31 13:57:25 浏览次数：28 分类：技术文章

本文共 1070 字，大约阅读时间需要 3 分钟。

在String类中，有这么一个方法：

public byte[] getBytes()：该方法将字符串按照默认编码格式转为byte数组，对于简体中文win系统来说，默认编码格式就是GBK。

package com.anjoyo.day01;import java.io.UnsupportedEncodingException;public class StringTest {    public static void main(String[] args) {        String strSrc = "这是string";        System.out.println(strSrc.getBytes().length);        try {            System.out.println(strSrc.getBytes("GBK").length);        } catch (UnsupportedEncodingException e) {            e.printStackTrace();        }    }}

两者输出结果一样：10。

从中我们还可以看出，对于第二种getBytes的重载方法，我们可以指定编码格式，从而得到该编码格式的字节形式。

package com.anjoyo.day01;import java.io.UnsupportedEncodingException;public class StringTest {    public static void main(String[] args) {        String strSrc = "这是string";        System.out.println(strSrc.getBytes().length);// 10        try {            System.out.println(strSrc.getBytes("UTF-8").length);// 12        } catch (UnsupportedEncodingException e) {            e.printStackTrace();        }    }}

可以看出：对于GBK编码，汉字占2个字节，对于UTF-8来说，汉字占3个字节。这和我们的常识是一致的。

转载于:https://blog.51cto.com/632977922/1274219

转载地址：https://blog.csdn.net/weixin_34077371/article/details/93077864 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：8086CPU寄存器简介

下一篇：DNS查询

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

发表评论

最新留言

关于作者

推荐文章