linux shell 变量长度,变量 - bash中的字符串长度
发布日期:2021-09-14 01:15:49 浏览次数:1 分类:技术文章

本文共 2046 字,大约阅读时间需要 6 分钟。

UTF-8字符串长度

除了fedorqui的正确答案,我想展示字符串长度和字节长度之间的区别:

myvar='Généralités'

chrlen=${#myvar}

oLang=$LANG oLcAll=$LC_ALL

LANG=C LC_ALL=C

bytlen=${#myvar}

LANG=$oLang LC_ALL=$oLcAll

printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen

将呈现:

Généralités is 11 char len, but 14 bytes len.

你甚至可以查看存储的字符:

myvar='Généralités'

chrlen=${#myvar}

oLang=$LANG oLcAll=$LC_ALL

LANG=C LC_ALL=C

bytlen=${#myvar}

printf -v myreal "%q" "$myvar"

LANG=$oLang LC_ALL=$oLcAll

printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"

会回答:

Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').

Nota:根据Isabell Cowan的评论,我已将设置添加到$LC_ALL以及printf。

论证的长度

参数与常规变量相同

strLen() {

local bytlen sreal oLang=$LANG oLcAll=$LC_ALL

LANG=C LC_ALL=C

bytlen=${#1}

printf -v sreal %q "$1"

LANG=$oLang LC_ALL=$oLcAll

printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"

}

将作为

strLen théorème

String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'

有用的printf修正工具:

如果你:

for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do

printf " - %-14s is %2d char length\n" "'$string'" ${#string}

done

- 'Généralités' is 11 char length

- 'Language' is 8 char length

- 'Théorème' is 8 char length

- 'Février' is 7 char length

- 'Left: ←' is 7 char length

- 'Yin Yang ☯' is 10 char length

不是很漂亮......为此,有一点功能:

strU8DiffLen () {

local bytlen oLang=$LANG oLcAll=$LC_ALL

LANG=C LC_ALL=C

bytlen=${#1}

LANG=$oLang LC_ALL=$oLcAll

return $(( bytlen - ${#1} ))

}

那么现在:

for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do

strU8DiffLen "$string"

printf " - %-$((14+$?))s is %2d chars length, but use %2d bytes\n" \

"'$string'" ${#string} $((${#string}+$?))

done

- 'Généralités' is 11 chars length, but use 14 bytes

- 'Language' is 8 chars length, but use 8 bytes

- 'Théorème' is 8 chars length, but use 10 bytes

- 'Février' is 7 chars length, but use 8 bytes

- 'Left: ←' is 7 chars length, but use 9 bytes

- 'Yin Yang ☯' is 10 chars length, but use 12 bytes

转载地址:https://blog.csdn.net/weixin_40002224/article/details/116878624 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:红帽linux初始化,Redhat(03):Linux 初始化配置
下一篇:understanding linux kernel 中文版,Understanding the Linux Kernel [PDF]

发表评论

最新留言

表示我来过!
[***.240.166.169]2024年03月05日 16时22分37秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章