substr是不安全的
2024-08-21 10:11:27
今天遇到一个问题,数据库中保存的内容通过php在页面无法显示,如果将内容换行或加个空格或者随便加点其他内容就能正常显示。
非常的诡异,显示的内容是通过截取得到的。代码非常简单
substr($pMarketInfo['description'], 0, 150) . '...';
原始内容是:
Set on a huge 809m2 block, there is plenty of room for the pets and the little ones and with side access
• Floor to ceiling tiles in the bathroom
• Built in robe to main bedroom
最后终于查明了原因。用substr截取内容,到第150个正好碰到了'•'这个特殊符号,substr是不安全的,他截取的是字节(bytes),a占一个字节,b占一个字节。汉字及有些符号会占用多字节(到底占几个跟编码有关),所以他会将'•'这个特殊符号一截两半,变成不完整的。
php解析的时候由于不认得这半个字符,造成中断,所以最终不显示。
安全的做法是使用
mb_substr($pMarketInfo['description'], 0, 150, 'utf-8') . '...';
比substr()多出一个编码参数,如果不指定会使用内部的编码。内部编码通过mb_internal_encoding()获得。
//输出:我们都
echo mb_substr('我们都是好孩子hehe',0,9); echo "<br>";
//输出:我们都是好孩子he
echo mb_substr('我们都是好孩子hehe',0,9,'utf-8');
第一个是以三个字节为一个中文,这就是utf-8编码的特点,下面加上utf-8字符集说明,所以,是以一个字为单位来截取的。
注:
ANSI 中文字符2、英文字符1字节
UTF-8 中文字符3、英文字符1字节
Unicode 中文字符2、英文字符2字节
最新文章
- winform只允许一个应用程序运行 2014-12-08 09:51 31人阅读 评论(0) 收藏
- C#网络编程之---TCP协议的同步通信(二)
- Swift 注释
- can not find UIAutomationClient
- 脚本语言&;&; Performance Testing
- linux ubuntu 思源黑体安装
- SDUT 2527 斗地主
- DataTable 无法转换的错误
- [Codeforces Round #186 (Div. 2)] A. Ilya and Bank Account
- JAVA HashMap与HashTable 区别
- 【小白的java成长系列】——顶级类Object源代码分析
- R语言做文本挖掘 Part5情感分析
- 【RL-TCPnet网络教程】第21章 RL-TCPnet之高效的事件触发框架
- [C]\x字符转义序列
- loj#6030. 「雅礼集训 2017 Day1」矩阵(贪心 构造)
- Contest2075 - 湖南多校对抗(csu1576)大数 Catalan Square
- Uva1001-floyd算法-建图
- [Umbraco] Data Types介绍
- 2013337朱荟潼 Linux第二章读书笔记——从内核出发
- Java设计模式之代理模式(静态代理和JDK、CGLib动态代理)以及应用场景
热门文章
- iOS动画的要素:CALayer维护数据模型和图片,沟通了CPU和GPU--视图中与图形绘制相关的功能
- 【我所认知的BIOS】—>; uEFI AHCI Driver(8) — Pci.Read()
- UVa 1608 - Non-boring sequences
- 原生JS写验证码
- Linux学习总结(七)-磁盘管理 du df fdisk
- webstorm&;phpstorm打开大型项目卡死解决如vue-laravel-Yii2
- Linux下shellcode的编写
- CToolBarCtrl基本内容控件
- 【题解】洛谷P2679 [NOIP2015TG] 子串(DP+滚动数组)
- Xcode4.4(LLVM4.0编译器)中NSArray, NSDictionary, NSNumber优化写法