php中html_entity_decode实现HTML实体转义
最近遇到⼀个问题,数据中包含中⽂引号,结果被转义存储到数据库,取数据的时候⽤了htmlspecialchars_decode把实体转义回去,结果发现并没有⽣效,看了⼀下htmlspecialchars_decode只⽀持5个指定的实体转换,其他的[我遇到的是中⽂引号&ldrquo;]
因此发现了html_entity_decode可以把所有的实体转义回去~
另外,如果你在浏览器中测试,会发现是转义回去的,这是因为浏览器⾃动给处理了。实际上是没有转回去的,可以到命令⾏试试哦~~
html_entity_decode:把所有的html实体转换为原来的字符
与htmlentities() 相反
更准确地说,这个函数解码所有的实体(包括所有的数字实体):a)对于所选择的⽂档类型必须是有效的 - 即对于XML,这个函数不解码可能在某些DTD中定义的命名实体 - 以及b)其中的字符或字符位于与所选编码相关联的编码字符集中并且在所选⽂档类型中被允许。所有其他实体保持原样。
htmlspecialchars_decode:将特殊的 HTML 实体转换回普通字符
此函数的作⽤和 htmlspecialchars() 刚好相反。它将特殊的HTML实体转换回普通字符。
被转换的实体有: &, " (没有设置ENT_NOQUOTES 时), ' (设置了 ENT_QUOTES 时), < 以及>。
所以并不能把不包含在以上5个的其他转换回去。
实例
把 HTML 实体转换为字符:
<?php
$str = "<© W3CSçh°°¦§>";
echo html_entity_decode($str);
>
pdf转html上⾯代码的 HTML 输出如下(查看源代码):
<!DOCTYPE html>
<html>
<body>
<© W3CSçh°°¦§>
</body>
</html>
上⾯代码的浏览器输出如下:
<© W3CSçh°°¦§>