在Java中将HTML字符代码转换为char

Convert HTML character code to char in Java

我们的XML提要在ISO-8859-1文件中为我们提供了编码的UTF-8字符。这将被送入数据库。所以文本是ISO-8859-1编码的,包含以下内容:

1
金融市场

有没有办法把它转换成普通的Java字符串?类似:

1
String str = fromHtmlUtf8("金融市场");

其中,结果str将包含正常的utf8字符。在这种情况下,是汉语,但可以是完全混合的。

谢谢。


您可以使用Apache Commons中的StringEscapeUtils:http://commons.apache.org/lang/api-2.6/org/apache/commons/lang/stringsescapeutils.html

下一次的搜索:如何从Java转换为UTF-8


如果需要小的lib,可以使用htmlentitles

http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=htmlEntities