Convert HTML character code to char in Java
我们的XML提要在ISO-8859-1文件中为我们提供了编码的UTF-8字符。这将被送入数据库。所以文本是ISO-8859-1编码的,包含以下内容:
1 | 金融市场 |
有没有办法把它转换成普通的Java字符串?类似:
1 |
其中,结果str将包含正常的utf8字符。在这种情况下,是汉语,但可以是完全混合的。
谢谢。
您可以使用Apache Commons中的StringEscapeUtils:http://commons.apache.org/lang/api-2.6/org/apache/commons/lang/stringsescapeutils.html
下一次的搜索:如何从Java转换为UTF-8
如果需要小的lib,可以使用htmlentitles
http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=htmlEntities