How do I export an Excel file with Chinese characters to a CSV?
我有一个Excel文档,其数据表包含汉字。 我正在尝试将此Excel电子表格导出到CSV文件,以导入到MySQL数据库中。
但是,当我将Excel文档另存为CSV文件时,记事本会显示生成的CSV文件的汉字作为问号。 导入MySQL会保留问号,而完全忽略了原始汉字是什么。
我怀疑这可能与使用具有UTF-8编码的Excel有关。 谢谢你的帮助!
据我所知,Excel不会以任何Unicode编码保存CSV文件。我最近在尝试将带有£符号的文件导出为CSV时遇到类似的问题。我受益于能够完全使用其他工具。
我的Excel 2010版本可以Unicode格式
编辑:此外,您始终可以在Notepad ++中打开此Unicode输出,将其转换为UTF-8
以下方法已经过测试,可用于在MongoDB中导入CSV文件,因此应该可以使用:
在您的Excel工作表中,转到"文件">"另存为"。
命名文件,然后从"另存为类型"旁边的下拉列表中选择" Unicode文本(* .txt)",然后单击"保存"。
使用您喜欢的文本编辑器(例如记事本)打开unicode .txt文件。
由于我们的Unicode文本文件是制表符分隔的文件,并且我们想将Excel转换为CSV(逗号分隔)文件,因此我们需要用逗号替换所有制表符。
选择一个制表符,右键单击它,然后从上下文菜单中选择"复制",或者直接按CTRL + C,如下面的屏幕快照所示。
按CTRL + H打开"替换"对话框,然后将复制的选项卡(CTRL + V)粘贴到"查找内容"字段中。执行此操作时,光标将向右移动,指示已粘贴选项卡。在"替换为"字段中键入逗号,然后单击"全部替换"。
单击文件>另存为,输入文件名并将编码更改为UTF-8。然后单击"保存"按钮。
直接在记事本的"另存为"对话框中将.txt扩展名更改为.csv,然后选择"另存为"旁边的"所有文件(。)",如下面的屏幕快照所示。
通过单击文件>打开>文本文件(.prn,.txt,.csv)从Excel打开CSV文件,然后验证数据是否正常。
来源在这里
您可能要尝试使用notepad ++,我怀疑notepad是否支持unicode字符。
http://notepad-plus-plus.org/
我已经尝试了所有上述方法来处理我的数据,但是对我的数据却不起作用(简体中文,超过700Mb。我已经尝试了Windows中文和英语系统,英语和中文excel。Windowsexcel甚至都无法保存到utf8我声称是这样做的,我在另存为中指定了uft8 csv,但是当我使用" open sheet"来检测编码方法时,它不是uft8,也不是GB *。
这是我的最终解决方案。
(1) Download 'open sheet'.
(2) Open it properly. You Ccan scroll the encoding method until you see the Chinese character displayed in the preview windows.
(3) Save it as utf-8(if you want utf-8).
PS:You need to figure out the default encoding in your system. As far
as I know, Ubuntu deals with UTF8 fine. But the windows default
Simplied Chinese is start with GB**.Even if you encode it as utf8,
still, you might open it cocrrectly as well. In my case, r could not
open my utf-8 csv, but can open the GB* encoding.
即使您的文件很大,此方法也可以正常工作。
其他解决方法是使用Google工作表(但可以限制文件大小)。 Notepad ++也适用于较小的文件。
有一种方法可以通过打开文件并滚动浏览编码方法,直到看到正确显示的中文,来检测编码方法。