変換する必要があるスペイン語文字 (チルダなど) を含む Excel ファイルがあります。 CSVファイルインポートファイルとして使用します。 ただし、CSV として保存すると、ASCII 文字ではない「特殊な」スペイン語文字が壊れてしまいます。 これは、左右の引用符と全角ダッシュでも発生するようです。これは、元のユーザーが Mac で Excel ファイルを作成したことによるものと思われます。
CSVは簡単なので テキストファイル, UTF8エンコーディングを処理できると確信しているので、これがExcelの制限であると想定していますが、ExcelからCSVに取得して非ASCII文字を保存する方法を探しています。
注: Google スプレッドシートの機密データには注意してください。
ExcelでCSVに保存した後、 コマンドライン置く:
Iconv -f cp1250 -t utf-8 ファイルエンコードされた cp1250.csv > ファイルエンコードされた utf8.csv
(cp1250 を実際のエンコーディングに置き換えることを忘れないでください)。
素早く動作し、次の用途に最適です 大きなファイル、郵便番号データベースなど、GoogleDocs にインポートできません (400,000 セル制限)。
仮定して Windows環境、Excel で通常どおりファイルを保存して操作しますが、保存した Excel ファイルを Gnome Gnumeric (無料) で開きます。 Gnome Gnumeric テーブルを CSV として保存します。これにより、私にとっては、UTF-8 CSV として保存されます。
簡単な方法: ダウンロード オープンオフィス()、スプレッドシートをダウンロードし、Excel ファイル (.xls または .xlsx) を開きます。 次に、それを CSV テキスト ファイルとして保存するだけです。ウィンドウが開き、現在の形式で保存するか、.ODF 形式で保存するかを尋ねられます。 [現在の形式を維持する] を選択し、新しいウィンドウで、ファイルが記述されている言語に応じて最適なオプションを選択します。 スペイン語の場合は、西ヨーロッパ (Windows-1252/WinLatin 1) を選択すると、ファイルは正常に動作します。 Unicode (UTF-8) を選択した場合、スペイン語の文字は機能しません。
私も同じ問題に直面しましたが、これには簡単な解決策があります。
これはうまく機能し、あらゆるソフトウェアにインポートできる csv ファイルを作成します。 この csv ファイルを SQLITE データベースにインポートしましたが、すべての Unicode 文字で正常に動作します。
シートを UTF-8 にエクスポートできる小さな Python スクリプトを作成しました。
最初のパラメータとして Excel ファイルを指定し、次にエクスポートするシートを指定するだけです。 シートが指定されていない場合、スクリプトは Excel ファイルに存在するすべてのシートをエクスポートします。
#!/usr/bin/env python # データシートを xlsx から openpyxl の csv にエクスポート import load_workbook import csv from os import sys reload(sys) sys.setdefaultencoding("utf-8") def get_all_sheets(excel_file):sheets = workbook =load_workbook(excel_file,use_iterators=True,data_only=True) all_worksheets = workbook.get_sheet_names() for worksheet_name in all_worksheets:sheets.append(worksheet_name) シートを返す def csv_from_excel(excel_file,sheets): workbook =load_workbook(excel_file,use_iterators=True) ,data_only=True) シート内の worksheet_name の場合: print("Export " + worksheet_name + " ...") try: worksheet = workbook.get_sheet_by_name(worksheet_name) ただし KeyError を除く: print("Could not find " + worksheet_name) sys.exit (1) your_csv_file = open("".join(), "wb") wr = csv.writer(your_csv_file, quoting=csv.QUOTE_ALL) worksheet.iter_rows() の行: lrow = 行のセル: lrow。 append(cell.value) wr.writerow(lrow) print(" ... 完了") your_csv_file.close() 2 でない場合<= len(sys.argv) <= 3:
print("Call with " + sys.argv + "
コンピューターで作成されたファイルとドキュメントには、常に独自のエンコーディングが適用されます。 ファイルを交換したり、インターネットからダウンロードしたりするときに、ファイルが作成されたエンコーディングがコンピューターで読み取れないことがよくあります。 この理由はさまざまです。ファイルを開くプログラムに必要なエンコーディングが欠落しているか、単にいくつかのプログラム コンポーネント (追加のフォント パッケージなど) が存在しないかのいずれかです。
以下では、さまざまなプログラムで読み取り不可能なファイルまたはドキュメントのエンコードを変更する方法を見ていきます。
Word 2010を例にエンコードを変更する手順を見てみましょう。
上記の手順でドキュメントが表示されない場合は、フォントを変更してみてください。 プログラムに適切なフォントがない場合、文書が「四角」またはその他の記号として表示されることがあります。
Excel 93-2004 および 2007 のエンコードを変更する手順を考えてみましょう。
記事をもっと読む
VKontakte Facebook オドノクラスニキ
すべてが新しいものへの移行とともに Windowsのバージョンロシア語の複数のエンコーディングの存在の問題の深刻さはほぼ解消されました
ブラウザ、テキスト エディタ、プロセッサを使用しているユーザーは、テキスト エンコーディングを変更する必要に直面することがよくあります。 ただし、Excel スプレッドシート プロセッサで作業する場合、このプログラムは数値だけでなくテキストも処理するため、このようなニーズが生じる場合もあります。 Excel でエンコードを変更する方法を見てみましょう。
テキスト エンコーディングは、ユーザー フレンドリーな文字に変換される一連の電子デジタル表現です。 エンコーディングには多くの種類があり、それぞれに独自のルールと言語があります。 特定の言語を認識し、それを平均的な人が理解できる文字 (文字、数字、その他の記号) に変換するプログラムの能力によって、アプリケーションが特定のテキストを処理できるかどうかが決まります。 一般的なテキスト エンコーディングの中で、次の点に注目してください。
姓は一種の世界標準と考えられているため、世界中のエンコーディングの中で最も一般的です。
ほとんどの場合、プログラム自体がエンコーディングを認識し、自動的にそれに切り替わりますが、場合によっては、ユーザーがそのタイプをアプリケーションに示す必要があります。 そうすることで初めて、エンコードされた文字を正しく処理できるようになります。
エンコーディングの解読に関する問題が最も多い Excelプログラム CSV ファイルを開こうとしたり、エクスポートしようとしたときに発生します txtファイル。 Excel でこれらのファイルを開くと、通常の文字ではなく、理解できない文字、いわゆる「krakozyabry」が表示されることがよくあります。 このような場合、プログラムがデータを正しく表示し始めるために、ユーザーは特定の操作を実行する必要があります。 この問題を解決するにはいくつかの方法があります。
残念ながら、Excel には、あらゆる種類のテキストのエンコードを迅速に変更できる本格的なツールがありません。 したがって、これらの目的のためには、複数段階のソリューションを使用するか、支援に頼る必要があります。 サードパーティのアプリケーション。 最も信頼できる方法の 1 つは、Notepad++ テキスト エディタを使用することです。
それでも この方法サードパーティの使用に基づいています ソフトウェア, これは、Excel でファイルの内容をトランスコードするための最も簡単なオプションの 1 つです。
さらに、プログラムの組み込みツール、つまりテキスト ウィザードを使用して変換を行うこともできます。 奇妙なことに、このツールの使用は、 サードパーティプログラム前の方法で説明しました。
逆に、データが正しく表示された状態でファイルを開く必要はないが、指定されたエンコードで保存される場合もあります。 このタスクは Excel で実行することもできます。
ドキュメントは、自分で定義したエンコーディングでハード ドライブまたはリムーバブル ストレージ デバイスに保存されます。 ただし、Excel に保存されたドキュメントは常にこのエンコードで保存されることを考慮する必要があります。 これを変更するには、もう一度ウィンドウに入る必要があります 「Webドキュメントオプション」そして設定を変更します。
保存されたテキストのエンコード設定を変更する別の方法もあります。
実際、この疑問は一見したほど簡単ではありません。 CSV 形式は、その名前が示すように、区切り文字としてカンマ (,) 文字を使用します。 ただし、多くのプログラムやサービスでは、他の文字の使用が許可されています。 MS Excel も、特にそのロシア語版について話している場合、そのように分類できます。 この記事では、CSV エクスポート ファイルを開く際の問題の解決策を提供したいと思います。 Googleツール MS Excel のウェブマスター向け。 ただし、このトピックは他のオプションにも関連します。
私たちの多くは使用しています Google ウェブマスター ツールサイトを追加する場合のみ。 これは間違っています、ここにはたくさんあります 役立つ情報たとえば、ユーザーがサイトを検索してアクセスするために使用する検索クエリのリストです。 レポートを参照してください。 検索トラフィック > 検索クエリ - まずリストから目的のサイトを選択します。
CSV 形式でデータをエクスポートし、Google スプレッドシートで開く機能もあります。 (Excel のオンライン類似物)。 「」を探してください。 この表をダウンロード」 ちなみに、ページに表示されるクエリの数は、エクスポートされたデータの完全性に影響しません。
問題は、CSV ファイルがカンマ区切り文字を使用し、UTF-8 でエンコードされていることです。 したがって、Google スプレッドシートでも、キリル文字ではなく、一連の質問しか表示されません。
つまり、エンコーディングを ANSI に変更する必要があります。 CSV ファイルを Excel で開くには、カンマ区切り文字 (,) をセミコロン文字 (;) に置き換えます。
最も簡単に解決できる エンコーディングの問題。 このためには、どれでも使用できます テキストエディタ Notepad++ などのこの機能を使用します。 公式ウェブサイトから無料でダウンロードできます。 unotepad-plus-plus.org。 次に、エディタを起動して CSV ファイルを開き、メニュー項目「」をクリックします。 エンコーディング" を選択し、目的のものに変更します。つまり、 段落「 ANSIに変換».
私の図は、その逆のプロセス、つまり ANSI から UTF-8 への変換を示しています。これはもうお気づきかと思いますが、原理は同じです。
さて、それについては カンマ区切り文字。 基本的に、Google スプレッドシートについては何も変更する必要はありません。 はい、これは MS Excel の英語版でも機能します。チェックしてください。 ただし、置換が必要な場合は、コンマ (,) をセミコロン文字 (;) に単純に置換するだけでは機能しないことを考慮する必要があります。 ファイル内にこの文字を含む値が存在する可能性があります。 通常は引用符で囲みます。 例えば:
値,1,"値、カンマ付き",
理論的には、自分で設定することがここで役立つはずです オペレーティング·システム Windows: [スタート] > [コントロール パネル] > [地域と言語のオプション]。 「フォーマット」タブで「」をクリックします。 この形式を変更します...開いたウィンドウの「数値」タブで、「」を置き換えます リスト要素の区切り文字» 目的のもの、つまり セミコロン記号 (;) をカンマ (,) に置き換えます。
確かに、私には効果がありませんでした。 そして、私にとって、オペレーティングシステムの設定を変更することは良いことではありません。 しかし、私はこの問題の解決策を示すことにしました。なぜなら... ほとんどの専門フォーラムがこれを参照しています。
残念ながら、いくつかは 追加処理 MS Excel では .csv 拡張子を持つファイルが見つかりませんでした。 ただし、ファイル拡張子を、たとえば .txt に変更した場合に限り、処理することは可能です。 そこで、ファイル拡張子を変更して Excel で開きます。
「テキストウィザード(インポート)」画面が表示されます。 ここでは、ソース データ形式、最初のインポート行、ファイル エンコーディングを選択できます。 (1251: キリル文字が必要です)。 ところで、ウィザードでエンコーディングが選択できるのに、なぜ変更する必要があったのでしょうか? によると、エンコーディングはUTF-8であるため、 少なくともここにはそれがありません。 ボタンをクリックしてください。 次».
次のステップでは、区切り文字を 1 つと複数選択できます。 チェックボックスをオンにします。 コンマ「」のチェックを外します タブ文字」 ここで行区切り文字を選択することもできます。 これは、特殊文字を含む値に使用されるものです (二重引用符、カンマ、セミコロン、 改行等。)。 オプション付き 二重引用符, 私の場合、これが必要なものです。 「データ解析のサンプル」フィールドに注目してください。データはテーブルになっています。 ボタンをクリックしてください。 次».
最後のステップでは、列データの形式を指定できますが、ここでは選択肢はあまりありません: 一般 (デフォルト)、テキスト、日付、列をスキップします。 私には最後のオプションが最も興味深いように思えます。なぜなら... 不要な列をすぐに除外できます。 適切な列を選択して「」をクリックするだけです。 列をスキップ」 ボタンをクリックしてください。 準備ができて».
Excel は必要な表を生成し、必要な列幅とセル形式を設定できますが、それはまったく別の話です。 同じパーセンテージを認識することに問題があることだけを指摘しておきます。
ただし、上記の問題はすべて簡単な方法で解決できます。 オンラインサービス正規化CSV。 エンコードと区切り文字を変更できます。 確かに、制限はありますが、 64 000 バイト (これはKBでいくらですか?)ダウンロード可能なファイルの場合は、CSV ファイルの重量は通常それほど大きくないため、十分なはずです。 処理結果は通常のテキスト ファイルとして出力され、.csv 拡張子を付けて保存できます。
ちなみに、スクリプトはパーセンテージ値を変換します。例: 95% - 希望の値 Excel の「パーセント」列の場合、つまり 100 で割ると、浮動小数点数が得られます (例: 0.95)。 他に変更が必要な場合は、改善を試みます。
提供されているオンライン サービスが合わない場合は、いつでも上記の手順を使用できます。
一部のオンライン サービスでは、データをシンプルで便利な CSV 形式でエクスポートする機能を提供しています。 名前が示すように、区切り文字としてカンマ (,) を使用します。 ただし、多くのアプリケーションはこの形式をある程度恣意的に解釈するため、当然の問題が発生します。 さらに、Excel や Google スプレッドシートでは ANSI が使用される一方で、UTF-8 エンコードの人気が高まっています。
たとえば、Notepad++ はエンコードに関する問題の解決に役立ちます。区切り文字に対処するには、ファイル拡張子を .txt に変更し、Excel のテキスト ウィザードを使用するだけです。 ただし、これらの問題はすべて無料のオンライン サービスで解決できます。 正規化CSVただし、ダウンロードされるファイルのサイズの制限を考慮する価値があります。 私が持っているのはそれだけです。 ご清聴ありがとうございました。 幸運を!
19:44に | メッセージを編集する | コメント16件 |
CSV ( カンマ区切りの値- カンマで区切られた値)は、 テキスト形式、表形式のデータを表示するように設計されています。 たとえば、ボリュームが十分に大きい場合、データをエクスポートするために使用されます。 ただし、作成された csv ファイルにロシア語のアルファベットの文字が表示されなかったり、文字が歪んだりする場合があるという問題がよく発生します。 ただし、この問題は簡単に解決できます。
問題の本質は次のとおりです。 ユーザーが実行している Excel のバージョンが英語ではない場合、データをエクスポートするために生成される CSV ファイルのエンコードが異なることが予想される場合があります。 つまり、使用されている Excel のバージョンが属する言語のエンコーディングです。 この場合、標準の ASCII セットに含まれていない文字が歪む可能性があります。
この問題は次の簡単な方法で解決できます。
1. Excelを起動します。
2. 「データ → テキストから」ページを開きます (ローカライズされた Excel では、メニュー項目の名前が異なる場合があります)。
3. CSV ファイルを開き、「テキスト ウィザード」ウィンドウで必要な区切り文字とエンコーディングを設定します (「UTF-8」を使用)。
ロシア語の Excel 2007 で同じ問題を解決する手順
1. Excelで新しいドキュメント(ワークブック)を作成します
2. 「データ / 外部データの取得」メニューから、「テキストからインポート」を選択します。 ファイル選択ウィンドウで、CSV ファイルを選択します。 Excel は自動的にテキスト ウィザード (インポート) を起動します。
3. 「ファイル形式」設定で、「Unicode (UTF-8)」を選択します。
5.「完了」ボタンをクリックします。 で 正しい選択をすることキリル文字が適切に表示されれば、エンコードの問題は発生しないはずです。
私たちのサイトは役に立ちましたか? |